概述深度学习语言模型词向量语言空间N-gram模型神经网络模型模型对比 概述 深度学习 语言模型 机器翻译 拼写纠错 智能问答 分词条件概率 存在问题 最后一个词出现的概率和前面所有的概率有关数据过于稀疏参数空间太大 词向量 单词映射值不仅是数,还要具备含义 实现相关联的词距离较近(同义词) 语言空间 语言向量与表现形式无关,仅与相互关系、逻辑环境有关 N-gram模型 即N-gram模型 N=1每个词仅和前面一个词相关N=2每个词仅和前面两个词相关(马尔可夫信源?) 实际中 神经网络模型 ProjectionLayer:投影层,实现将词首尾相接,拼接向量 模型对比 神经网络的特点 符合真实语言的逻辑