例子

考虑文本续写:

  • _
  • _饿了。
  • _饿了,我可以吃半头猪

不同长度的上下文范围重要性是相同的
RNN只看过去,在填空的时候我们也看未来

隐马尔可夫模型中的动态规划

有助于我们思考为什么要使用深度学习, 以及为什么要选择特定的架构。

隐马尔可夫模型

image.png

双向模型

一个前向RNN 隐层
一个后向RNN隐藏
合并隐状态得到输出
image.png
实现方式:
后向:把输入反向传递到正常计算的框架
再把输出反向就是对应的后向结果

定义

image.png

模型的计算代价及其应用

image.png
关键特性:
双向循环神经网络的一个关键特性是:使用来自序列两端的信息来估计输出
如果没有未来信息,不能预测下一个词
主要作用是对句子作特征提取