seq2seq
seq2seq 模型就像一个翻译模型,输入是一个序列(比如一个英文句子),输出也是一个序列(比如该英文句子所对应的法文翻译)
这种结构最重要的地方在于输入序列和输出序列的长度是可变的。
. 基础
http://blog.csdn.net/jerr__y/article/details/53749693
- seq2seq 模型就像一个翻译模型,输入是一个序列(比如一个英文句子),输出也是一个序列(比如该英文句子所对应的法文翻译)。这种结构最重要的地方在于输入序列和输出序列的长度是可变的。
在机器翻译:输入(hello) -> 输出 (你好)。输入是1个英文单词,输出为2个汉字。
在对话机器中:我们提(输入)一个问题,机器会自动生成(输出)回答。这里的输入和输出显然是长度没有确定的序列(sequences).
* 输入,输出的结构发生了变化
* 结构
- 即Encoder、Decoder以及连接两者的中间状态向量
Encoder通过学习输入,将其编码成一个固定大小的状态向量S,继而将S传给Decoder,Decoder再通过对状态向量S的学习来进行输出。
Encoder,Decoder,以及连接两者的固定大小的State Vector。