python自然语言处理—Teacher Forcing

科技2026-06-21 29

RNN 在训练过程中的问题

训练迭代过程早期的 RNN 预测能力非常弱，几乎不能给出好的生成结果。如果某一个 unit 产生了垃圾结果，必然会影响后面一片 unit 的学习。Teacher Forcing 最初的 motivation(动机) 就是解决这个问题的。

RNN 的两种训练模式

1、free-running mode：训练过程中的每个时刻，使用上一个 state 的输出作为下一个 state 的输入。

2、teacher-forcing mode：一种快速有效地训练神经网络的方法，该模型使用来自先验时间步长的输出作为输入。

什么是 Teacher Forcing?

以 Seq2Seq 为例，在训练过程中，时刻 Decoder 的输入为 "<SOS>"，输出可能并不是正确的结果 "the"，假如输出了了一个错误的结果 "like"。这时，到了时刻，应该

Processed: 0.008, SQL: 9