Batch_Size
1、Btach_Size 是用于在每次迭代中训练模型的数据数量。一般的设置是:32、64、128、256、512.
2、选择正确的 Batch_Size 用于确保 cost function 和参数值的收敛,以及模型的泛化能力。
3、Batch_Szie 决定更新的频率。Batch_Szie 越小,更新就越快。
4、Batch 越大,梯度越精准。也就是说,在迭代计算的时候更容易跳过局部区域。
5、比较大的 Batch_Size,往往 GPU memory 是不够用的,就需要通过并行计算的方式解决。
为什么需要 Batch_Size 参数?
Batch_Size 的选择,首先决定的事梯度下降的方向。
批量梯度下降算法(Batch Gradient Descent):采用全数据集(Full Batch Learning)的形式,训练过程中将全量的训练数据输入神经网络,经过计算之后得到网络输