首页 > 试题广场 >

在处理一个无法完全加载到内存中的海量数据集来训练深度神经网络

[单选题]
在处理一个无法完全加载到内存中的海量数据集来训练深度神经网络时,你观察到损失函数在每个 epoch 之间有剧烈波动。综合考虑效率和收敛稳定性,下列哪种优化算法是此场景下最常用且有效的选择?
  • 批量梯度下降 (Batch Gradient Descent)
  • 随机梯度下降 (Stochastic Gradient Descent)
  • Adam 优化器
  • 牛顿法 (Newton's Method)

这道题你会答吗?花几分钟告诉大家答案吧!