首页 > 试题广场 >

以下哪种方法主要用于缓解大模型训练中的内存墙问题?

[单选题]
以下哪种方法主要用于缓解大模型训练中的内存墙问题?
  • 增加Batch Size提升数据并行效率
  • 使用ZeRO优化策略分片优化器状态
  • 采用更大的学习率加速收敛
  • 引入Dropout技术防止过拟合
“内存墙问题”(Memory Wall)在大模型训练中,指的是模型参数、梯度和优化器状态所需显存(或内存)超出硬件容量,成为训练瓶颈。
发表于 今天 09:03:07 回复(0)