DeepSpeed v0.18.5 发布:PyTorch 2.9 适配、ZeRO-3 优化与多项关键
DeepSpeed v0.18.5 发布:PyTorch 2.9 适配、ZeRO-3 优化与多项关键修复全面升级!
🚀 功能与修复详情
✅ 系统与测试优化
• 更新版本号文件 version.txt(v0.18.4 → v0.18.5)。
• 增强在 Apple MPS 平台上的运行兼容性。
• 优化 GitHub Workflow 触发逻辑,新增测试超时限制。
• 删除过时的 V100 测试触发器,提升 CI 效率。
• 新增 完整测试套件工作流,确保功能覆盖更广。
✅ 代码结构与稳定性增强
• 删除 using namespace std. 语句,提升代码规范性。
• 修复多进程测试问题。
• 针对压缩 allreduce 操作添加空张量跳过逻辑。
• 优化引擎清理机制(engine cleanup),减少冗余资源占用。
• 修复 Ping-Pong 缓冲索引重置逻辑,移除多余的同步操作。
#大模型# #福大大架构师每日一题#
🚀 功能与修复详情
✅ 系统与测试优化
• 更新版本号文件 version.txt(v0.18.4 → v0.18.5)。
• 增强在 Apple MPS 平台上的运行兼容性。
• 优化 GitHub Workflow 触发逻辑,新增测试超时限制。
• 删除过时的 V100 测试触发器,提升 CI 效率。
• 新增 完整测试套件工作流,确保功能覆盖更广。
✅ 代码结构与稳定性增强
• 删除 using namespace std. 语句,提升代码规范性。
• 修复多进程测试问题。
• 针对压缩 allreduce 操作添加空张量跳过逻辑。
• 优化引擎清理机制(engine cleanup),减少冗余资源占用。
• 修复 Ping-Pong 缓冲索引重置逻辑,移除多余的同步操作。
#大模型# #福大大架构师每日一题#
全部评论
相关推荐
2025-12-15 11:27
门头沟学院 Java 点赞 评论 收藏
分享
