福大大架构师每日一题

02-24 09:44 北京动视元科技有限公司_产品中心_研发工程师

发布于四川

关注

lmdeploy v0.12.1 最新版本发布！全面支持glm-4.7-flash，优化Qwen3系

lmdeploy v0.12.1 最新版本发布！全面支持glm-4.7-flash，优化Qwen3系列模型与Transformers v5兼容性，稳定性与性能双提升！

🚀 新功能（Features）
在v0.12.1中，新增了几个关键功能：

• 支持glm-4.7-flash：新增对glm-4.7-flash模型的全面支持，为用户提供更高效的推理体验。
• Ascend平台支持EP：正式支持Ascend平台的EP运行模式，提升在华为昇腾硬件上的兼容和性能表现。
💥 改进（Improvements）
性能与兼容性方面进行了多项优化：

• 修复Transformers v5的rotary embedding兼容问题：有效解决了在新版transformers中旋转嵌入异常的问题，提升模型稳定性。
• 改进指标日志（metrics log）输出：优化指标记录与性能监控机制，使调试与性能评估更直观。
• 支持Qwen3模型量化配置中忽略特定层：进一步增强Qwen3模型的量化灵活性，方便开发者自定义量化策略。
• 新增自定义noaux kernel：提升系统可扩展性和内核处理能力。
• 修复Qwen3-VL与Transformers v5兼容问题：保证视觉语言模型在最新Transformers环境下的兼容与稳定运行。
🐞 Bug修复（Bug fixes）
本次版本修复了多个关键问题，有效提升系统的稳定性与可靠性：

• 修复工具调用解析器的流式游标问题。
• 解决TP模式下引导解码的并发竞争问题。
• 修复FA3检查逻辑。
• 修复时间序列预处理中出现的异常。
• 修复Attention算子中负KV序列长度错误。
• 修复Qwen3-VL-MOE模型在长上下文场景下的不稳定问题。
• 优化smooth quant逻辑，将量化后的norm移至CPU，避免旧q_linear引用问题。
• 更新noaux-kernel检查机制，提升内核稳定性。
🌐 其他更新（Other）
在系统环境与文档方面也进行了更新：

• 输入CUDA版本调整为12.6.2，适配最新CUDA环境，提高兼容性。
• 在llm_compressor.md中新增Qwen3-8B精度评估，为开发者提供更全面的参考指标。
• 重构CI测试用例，提升持续集成的稳定性与效率。
• 设置interns1_1为interns1_pro别名，简化模型调用配置。
• Docker构建优化：在使用CU13环境时自动跳过FA2组件，提高构建灵活性。
• 最后，版本号正式升级至v0.12.1。
#大模型# #福大大架构师每日一题#

全部评论

推荐最新楼层

02-20 20:09

门头沟学院单片机

25届毕业生二战考研大概率下岸求指导简历

考研大概率没戏了在网上找了两个项目正在学习 感觉不好的好多 每天都在疯狂补充知识求指导一下简历！欢迎来拷打我！

点赞评论收藏

分享

02-04 16:41

杭州电子科技大学大数据开发工程师

记一次对 Claude、GPT、Gemini、GLM、DeepSeek 真实评测

这是一个正在开发中的 Unity C# 项目。本次我进行测试的是一份需求案，我已经做了好预制体，而模型需要编写代码。这是一个皮肤系统的开发，主要需要实现皮肤界面 SkinUI 和皮肤属性界面 SkinAttrUI。但是我们项目有需求实现的规范，所以模型需要阅读已有的代码并遵循这些规范。界面大概是这样子的：这是我提交给模型的所有指令：可以说很多细节并未完全在需求案里讲清楚，如果不阅读项目代码那么很难完成任务。而且细节非常多，指令遵循不好的模型可能会遗漏很多细节的实现。环境统一使用 VSCode Copilot + Unify Chat Provider。统一使用 皮肤功能开发.md 文档。Kim...

AI Coding的使用...

点赞评论收藏

分享

01-28 21:25

电子科技大学中山学院全栈开发

考完研了感觉差不多压着线的分数，害怕进不去复试 各位帮我看一下简历能找到工作吗？考不上想直接就业了

点赞评论收藏

分享

昨天 16:39

正浩创新EcoFlow_海外销售(准入职员工)

正浩创新内推，正浩创新内推码

📦两个部分：上班感受+公司福利～ 上班感受：快节奏 体验感十足 ⭐️ 学习：每天时间很快也很累，感觉要学的要做的东西真的太多，我会不断的向内求，如果有问题我会及时记录然后及时询问前辈，作为刚入职小白，新知识根本学不完！抽空学！ ⭐️ 通勤：住在公司附近所以步行十分钟左右，早上9:30打卡 也可以十点（如果你前一天加班到十点）奈何早上床成了我的老家😭早上必须咖一杯 一月可以迟到60m很人性化 五次补卡哈哈哈 ⭐️ 两周感悟：高效办公！合理分配时间！任务清单明确！把更多的时间花在有意义的内容上！！！抽闲暇时间做一些赶进度工作！勇敢！ ⭐️ 部门氛围：同事和leader无敌好，来的第一周就请我们...

正浩创新EcoFlow公司福利 770人发布

点赞评论收藏

分享

02-23 22:58

南京师范大学泰州学院 golang

26届学院本这样的简历春招能拿到offer嘛

你的简历改到第几版了

点赞评论收藏

分享

评论

1

收藏

招聘动态

27届简历点评

27届寒假/转正实习汇总

全站热榜

更多

创作者周榜

更多

正在热议

更多

# xx岗简历求拷打 #

5094次浏览 55人参与

# 牛客租房专区 #

160641次浏览 1933人参与

# 有转正机会的小厂实习值得去吗？ #

6698次浏览 77人参与

# 掌握什么AI技能，会为你的求职大大加分 #

5132次浏览 221人参与

# 开工第一帖 #

16722次浏览 322人参与

# 携程求职进展汇总 #

884770次浏览 5809人参与

# 哪些公司开春招了？ #

33552次浏览 205人参与

# 金三银四，你有感觉到吗 #

692721次浏览 6088人参与

# 你最讨厌面试被问什么 #

7113次浏览 90人参与

# 找工作时的取与舍 #

122731次浏览 877人参与

# 秋招提前批，你开始投了吗 #

718085次浏览 8443人参与

# 应届生，你找到工作了吗 #

107624次浏览 626人参与

# 毕业季等于分手季吗 #

54950次浏览 654人参与

# 你学到的“最没用”的职场技能是 #

20276次浏览 154人参与

# 大家每天通勤多久？ #

90020次浏览 1006人参与

# 记录实习开销 #

191062次浏览 1141人参与

# 工作不开心辞职是唯一出路吗 #

8476次浏览 30人参与

# 如何缓解入职前的焦虑 #

262479次浏览 1469人参与

# 正在实习的你，几点下班 #

303815次浏览 2384人参与

# 实习要如何选择和准备？ #

144938次浏览 1565人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务