备战春招之商汤大模型一面

token 怎么 tokenizer ,怎么embedding的

词表是怎么训练的?

tokenizer是怎么tokenizer的?

添加新的token怎么加,怎么训练呢,词表会偏移吗?

llava的数据的输入输出是啥样的,整个数据的流程

GRPO有没有遇到什么问题,怎么解决

领域SFT数据损害模型的通用性能吗,怎么解决。1、加通用数据 2、model merge

怎么merge,怎么加通用数据?

手写ViT MHA

多头是怎么切分的?

手撕矩阵孤独岛屿,DFS

反问

全部评论

相关推荐

01-27 15:41
门头沟学院 Java
想躺平的菜鸡1枚:我项目比你难、学历比你好、还有SCI论文,投java都被拒一大片,现在基本上都要问点agent开发
软件开发投递记录
点赞 评论 收藏
分享
2025-12-13 14:51
已编辑
井冈山大学 算法工程师
龙虾x:算法比你强的没有你美,比你美的…..算了已经没有比你美的了
工作两年想退休了
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务