备战春招之商汤大模型一面

token 怎么 tokenizer ,怎么embedding的

词表是怎么训练的?

tokenizer是怎么tokenizer的?

添加新的token怎么加,怎么训练呢,词表会偏移吗?

llava的数据的输入输出是啥样的,整个数据的流程

GRPO有没有遇到什么问题,怎么解决

领域SFT数据损害模型的通用性能吗,怎么解决。1、加通用数据 2、model merge

怎么merge,怎么加通用数据?

手写ViT MHA

多头是怎么切分的?

手撕矩阵孤独岛屿,DFS

反问

全部评论

相关推荐

10-31 20:07
门头沟学院 Java
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务