字节大模型算法一面-实习面经 1h
1.拷打论文
2.transformer和llama的LN有什么区别,手写RMSNorm
3.FFN有什么不同,写Relu和SwiGLU
4.数据清洗流程
5.质量过滤用什么模型
6.PPL公式是什么
7.BERT的预训练任务、embedding
8.讲讲位置编码
9.你认为好的prompt的范式是什么
10.开放性问题:端到端的大模型和多个小模型,各自的优缺点是什么
11.手撕:两道
2.transformer和llama的LN有什么区别,手写RMSNorm
3.FFN有什么不同,写Relu和SwiGLU
4.数据清洗流程
5.质量过滤用什么模型
6.PPL公式是什么
7.BERT的预训练任务、embedding
8.讲讲位置编码
9.你认为好的prompt的范式是什么
10.开放性问题:端到端的大模型和多个小模型,各自的优缺点是什么
11.手撕:两道
全部评论
相关推荐
点赞 评论 收藏
分享
点赞 评论 收藏
分享
点赞 评论 收藏
分享