字节大模型算法一面-实习面经 1h

1.拷打论文
2.transformer和llama的LN有什么区别,手写RMSNorm
3.FFN有什么不同,写Relu和SwiGLU
4.数据清洗流程
5.质量过滤用什么模型
6.PPL公式是什么
7.BERT的预训练任务、embedding
8.讲讲位置编码
9.你认为好的prompt的范式是什么
10.开放性问题:端到端的大模型和多个小模型,各自的优缺点是什么
11.手撕:两道
全部评论

相关推荐

评论
1
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务