字节大模型算法岗面经简略版
1.项目介绍
2.在参数高效微调中,为什么优先微调 Attention 层的 Q/K/V/O,而不是 FFN 层?
3.RAG 和 GraphRAG 在处理多跳推理时的根本?
4.RAG 的整体流程
5.GraphRAG 系统整体流程
6.RoPE 为什么能实现相对位置编码?
7.Transformer 中因果注意力和双向注意力的区别
8.手撕代码题:最长连续递增子序列(LeetCode 674)
2.在参数高效微调中,为什么优先微调 Attention 层的 Q/K/V/O,而不是 FFN 层?
3.RAG 和 GraphRAG 在处理多跳推理时的根本?
4.RAG 的整体流程
5.GraphRAG 系统整体流程
6.RoPE 为什么能实现相对位置编码?
7.Transformer 中因果注意力和双向注意力的区别
8.手撕代码题:最长连续递增子序列(LeetCode 674)
全部评论
相关推荐
点赞 评论 收藏
分享
查看15道真题和解析