字节大模型算法岗面经简略版

1.项目介绍
2.在参数高效微调中,为什么优先微调 Attention 层的 Q/K/V/O,而不是 FFN 层?
3.RAG 和 GraphRAG 在处理多跳推理时的根本?
4.RAG 的整体流程
5.GraphRAG 系统整体流程
6.RoPE 为什么能实现相对位置编码?
7.Transformer 中因果注意力和双向注意力的区别
8.手撕代码题:最长连续递增子序列(LeetCode 674)
全部评论

相关推荐

评论
1
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务