阿里大模型算法二面-实习面经
1. 目前多模态大语言模型是如何融合文本与图像信息的?
2. 大语言模型的RLHF训练流程是什么?它存在哪些潜在风险?
3. 什么是Embedding?词嵌入和句嵌入有何不同?
4. 大语言模型中的Tokenization是如何工作的?不同模型的分词算法有何差异?
5. 对比大语言模型的增量推理和传统推理方式,增量推理的优势和实现难点是什么?
6. 介绍一下大语言模型中的知识蒸馏,它如何用于压缩模型体积?
7. 过往项目(细节追问)
8. 大语言模型的长文本处理能力有限,目前有哪些技术可以缓解这一问题?
9. 什么是大语言模型的“上下文窗口”?扩展上下文窗口对模型性能有何影响?
2. 大语言模型的RLHF训练流程是什么?它存在哪些潜在风险?
3. 什么是Embedding?词嵌入和句嵌入有何不同?
4. 大语言模型中的Tokenization是如何工作的?不同模型的分词算法有何差异?
5. 对比大语言模型的增量推理和传统推理方式,增量推理的优势和实现难点是什么?
6. 介绍一下大语言模型中的知识蒸馏,它如何用于压缩模型体积?
7. 过往项目(细节追问)
8. 大语言模型的长文本处理能力有限,目前有哪些技术可以缓解这一问题?
9. 什么是大语言模型的“上下文窗口”?扩展上下文窗口对模型性能有何影响?
全部评论
相关推荐
查看15道真题和解析 点赞 评论 收藏
分享
点赞 评论 收藏
分享