平安科技NLP大模型算法实习一面

项目方面:
1、SFT用的什么模型?如何进行的蒸馏微调?只用数据还是logits蒸馏?
2、LLM生成的数据如何直到是对的还是错的?如果没有金标准数据怎么办?
3、你觉得这个项目的亮点是什么?
4、智能体方面,ReAct架构具体是如何做的?规划智能体和生成SQL有没有交互?有的话如何防止一直迭代不结束?
5、如何预防用户使用特定任务智能体干别的?
八股方面:
八股先问了一个:二叉树的层序遍历用什么数据结构?
然后我有点突然懵,面试官就换了一个问题,介绍一个排序算法思想和逻辑,以及时间复杂度是什么。
无手撕
全部评论
但凡你想做模型训练相关的探索性工作咋回答的
点赞 回复 分享
发布于 昨天 23:09 湖南
无手撕的这个倒是挺爽的啊
点赞 回复 分享
发布于 02-01 17:39 陕西

相关推荐

评论
1
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务