百度后端二面面经

1. 你的 Agent 系统Prompt 是怎么设计和迭代的?有没有做过 Prompt 自动优化?当用户提出不完整的请求时,如何补全用户意图的?

2. 构建 Agent 的时候,遇到过哪些瓶颈?LangChain 的 memory 默认机制在多用户并发中怎么做隔离?你是如何保证线程安全的?

3. 微调 Llama2 你是怎么选择训练样本的?清洗逻辑是什么?你有没有观察到哪些训练样本质量问题对模型行为有很大影响?举例说明。

4. DPO相比 SFT,有哪些优劣?它在 Agent 任务上效果提升明显吗?你怎么构造偏好对?构造逻辑是自动的还是人工?

5. 你说你服务部署在 vLLM 上,为何选择它?KV-cache 如何帮助推理加速?你自己做过哪些优化?

6. 假如需要支持 Streaming 输出,但当前服务延迟又超标,你会怎么折中设计?

7. 多轮对话上下文状态管理是如何做的?如何在高并发场景下保证一致性?

8. 你做的 Agent 使用了多少个外部工具,在调用链条上如何保障故障容错和超时机制?

追问:有没有做过工具调用失败后的feedback策略设计?

9. 训练过程中数据来自用户行为日志,你是如何从这些数据中抽取训练对话的?有没有做过归一化或事件抽象?

10. 有没有了解过带有时间窗口/偏移限制的对话系统?模型怎么“理解时间”?

11. 你觉得 Agent 哪些模块最容易在真实业务中出问题?你会如何监控和定位的?

#发面经攒人品#
全部评论
好细的面经啊
点赞 回复 分享
发布于 11-13 19:58 北京
问得好细啊,感觉实力开发都不怎么用得到
点赞 回复 分享
发布于 10-16 20:59 河北

相关推荐

常规问题: 1. 3分钟简单自我介绍2. 在实习和开源经历中,你遇到的最大困难或最具挑战性的事情是什么?实习拷打(拓展相应的场景八股)慢 sql 治理相关的1. 你在平台稳定性建设中提到通过添加索引、读写分离优化慢SQL,具体是怎么做的?2. 读写分离可以再详细说一下吗3. 能否举一个添加索引的具体例子?比如在哪个字段上加了什么类型的索引?4. 你加的是单列索引,如果查询只需要表中的几个字段,当前的单列索引是否有优化空间?5. 联合索引相比单列索引的优势是什么?为什么更优?(从回表,索引下推优化那个方向说就好)es 慢查治理相关1. 关于ES扩容主分片优化查询,具体是怎么做的?2. 系统的ES集群资源配置你了解吗?(如CPU、节点数等)3. 扩容分片数量是如何确定的?仅依据数据量吗?4. 分片切割后为什么查询会变快(并行查询)5. 将 long 类型字段转为keyword类型,是如何利用跳表结构的?这里其实并不能,只是切换是为了适应精准匹配的场景,keyword 的底层用的是倒排索引+跳表6. 除了分片扩容和类型转换,还有哪些方式可以优化ES慢查询?(force merge 整理碎片)分布式锁(业务中有个并发修改用到了,主要问的一些分布式锁的实现细节)1. 你在业务中使用的分布式锁是标准库还是自研的?2. 让你自己实现一个最简单的分布式锁,你会怎么实现?3. 如果任务加锁后异常退出,没有释放锁,如何避免死锁?4. 如果任务执行时间很长,锁过期被其他任务获取,原任务完成后误删了别人的锁,如何解决(防止锁的误释放,加标识)5. 如果任务A包含多个子任务,且子任务本身也有加锁逻辑,在嵌套调用时会因重复加锁失败,如何解决?(可重入锁的实现)6. 在秒杀场景下,能否直接用分布式锁控制库存扣减?会有什么问题?7. 如何让秒杀请求不立即失败?(锁的自旋)并发编程1. 你使用CompletableFuture并发查询多个维度,底层是如何实现并发的?2. 你是自己定义线程池,还是使用默认线程池?3. 你是基于什么依据设置线程池参数的?4. 如果一个任务同时包含CPU密集型和I/O密集型操作,共用一个线程池会有什么问题?应该如何设计?(线程池隔离,避免cpu密集型任务阻塞I/O密集型任务)Agent和开源相关的内容1. 你的基座模型切换(DeepSeek → 千问)后,响应是流式还是非流式?2. 为什么关注完整响应时间,而不是首字响应时间?(主要是业务上的一个需要)3. 你的性能优化目标是在保证输出内容不变的前提下缩短生成时间吗?4. 你在Agent框架中使用了责任链模式和观察者模式,请分别解释这两种模式5. 既然有四个固定执行步骤(Agent执行前,执行后,模型执行前,执行后),是否可以用模板方法模式替代责任链模式?6. 你使用观察者模式的具体场景是什么?为什么选择它?7. 你还了解哪些常用设计模式?8. 你提到使用HNSW算法进行向量搜索,能简述其基本原理吗?(避免全表的向量查询)9. 为什么不直接用余弦相似度做全量匹配,而要引入HNSW?10. 你是否使用过BM25算法?它的作用是什么?11. 向量搜索有哪些弊端?12. 向量检索和BM25全文检索的得分量纲不同,如何进行混合排序?(引入一个精排模型重新打分)反问:1. 业务(智能客服相关)2. 不足,基础还需要加强无手撕,总体一个小时总结:面试体验很好,主要就是根据简历延伸一些八股和简单场景,有些还需要加强的地方,挖出来了自己基础上的一些问题
点赞 评论 收藏
分享
12-11 13:53
已编辑
门头沟学院 Java
10:20左右开始HR面:15min左右1. 问:请说明您目前就读的学校和专业背景,以及入学方式。2. 问:您是通过异地高考进入学校的吗?当时是以什么分数线录取的?3. 问:您在校期间的专业排名情况如何?是否有参与社团或学生会组织?4. 问:您参与的社团活动是否与您的专业相关?5. 问:您在该社团中具体参与了哪些开发工作?是否有其他兴趣爱好?6. 问:您在上一段的实习经历是什么时候开始的?是否已经结束?7. 问:您在实习期间承担了哪些工作内容?公司规模如何?8. 问:您未来的职业规划和学业规划是什么?9. 问:您是否了解我们公司主要从事的政府项目开发?是否能够接受这类工作内容?10. 问:我们公司的实习岗位转正机会和薪资待遇如何?您能否全勤到岗?11. 问:您目前的居住地点距离公司有多远?12. 问:我简单说明我们公司的规模和业务分布情况。如果面试通过,您预计何时可以到岗?13. 问:我简单介绍我们公司的试用期考核制度。您还有什么想了解的?技术面 40min左右1. 问:在线考试系统是您独立完成的吗?2. 问:这个考试系统的使用对象是谁?3. 问:您在项目中使用的Coze平台主要功能是什么?4. 问:Coze平台是否构建了知识库?集成方式是什么?5. 问:Coze平台的权限管理是如何实现的?6. 问:请说明拦截器、过滤器和Spring AOP的执行顺序。7. 问:智能电子月报是用Python开发的吗?8. 问:项目中使用了哪个大模型?9. 问:项目中是否构建了知识库体系?10. 问:PDF解析入库的具体实现方式是什么?11. 问:PDF解析是否使用了MCP技术?12. 问:大模型在项目中具体发挥了什么作用?13. 问:解析后的PDF数据存储在哪里?如何被大模型调用?14. 问:您在学校主修和选修了哪些课程?15. 问:您对Java AI应用开发体系的熟悉程度如何?16. 问:您了解哪些好用的Embedding技术?17. 问:您使用的Embedding模型具体是哪个?部署方式是怎样的?18. 问:您的大模型和Embedding模型都是本地化部署的吗?19. 问:您使用的云服务器是哪家厂商的?20. 问:模型部署的具体技术方案是什么?知识库是如何构建的?21. 问:您是通过爬虫获取的数据吗?获取的是网页数据还是文件数据?22. 问:您使用的Spring Boot版本是什么?23. 问:您对Spring AI和LangChain的结合了解程度如何?24. 问:Java集合框架包含哪些主要接口和类?25. 问:Map接口的实现类有哪些?它们是有序还是无序的?26. 问:List接口的实现类有哪些?它们是有序还是无序的?27. 问:您了解哪些关系型数据库?28. 问:您对数据库的使用经验如何?29. 面试官介绍:公司主要使用到的国产数据库和技术栈30. 问:MyBatis和MyBatis-Plus的区别和优缺点是什么?31. 问:如何使用MyBatis-Plus实现数据脱敏?32. 问:请说明线程的生命周期。33. 问:RESTful风格接口的参数接收方式有哪些?34. 问:POST接口的参数接收形式有哪些?35. 问:Spring MVC中常用的参数接收注解有哪些?它们的区别是什么?36. 问:@Controller和@RestController有什么区别?37. 问:@RestController等同于@Controller加什么注解?38. 问:Spring中的依赖注入方式有哪些?39. 问:@Autowired和@Resource注解的区别是什么?反问:问:我们公司在AI开发方面的具体应用场景是什么?答:做AI应用相关,在向这块转型,包括知识库、智能问述、MCP工具调用相关的等等问:实习生主要的工作内容是什么?是否会涉及前端开发?答:Java后端接口开发,辅助项目模块开发,不涉及前端
点赞 评论 收藏
分享
评论
1
13
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务