初创小厂算法面经

小厂1:大模型算法偏agent应用(12.11)

说什么和某六小龙有战略合作,所以面试官是某六小龙的
主要是问简历项目
1.训练数据,有没有做数据处理与增强的工作
2.词表怎么训练的
3.量化的结果是什么
4.在什么机器上训练,时间,数据量大小
5.rag中怎么做的pdf解析,对pdf里面的图片,表格数据怎么处理的,怎么编码的,检索,召回的时候都做了哪些操作,混合检索的时候的权重怎么处理的,有没有消融实现对比
6为什么要sft,sft的数据有多少,sft后的效果有没有对比
7.sft与rag对比
8.grpo和dpo对比
9.agent方面有哪些了解
反问,目前在做什么业务
下午面完晚上约二面

某初创公司:大模型算法基座模型(12.12)
1.你导师是谁(绷不住了)
2.有没有考虑过词表的大小对模型表现的影响
3.最影响模型效果的是哪个部分
4.文本编码器用的什么,有没有尝试过更新的方法
5.有没有对模块这部分设计消融实验评估对性能的影响
6讲一下dpo,ppo,grpo的区别
7.介绍了一下他们公司主要做的一个东西,问我对这方面有什么了解
8.一个力扣easy
反问,如果我来会加入到哪个部分

全部评论

相关推荐

12-12 09:10
门头沟学院 Java
一面: 1. 自我介绍2. 介绍两个项目中感觉比较有技术含量的点(防止超额报名,还有滑动窗口限流)3. 活动报名场景,如果一天有几万个人报名怎么办,一小时几万人呢,可能想问redis的大key问题4. redis单线程为啥性能好,引出了IO多路复用模型的select、poll、epoll,为什么zset用跳表不用B+树或B树,跳表为啥性能好,追问为啥单线程而不是多线程5. 假设想做一个排行榜,一个按分数排序,如果分数相同了按照报名时间排序,1万个数据里面想要找到top10应该怎么设计6. redis有哪些数据类型,然后redis 的 List 类型做一个队列应该怎么做呢7. zset里面存报名数据应不应该清除,什么时候清呢?8. zSet与MySQL之间通过RocketMQ发数据,RocketMQ有持久化机制和重试机制,为什么还要有对账机制9. InnoDB有个AB联合索引,有个查询语句select B from 这个表 where A = 1,走不走索引,回不回表,你觉得一定会走索引吗10. 还是AB联合索引,update A = 100 where B = 100,这条语句有没有什么问题?11. 如果有个AService、里面有个方法A,方法B都有@Transactional注解,C需要引用A和B方法,事务会不会失效?12. CAS 相对于直接加锁有什么好处?13. 策略模式和状态模式最大的区别什么?14. 接口是个抽象,咱们在使用接口的时候都需要自己写个实现类去实现接口,然后重写调用实现类才能执行逻辑,Mybatis为啥只有Mapper接口和XML就可以而不用写具体实现类的逻辑?15. 为啥用了RocketMQ而不是Kafka16. 怎么保证RocketMQ不丢失消息17. 假设现在有个线程池,核心线程数 2个,最大线程数100,阻塞队列100,来了100个任务,每个任务执行时间1s,多长时间执行完(50秒),那200个任务呢18. 力扣92的反转链表II(10分钟没写完)二面(主管面):1.自我介绍2.项目中认为的难点3.项目做的背景是啥 为啥要做这个项目4.最近学了什么5.了不了解大模型,Spring AI之类的6. 兴趣爱好 最有成就感的事 能体现最有毅力的事是啥之类的
查看28道真题和解析
点赞 评论 收藏
分享
评论
2
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务