分享一波攒了整个秋招的NLP算法岗面经

投的岗位比较杂,主要是NLP,也包括一些多模态、大模型、推荐相关的岗位,最终拿到了腾讯、顺丰、平安金服和迪子的offer,华子、京东和百度的池子。

总结一下,首先算法的问题会问得非常杂,主要根据你的项目经历,面试官一般会从你的经历里挑和他们工作内容比较相关的点提问,然后不断扩展;反而八股文问的不多,一般是一些中小厂喜欢问八股。

最后是自己的一点见解,对于非研究性质的算法岗位,论文的权重并没有很大(也看面试官的喜好),反而是相关的竞赛/实习经历会非常重要。有意找算法岗的uu,一定要去搜广推(可以再加一个大模型)相关的岗位刷刷实习经历。

以下是整个秋招的面经:

  1. 用语言介绍一下Transformer的整体流程
  2. 深度学习的三种并行方式:数据并行,模型并行,流水线并行
  3. Deepspeed分布式训练的了解,zero 0-3的了解。
  4. 对于CLIP的了解
  5. 说几种对比学习的损失函数,以及它们的特点和优缺点
  6. 说说大模型生成采样的几种方式,它们的特点和优缺点比较
  7. 损失函数中温度的作用
  8. BLIP的细节。(面试中提的问题是BLIP为什么将训练分成两个阶段)
  9. Visual Encoder有哪些常见的类型?
  10. 深度学习中常用的优化器有哪些?
  11. SimCSE的了解
  12. prenorm和postnorm
  13. LLaMA 2的创新/ChatGLM的创新点/Qwen的创新点/Baichuan的创新点
  14. LLM的评估方式有哪些?特点是什么?(中文的呢?)
  15. 文本生成模型中生成参数的作用(temperature,top p, top k,num beams)
  16. LoRA的作用和原理
  17. CoT的作用
  18. 神经网络经典的激活函数以及它们的优缺点
  19. softmax函数求导的推导
  20. BERT的参数量如何计算?
  21. AUC和ROC
  22. batch norm和layer norm
  23. 大模型训练的超参数设置
  24. 经典的词向量模型有哪些?
  25. InstructGPT三个阶段的训练过程,用语言描述出来(过程,损失函数)
  26. 大模型推理加速的方法
  27. Transformer中注意力的作用是什么
  28. RNN、CNN和Transformer的比较(复杂度,特点,适用范围etc)
  29. AC自动机
  30. 产生梯度消失问题的原因有哪些?
  31. 大模型的幻觉问题
  32. 大模型训练数据处理
  33. RLHF的计算细节
  34. 构建CoT样本的时候,怎么保证覆盖不同的场景?
  35. 召回的三个指标:Recall、NDCG、RMSE
  36. RoPE和ALiBi
  37. 交叉熵、NCE和InfoNCE的区别和联系
  38. 贝叶斯学派和概率学派的区别
  39. 一个文件的大小超过了主存容量,如何对这个文件进行排序?应该使用什么算法?
  40. Python中的线程、进程和协程
  41. python中的生成器和迭代器
#晒一晒我的offer##我的实习求职记录##23届找工作求助阵地#
全部评论
一个都看不懂,举报了
9 回复 分享
发布于 2023-11-15 20:37 江苏
md我科班想转搜推广,刚研一,编程基本不会,机器学习懂点,大佬你上面发的我一个看不懂,还有救吗
2 回复 分享
发布于 2023-11-18 19:53 浙江
问下佬,我现在的NLP实习就是不断换模型然后微调找最好的那个,没什么拿得出手的东西,面试深挖项目也会问这些吗?感觉你分享的这个面经不是八股,胜似八股工作深入下去这些理论知识都会用到吗?真心求问,万分感谢!!
1 回复 分享
发布于 2023-11-15 23:48 上海
m
点赞 回复 分享
发布于 2024-02-23 18:17 江苏
点赞 回复 分享
发布于 2024-01-30 16:15 北京
好难😅
点赞 回复 分享
发布于 2024-01-04 12:43 上海
可以私聊问问大佬sf nlp开的多少嘛?
点赞 回复 分享
发布于 2023-12-05 15:30 广东
码住,谢谢佬
点赞 回复 分享
发布于 2023-11-20 13:48 辽宁
点赞 回复 分享
发布于 2023-11-18 15:10 广东

相关推荐

1.实习介绍2.首先我们去新建一个单链表吧。单项链表对,你要先自己建一个单链表,然后呢,我们再写一个方法去,相当于你就是写一个方法是创建单链表,然后再写一个方法是反转单链表,然后你最后可以给一些测试用例,再 print 结果看看你这个反转的效果是怎么样。3.如果让你去设计测试用例,就是比如说这个代码是别人写的,对吧?然后它的功能就是反转单链表,那让你做一些用例设计,来看看这个代码存不存在一些小的 bug 你会涉及哪些用例?4. 你现在站在一个 Y 字形的岔路口,就像字母 Y 那样。在这个岔路口的交叉点,你和一个村民正好都站在那里,这个岔路有两条路,一条通向“真话村”,一条通向“假话村但你不知道哪边是哪边,比如左边可能是通往真话村,也可能是通往假话村。那这个村民,他肯定是来自其中一个村子,但你也不知道他到底是哪边来的。唯一知道的是,如果他来自真话村,他就只会说真话;如果他来自假话村,那他就只会说假话,也就是总说反的。现在你有一个机会,你可以问这个村民一个问题,他会给你一个回答。你只能问一次。你的任务就是,通过他的那个回答,判断哪条路才是去真话村的。5.MySQL数据库一般有慢查询是什么原因6.说一下熟悉的Linux命令7. 比如说线上出现一些偶发性的接口超时一般怎么样去定位或者复现这个问题。8. 有对 AI 有一些了解吗?比如说现在基本上还是有挺多,就智能化生成测试用例的一些方式,这个有了解吗?9. 比如说,假设我们现在还是做了一个服务端的用例设计,就比如说我们有一个 APP,它有一些金币充值吧,就是说白了,就是拿真实的人民币去买金币,然后金币可以在这个 APP 里进行一个生态的消费,我们这个金币充值接口的话入参有套餐 ID 你可以理解为有 abcd4种,比如说第一种100金币是十块钱200金币,比如说是18块这样的不同的一个套餐的选择,这是第一个参数,然后第二个参数你可以理解为是票据 ID,就是当你去购买了之后,你真的要把金币充值入库的话,一定是你的那个。想想有哪些重要的测试用例?
查看8道真题和解析
点赞 评论 收藏
分享
评论
49
350
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务