同花顺招聘

2024-09-11 22:48 已编辑同花顺_人力资源_校园招聘

发布于浙江

关注

算法工程师必刷「大模型高频面试题」

关于大模型的50道精选面试题

1.简述GPT和BERT的区别

2.讲一下GPT系列模型的是如何演进的?

3.为什么现在的大模型大多是decoder-only的架构?

4.讲一下生成式语言模型的工作机理

5.哪些因素会导致LLM中的偏见?

6.LLM中的因果语言建模与掩码语言建模有什么区别?

7.如何减轻LLM中的“幻觉”现象?

8.解释ChatGPT的“零样本”和“少样本”学习的概念

9.你了解大型语言模型中的哪些分词技术?

10.如何评估大语言模型(LLMs)的性能?

11.如何缓解LLMs复读机问题?

12.请简述下Transformer基本原理

13.为什么 Transformer的架构需要多头注意力机制?

14.为什么 transformers需要位置编码?

15.transformer中，同一个词可以有不同的注意力权重吗?

16.Wordpiece与BPE之间的区别是什么?

17.有哪些常见的优化LLMs输出的技术?

18.GPT-3拥有的1750亿参数，是怎么算出来的?

19.温度系数和top-p,top-k参数有什么区别?

20.为什么 transformer块使用LayerNorm而不是BatchNorm?

21.介绍一下post layer norm和pre layer norm的区别

22.什么是思维链(CoT)提示?

23.你觉得什么样的任务或领域适合用思维链提示?

24.你了解ReAct吗，它有什么优点?

25.解释一下langchain Agent的概念

26.langchain有哪些替代方案?

27.langchain token计数有什么问题?如何解决?

28.LLM预训练阶段有哪几个关键步驟?

29.RLHF模型为什么会表现比SFT更好?

30.参数高效的微调(PEFT)有哪些方法?

31.LORA微调相比于微调适配器或前缀微调有什么优势?

32.有了解过什么是稀疏微调吗?

33.训练后量化(PTQ)和量化感知训练(QAT)与什么区别?

34.LLMs中，量化权重和量化激活的区别是什么?

35.AWQ量化的步骤是什么?

36.介绍一下GPipe推理框架

37.矩阵乘法如何做张量并行?

38.请简述下PPO算法流程，它跟TRPO的区别是什么?

39.什么是检索增强生成(RAG)?

40.目前主流的中文向量模型有哪些?

41.为什么 LLM的知识更新很困难?

42.RAG和微调的区别是什么?

43.大模型一般评测方法及基准是什么?

44.什么是KV Cache技术，它具体是如何实现的?

45.DeepSpeed推理对算子融合做了哪些优化?

46.简述一下FlashAttention的原理

47.MHA,GQA,MQA三种注意力机制的区别是什么?

48.请介绍一下微软的ZeRO优化器

49.Paged Attention的原理是什么,解决了LLM中的什么问题?

50.什么是投机采样技术，请举例说明?

建议算法方向的同学，先收藏！面试前可以再根据题目自己梳理下回答的逻辑及亮点。

争取做到面试前心中不慌，面试时条理清晰！offer轻松握在手中～

目前同花顺算法招聘专场开启中

招聘对象：面向25届优秀的硕士、博士同学

招聘方向：NLP算法工程师、知识图谱算法工程师、算法工程师（图形/图像/视觉）、语音算法工程师、视频生成算法工程师、推荐算法工程师、搜索算法工程师、机器学习算法工程师、代码生成算法工程师

专场优势：我们拥有全方位的人才培养，配备丰富的前沿技术资源，用充足的计算资源自己去训练大模型把技术真正的用起来。有机会获得行业领先的百万级别薪酬，并进入同花顺国家级博士后工作站。

欢迎有兴趣的小伙伴通过同花顺招聘官网或小程序进行报名，岗位均可以内推哦～

#大模型##算法##算法面试经验分享##人工智能##面经#

全部评论

推荐最新楼层

offer来offer来offer来oi

门头沟学院算法工程师

点赞回复分享

发布于 2024-09-06 11:41 浙江

01-12 19:08

TCL科技集团股份有限公司_AI算法工程师(准入职员工)

智元机器人内推，智元机器人内推码

C++面经摘自优秀牛油先介绍了大概八分钟的科研项目然后开始拷打（有一些记不清了2333）C++部分：C++ 编译过程链接过程做了些什么智能指针介绍shared_ptr实现原理shared_ptr引用计数是原子性的吗怎么保证原子性的垃圾回收机制内存泄漏怎么排查内存泄漏排查工具的原理垃圾回收机制内存泄漏排查工具、垃圾回收机制、共享指针三个之间有什么关系stl map可以多线程同时写入吗stl里有容器是线程安全的吗int a,vector<int> b，同时作为函数参数，b存储在栈上还是堆上；操系统部分：协程和线程的区别协程切换的C++底层实现epoll\select\poll的区别为什...

点赞评论收藏

2025-12-24 22:55

已编辑

蚂蚁集团_蚂蚁数字科技_Agent应用(实习员工)

🐜蚂蚁日常实习面经（已oc

岗位：蚂蚁数字科技-智能研发工程一面（11.24 90min）：1、自我介绍2、深入讲一下你第一个项目，这个项目里面你设计的智能体的工作流程是怎么样子的？3、详细说一下里面的技术细节？跟模型的交互有哪些提示词，你是怎么设计的？这个过程中有哪些调优？4、你提到了会让模型结合提示词输出类似于json的结构，实际在和模型对接的过程中，有没有遇到模型幻觉问题，模型如果没有按照这层结构输出怎么解决？5、即使使用了few-shot也只是降低了幻觉概率，如果还是发生了，比如先输出了一段总结的话再输出json，有什么方法去兜住这种异常情况？6、有听说过上下文工程吗？你的项目里面有做一些上下文工程的优化吗？7、如果内容超出模型支持的token上限你会怎么解决？8、假如内容里面有不太友好的结构或者语句你会怎么转换变得对模型友好？9、在调用模型那些对话接口的时候，你有没有一些常用的超参数分享一下？10、温度有配置过吗？温度的高低对于模型输出会有怎么样的影响？11、详细介绍一下你的第二个项目12、有看过或者用过spring ai alibaba吗？13、看到你项目里支持对接mcp，讲一下你对mcp协议的了解14、有没有用过另外一个技术function call？讲讲mcp和function call的区别是什么？15、有了解过标准的rag请求分为哪几步吗？16、embedding之后有一个rerank步骤有了解过吗？17、讲一下你embedding所使用的模型18、展开讲一下你写的责任链与规则树的通用流程编排框架？是通过yaml或者json这种配置文件写还是java代码的形式？19、有用过langchain和langgraph吗？20、平时是怎么结合ai编程的，有用到哪些ai相关的产品？21、有用过gpt5的深度研究模式吗？这个深度研究模式跟平时的这种对话模式最大的区别是什么？22、讲一下spring框架的aop机制的原理是怎么样的，用来做一些什么功能23、多线程操作hashmap时会用到怎么样的一个类24、手撕：LRU25、反问二面（12.10 30min）：1、自我介绍2、聊背景以及学校合作相关的问题3、选一个项目介绍一下，中间遇到了什么问题？你是怎么解决的？4、为什么想要做agent开发？为什么选择spring ai？5、设计一个双向链表，描述数据结构6、头指针和尾指针有什么作用？如果现在只知道一个node节点，但是不知道头尾指针，怎么把这个节点从链表里面删除？7、我现在手里有100张卡片，上面写了1-1000的整数，设计一个数据结构记录100张卡片的数字。然后随机拿走两张剩下98张卡片，用一个最快的方式找到拿走的两个卡片上的数字是什么？8、问了些个人情况（实习时间、广州人为什么来杭州之类的...）9、反问，无手撕

发面经攒人品

点赞评论收藏

01-07 10:26

已编辑

东北农业大学 Java

langchain-基础

runnable 可运行单元 积木 串起来就是链 抽象概念，llm，提示词模板，工具调用，检索器，自定义函数，都可以抽象成runnable 通过管道符 | 将各组件串联起来，（python语义中是或运算符，通过运算符重载重写了该功能） # 自定义一个简单的类 class MyComponent: def __init__(self, name): self.name = name # 重载 | 运算符（定义__or__魔法方法） def __or__(self, other): # 自定义逻辑：返回两个组件的串联说明 return f"先执行{self.name}，再执行{other...

点赞评论收藏

01-05 10:55

门头沟学院 Java

广州小厂java开发实习技术面面经

自我介绍环节1.常用数据库用的哪个？主要是mysql2.mysql数据库引擎有了解过吗？现在mysql主要使用innodb引擎面试官补充：旧版本引擎主要用myisam3.mysql数据库旧版本的引擎和新版本的引擎对比（这个我真忘了😭）面试官：好4.redis和mysql区别redis内存，mysql写磁盘持久化…（再后面的我忘了说的啥了）5.agent开发有了解过吗6.ai开发了解过吗7.我们公司有了解过吗全程20分钟不到

查看7道真题和解析

点赞评论收藏

01-08 15:10

江南大学算法工程师

360 AIGC算法工程师–agent方向

一面 项目LoRAkvcache对工作有什么要求能不能提前实习全程45min 为什么我看其他佬都八九十分钟面试官没开摄像头，问项目也没问太细，八股也没咋问，是不是kpi啊铁子们就算不给正式offer也赏小的一份实习可以吗

查看5道真题和解析

点赞评论收藏

招聘动态

27届简历点评

27届寒假/转正实习汇总

全站热榜

创作者周榜

正在热议

# 为了减少AI幻觉，你注入过哪些设定？ #

2346次浏览 89人参与

# 12306一秒售罄，你抢到回家的票了吗？ #

# 你最满意的offer薪资是哪家公司？ #

69390次浏览 348人参与

# 论秋招对个人心气的改变 #

6720次浏览 115人参与

# 关于春招/暑期实习，你想知道哪些信息？ #