06-10 10:41 已编辑 University of Birmingham 产品经理发布于上海

关注

大模型/AI方向面试唠嗑素材（2）—关键技术+提示词撰写

大语言模型关键技术概览

规模扩展：早期的研究主要关注模型参数规模所带来的性能优势，最近的工作则是加大对于高质量数据的规模扩展。
数据工程：首先，需要对于数据进行全面的采集，拓宽高质量的数据来源；其次，需要对于收集到的数据进行精细的清洗，尽量提升用于大模型训练的数据质量；第三，需要设计有效的数据配比与数据课程，加强模型对于数据语义信息的利用效率。
高效预训练
能力激发：多种高级提示策略，包括上下文学习、思维链提示等，通过构建特殊的提示模板或者表述形式来提升大语言模型对于复杂任务的求解能力。
人类对齐：首先训练能够区分模型输出质量好坏的奖励模型，进而使用强化学习算法来指导语言模型输出行为的调整，让大语言模型能够生成符合人类预期的输出。
工具使用

一个好的提示词一般需要包括以下几部分内容

角色：定义大模型角色，使其输出更符合需求的答案
任务：定义任务，让大模型具体了解你想要完成的任务
工具：智能体拥有的工具，需要清晰定义应何时使用
要求：对任务的具体要求越具体，AI输出的答案就越符合预期
少样本示例：通过一个回答示例，让大模型自主学习，格式化大模型的输出
注意事项：在不断调试过程中，智能体输出效果不及预期时，需要在“注意事项”中强调正确的做法。此部分对于智能体调优十分重要，保持智能体输出的稳定性
工作流：要求大模型按照特定工作流程输出，适用于有固定流程的工作
输出语气：模仿各类角色的语气定制化输出
特定提示词：用于提升大模型的输出能力（一步步思考/······），规定大模型的输出格式（markdown，json等）

上述所有模块不一定每次提示词都需要，可以根据需求增加或减少。

#牛客AI配图神器#

下期更新《大语言模型的构建过程》，敬请期待~

#大模型##牛客激励计划##产品面经#

《大语言模型》阅读笔记文章被收录于专栏

紧跟时代潮流~

全部评论

推荐最新楼层

给我一个让你自豪的机会

合肥工业大学运营

mark

1 回复分享

发布于 09-16 11:06 安徽

勤劳的伊泽瑞尔求求offer

上海大学测试工程师

mark

1 回复分享

发布于 06-17 16:54 上海

牛客156606749号

蚌埠坦克学院产品经理

mark

1 回复分享

发布于 06-11 01:53 江苏

产品经理傅立叶

楼主

University of Birmingham 产品经理

mark

点赞回复分享

发布于 06-10 10:41 上海

12-19 22:04

武汉大学 Java

20251219【快手】面试算法真题（共1题）

题目1：合并区间

投递快手等公司9个岗位

点赞评论收藏

12-19 17:12

南京信息工程大学 Java

百度一面

本质上，我的消息密度回答不够，以及在linux方面确实我不太会他们这些命令，还需加强，又输了，哎。。。。。。3、用docker和本地进程的方式去启动一个组件（eg:Nginx），有什么区别呢4、docker是怎么实现和宿主机的隔离呢？5、说一下写dockerfile常用的命令吧6、底层常用的Linux命令说一下7、top以后输出的部分有个 0.8cpu这是什么意思8、怎么查看权限9、755是什么权限10、利用vim做替换（相当于idea 的 ctrl+H）11、Linux怎么硬盘挂载（用命令行）例如：插入一个U盘，然后把它的内容挂载到某一个目录下12、linux中怎么描述一个文件的权限呢13、...

百度求职进展汇总

点赞评论收藏

11-04 21:22

天津理工大学 Java

27届尝试实习

佬们给提点意见，12月份想找个日常实习

想干测开的tomca...：让我来压力你！！！：这份简历看着“技术词堆得满”，实则是“虚胖没干货”，槽点一抓一大把： 1. **项目描述是“技术名词报菜名”，没半分自己的实际价值** 不管是IntelliDoc还是人人探店，全是堆Redis、Elasticsearch、RAG这些时髦词，但你到底干了啥？“基于Redis Bitmap管理分片”是你写了核心逻辑还是只调用了API？“QPS提升至1500”是你独立压测优化的，还是团队成果你蹭着写？全程没“我负责XX模块”“解决了XX具体问题”，纯把技术文档里的术语扒下来凑字数，看着像“知道名词但没实际动手”的实习生抄的。 2. **短项目塞满超纲技术点，可信度直接***** IntelliDoc就干了5个月，又是RAG又是大模型流式响应又是RBAC权限，这堆活儿正经团队分工干都得小半年，你一个后端开发5个月能吃透这么多？明显是把能想到的技术全往里面塞，生怕别人知道你实际只做了个文件上传——这种“技术堆砌式造假”，面试官一眼就能看出水分。 3. **技能栏是“模糊词混子集合”，没半点硬核度** “熟悉HashMap底层”“了解JVM内存模型”——“熟悉”是能手写扩容逻辑？“了解”是能排查GC问题？全是模棱两可的词，既没对应项目里的实践，也没体现深度，等于白写；项目里用了Elasticsearch的KNN检索，技能栏里提都没提具体掌握程度，明显是“用过但不懂”的硬凑。 4. **教育背景和自我评价全是“无效信息垃圾”** GPA前10%这么好的牌，只列“Java程序设计”这种基础课，分布式、微服务这些后端核心课提都不提，白瞎了专业优势；自我评价那堆“积极认真、细心负责”，是从招聘网站抄的模板吧？没有任何和项目挂钩的具体事例，比如“解决过XX bug”“优化过XX性能”，纯废话，看完等于没看。总结：这简历是“技术名词缝合怪+自我感动式凑数”，看着像“背了后端技术栈名词的应届生”，实则没干货、没重点、没可信度——面试官扫30秒就会丢一边，因为连“你能干嘛”都没说清楚。

点赞评论收藏