大模型/AI方向面试唠嗑素材(2)—关键技术+提示词撰写

大语言模型关键技术概览

  • 规模扩展:早期的研究主要关注模型参数规模所带来的性能优势,最近的工作则是加大对于高质量数据的规模扩展。
  • 数据工程:首先,需要对于数据进行全面的采集,拓宽高质量的数据来源;其次,需要对于收集到的数据进行精细的清洗,尽量提升用于大模型训练的数据质量;第三,需要设计有效的数据配比与数据课程,加强模型对于数据语义信息的利用效率。
  • 高效预训练
  • 能力激发:多种高级提示策略,包括上下文学习、思维链提示等,通过构建特殊的提示模板或者表述形式来提升大语言模型对于复杂任务的求解能力。
  • 人类对齐:首先训练能够区分模型输出质量好坏的奖励模型,进而使用强化学习算法来指导语言模型输出行为的调整,让大语言模型能够生成符合人类预期的输出。
  • 工具使用

一个好的提示词一般需要包括以下几部分内容

  • 角色:定义大模型角色,使其输出更符合需求的答案
  • 任务:定义任务,让大模型具体了解你想要完成的任务
  • 工具:智能体拥有的工具,需要清晰定义应何时使用
  • 要求:对任务的具体要求越具体,AI输出的答案就越符合预期
  • 少样本示例:通过一个回答示例,让大模型自主学习,格式化大模型的输出
  • 注意事项:在不断调试过程中,智能体输出效果不及预期时,需要在“注意事项”中强调正确的做法。此部分对于智能体调优十分重要,保持智能体输出的稳定性
  • 工作流:要求大模型按照特定工作流程输出,适用于有固定流程的工作
  • 输出语气:模仿各类角色的语气定制化输出
  • 特定提示词:用于提升大模型的输出能力(一步步思考/······),规定大模型的输出格式(markdown,json等)

上述所有模块不一定每次提示词都需要,可以根据需求增加或减少。

#牛客AI配图神器#

下期更新《大语言模型的构建过程》,敬请期待~

#大模型##牛客激励计划##产品面经#
《大语言模型》阅读笔记 文章被收录于专栏

紧跟时代潮流~

全部评论
mark
1 回复 分享
发布于 09-16 11:06 安徽
mark
1 回复 分享
发布于 06-17 16:54 上海
mark
1 回复 分享
发布于 06-11 01:53 江苏
mark
点赞 回复 分享
发布于 06-10 10:41 上海

相关推荐

12-19 22:04
武汉大学 Java
点赞 评论 收藏
分享
想干测开的tomca...:让我来压力你!!!: 这份简历看着“技术词堆得满”,实则是“虚胖没干货”,槽点一抓一大把: 1. **项目描述是“技术名词报菜名”,没半分自己的实际价值** 不管是IntelliDoc还是人人探店,全是堆Redis、Elasticsearch、RAG这些时髦词,但你到底干了啥?“基于Redis Bitmap管理分片”是你写了核心逻辑还是只调用了API?“QPS提升至1500”是你独立压测优化的,还是团队成果你蹭着写?全程没“我负责XX模块”“解决了XX具体问题”,纯把技术文档里的术语扒下来凑字数,看着像“知道名词但没实际动手”的实习生抄的。 2. **短项目塞满超纲技术点,可信度直接***** IntelliDoc就干了5个月,又是RAG又是大模型流式响应又是RBAC权限,这堆活儿正经团队分工干都得小半年,你一个后端开发5个月能吃透这么多?明显是把能想到的技术全往里面塞,生怕别人知道你实际只做了个文件上传——这种“技术堆砌式造假”,面试官一眼就能看出水分。 3. **技能栏是“模糊词混子集合”,没半点硬核度** “熟悉HashMap底层”“了解JVM内存模型”——“熟悉”是能手写扩容逻辑?“了解”是能排查GC问题?全是模棱两可的词,既没对应项目里的实践,也没体现深度,等于白写;项目里用了Elasticsearch的KNN检索,技能栏里提都没提具体掌握程度,明显是“用过但不懂”的硬凑。 4. **教育背景和自我评价全是“无效信息垃圾”** GPA前10%这么好的牌,只列“Java程序设计”这种基础课,分布式、微服务这些后端核心课提都不提,白瞎了专业优势;自我评价那堆“积极认真、细心负责”,是从招聘网站抄的模板吧?没有任何和项目挂钩的具体事例,比如“解决过XX bug”“优化过XX性能”,纯废话,看完等于没看。 总结:这简历是“技术名词缝合怪+自我感动式凑数”,看着像“背了后端技术栈名词的应届生”,实则没干货、没重点、没可信度——面试官扫30秒就会丢一边,因为连“你能干嘛”都没说清楚。
点赞 评论 收藏
分享
评论
2
7
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务