什么部门呀佬
点赞 1

相关推荐

ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。团队介绍:字节跳动商业信任与安全算法团队聚焦于通过 AI 技术(包括但不限于大模型 / Agent / 多模态等)识别治理问题广告内容与广告主,助力降低虚假宣传、不良暗示等内容发生概率,提升广告质量。该方向也是行业共同关注、长期研究的方向,在这里你可以基于平台能力及内容,深耕算法优化,为商业化各业务(广告、电商、本地生活等)提供安全解决方案。团队在 Agent 领域深耕技术及其在新一代智能化审核系统中的落地与创新。岗位职责1. 搭建风险感知、风险研判、审核策略优化等智能体能力,支持交互类智能体训练2. 参与审核链路的完全自主进化体系构建3. 跟踪 Agent 前沿技术并进行可行性验证(如Perference-based RL、多智能体协作、DeepResearch、数据和模型的scaling、轻量化模型新RL范式),支持数据基建和模型infra的基建工作,并在商业化安全场景中验证落地岗位要求1. 27届硕士或博士在读,计算机、电子信息或相关专业;2. 有扎实的代码能力、数据结构和基础算法功底,熟练掌握C/C++或Python编程语言;3. 熟悉机器学习和大模型基础原理,有大模型预训练、微调、强化学习、Agent搭建经验者优先;4. 在ACM/ICPC、Top Coder、Kaggle等比赛中有优异的表现和获奖经历者优先;5. 在大模型/Agent领域主导过重大影响力项目,或发表过顶会顶刊论文者优先;6. 出色的问题分析和解决能力,能够独立解决复杂的技术问题;7. 良好的沟通协作能力,能够与团队紧密合作,共同推进项目进展。base北京/上海。感兴趣请发送简历到hantao.zhang@bytedance.com,或投递到 https://job.toutiao.com/s/eZgZS9P7e24
点赞 评论 收藏
分享
严重性定义 产品场景下幻觉的容忍度,接受多少成本来解决评估和检测●业务角度:进行人工评估,比如标100条Case,从体感上感知主要问题●自动化评估:在垂直领域,构造数据集,利用LLM进行知识检索判断幻觉幻觉分类大致分为与真实世界信息不一致的事实性幻觉(包括编造事件、信息过时等)、与输入的上下文不一致的忠实型幻觉。需要不同的缓解措施幻觉如何缓解?调API的话1.首先是Prompt调优。比如输入更详细的任务指令、调优的过程中不断根据输出的Bad Case加入限制。比如COT。2.然后是上下文优化,这里指的可以是RAG的召回信息优化,也可以是特定场景的上下文处理优化,突出其重点部分更容易被大模型理解。3.还可以基于Agent思想,将其问题拆分成更细粒度的任务,每个步骤都使用RAG融入外部知识来降低幻觉。4.最后是成本较高的,使用另一个模型来检测幻觉,如果有幻觉则重新生成。自研模型的话,通常是在垂直场景需要蒸馏一个小模型,或者微调一个模型。除去上述部分,还可以参考一下思路1.SFT训练数据层面:通过合成指令微调,有助于缓解幻觉。2.强化学习:在强规则的领域,可以通过强化学习来缓解忠实型幻觉。比如特定格式输出、特定内容提取等。3.推理:在不同领域考虑不同的解码方式,多样性解码在专业领域诱发更多幻觉,贪心搜索在开放领域加剧幻觉
查看9道真题和解析
点赞 评论 收藏
分享
牛客网
牛客网在线编程
牛客网题解
牛客企业服务