【职位描述】•AI应用全生命周期演进: 深度参与业务问题建模、应用架构设计、训练数据构建、自动化评估体系、模型后训练优化等•强化学习与奖励机制设计: 构建可工程化的Reward体系与RL训练环境,提升模型在垂直业务场景中的可控性与泛化能力•AI外部能力体系搭建: 实现AI应用所需的知识库(RAG)、长短期记忆系统(Memory)、多Agent协作框架等【职位要求】•学历学术背景:计算机/人工智能/数学等相关专业硕士及以上学历,在 ACL/EMNLP/ICLR等顶级会议上发表论文者优先•AI应用构建能力:掌握主流AI协议(MCP等)、记忆系统(Memory)、知识库(RAG),独立开发过一定影响力AI应用者优先•模型理解与优化:熟悉主流LLM模型架构,具备模型后训练优化(SFT/DPO/RL)能力,拥有Agentic RL训练实操经验者优先