商汤科技 多模态Omni方向实习生

商汤科技研究院多模态大模型组招聘: 多模态Omni方向实习生

实习地点:北京/上海

工作职责:

探索多模态Omni模型的研发,参与视频、音频、文本等多模态融合模型的开发与优化,打造具备流式交互能力的智能视频对话系统。让AI不仅能“听懂”用户,还能“看懂”世界,推动AI在视频、音频、文本等多模态领域的创新应用,打造更智能、更自然的交互体验。负责多模态融合模型的训练,构建高质量多轮对话和拟人数据的管线。设计端到端的音视频对话模型,提升音频生成的质量,实现高保真可控的音频生成,让AI的声音更富有情感。

任职要求:

  • 在NLP,CV等领域有相关研究或项经验,对大模型相关技术有深入了解;
  • 对前沿研究方向有敏锐见解,对训练系统有一定了解,对数据与模型结构有充分认识;
  • 具有优秀的分析问题和解决问题的能力,对解决具有挑战性的问题充满激情;
  • 有较强的代码能力或有较强的研究能力(论文成果、代码竞赛、学术竞赛等)。

投递方式

投递邮箱:tongwenwen1@sensetime.com

邮箱主题:多模态Omni方向实习生 + {实习地点} + 姓名

#大模型##多模态大模型实习##多模态大模型招聘#
全部评论

相关推荐

不知道怎么取名字_:两个方向 1.简历针对性准备下 2.面试前也需要准备的 主要还是要看各个公司需求,看公司行业和岗位描述,那里面已经写了对技术的需求,一份简历,不可能和所有嵌入式岗位都匹配的
投递北京经纬恒润科技股份有限公司等公司6个岗位
点赞 评论 收藏
分享
想干测开的tomca...:这份简历是“大一新生硬凹资深后端”的典型反面教材,槽点离谱到能让面试官直接笑出声: ### 1. 「年龄+入学时间」和项目复杂度完全脱节,可信度直接归0 你2024年7月才入学(现在刚读了1年多),19岁的大一新生,能把Vue3+Spring Boot+ShardingSphere+K8s+AI这些技术全塞进两个项目里?别说实际开发,光把这些技术的文档看完都得半年——这不是“能力强”,是“把招聘JD里的技术词全抄过来造假”,明摆着没碰过实际代码
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务