Tiktok AI系统性能工程师-Infra方向 实习/正式

【Tiktok】 AI系统性能工程师-Infra方向 实习/正式

工作地点:北京/上海

投递邮箱:yan.shao@bytedance.com
PS:给自己组内招人,新开名额多

职位描述:
TikTok是领先的短视频平台。我们的使命是激发创意,传递欢乐。
信任与安全(TnS)工程团队负责保护用户免受有害内容和滥用行为的侵扰。通过TnS工程团队的持续努力,TikTok能够为全球用户提供最佳的使用体验与乐趣。我们的团队致力于搭建算法模型与业务场景之间的桥梁,将TnS的算法能力高效、稳定地应用到TikTok的各类业务中。

岗位职责:
- 与业务团队密切合作,优化算法应用的集成方案,提高算法在不同业务场景下的评估与使用效率,降低算法应用的管理和优化成本。
- 负责算法应用的架构设计、开发及性能调优,解决高并发、高可靠性和高可扩展性等技术挑战。工作内容包括多个子方向:机器学习模型训练与评估、模型优化、模型推理、模型管理、数据集管理、工作流编排等。
- 搭建包含GPU、RDMA网络与高性能存储的超大规模机器学习系统。
- 负责与大语言模型(LLM)、自然语言处理(NLP)、计算机视觉(CV)相关的前沿工程技术的研究与实现。

任职要求:
- 在以下一个或多个领域具备实际经验:机器学习、深度学习、推荐系统、自然语言处理或计算机视觉;
- 熟练掌握C++、Go、Python或Shell等1-2种编程语言,并能在Linux环境下工作;
- 理解分布式系统原理,具备大规模机器学习系统的设计、开发与维护经验;
- 熟悉主流深度学习框架(如PyTorch、DeepSpeed、Megatron、vLLM等),有大规模数据处理与并行计算经验;
- 对前沿LLM研究与工程(如长上下文、多模态、对齐研究、智能体生态系统等)有深入理解与实践经验者优先;
- 有深入CUDA编程与性能调优(cutlass、triton)经验者优先;
- 具备机器学习模型评估、LLM应用与智能体开发经验者优先。
全部评论
接offer
点赞 回复 分享
发布于 03-01 15:05 河南
接offer
点赞 回复 分享
发布于 03-01 14:42 广西

相关推荐

继续来分享下之前的面经~欢迎友好讨论,信息共享1️⃣算法题:手撕内存池(要求支持类似new Foo[], delete []功能),c++如何比较两个float是否相等,LRU,岛屿个数,二叉树的层序遍历,hamming weight,k-coverage intervals2️⃣torch手撕题: LoRA adapter3️⃣cuda手撕题:1- 支持torch broadcast的4D tensor的elementwise mul2- A: (1, 256),  B: (256, 128),  C: (128, 256) ,计算 (A * B) * C3- Embedding Sparse Feature Pooling:A是 100 万个离散 ID(0~999),B是 100 万个float,计算个长度为1000的float数组C,C[i] = \sum_{j s.t. A[j] = i} B[j]4️⃣ai infra或算法八股:1- llm的知识蒸馏放在预训练做是否合适2- Hopper TMA的优点,调用方式,是否需要经过L13- Flash Attention v2为什么外层对Q循环,Flash Decoding的combine kernel耗时占比大概是多少4- Mooncake kv-cache centric的PD分离5- Dit的推理框架设计思路和LLM的有什么异同6- 分析MLA decode的计算访存比,它和seqlen、batch size是否相关7- diffusion model的训练和推理步骤,推理num_inference_steps为40时,为什么训练的timesteps仍要设成10008- 介绍dLLM,如何看待它和AR的区别9- torch.repeat 和 torch.expand的区别10- torchrun的启动参数有哪些,如何在Linux上批量kill包含torchrun的进程
查看21道真题和解析
点赞 评论 收藏
分享
评论
1
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务