京东-机器学习算法架构工程师-
招聘简介
【公司及部门介绍】 京东商业提升事业部(前广告部)成立于 2014 年初,承担着京东全站流量变现及营销效果提升的重要任务。我们致力于打造世界一流的电商广告及营销平台。京东商业提升事业部拥有互联网广告业内一流的技术团队,主要成员均来自百度、腾讯、雅虎等业界知名公司,有着丰富的互联网广告从业经验。我们意识到技术人才能够 make so much difference,更让我们更加渴求更多技术人才加盟。
【岗位职责】 专注于大数据背景下的大规模机器学习的算法研究及工程落地,包括但不限于: 1.基于机器学习、深度学习等领域前沿算法的探索与研究,以及结合现有业务和未来业务场景下的算法解决方案; 2.大规模分布式机器学习平台的研发工作,针对不同数据形态和模型算法的计算规模及性能优化; 3.大型分布式广告模型系统架构设计和优化,支撑数百亿请求pv压力的高可靠系统研发;
【岗位要求】 1.全日制大学硕士及以上学历,计算机、通信、数学等相关专业优先; 2.具备良好的数学基础,熟悉机器学习、深度学习基本知识及工程实践; 3.扎实的 Linux 下 C++/Python 编码能力,了解计算机体系结构、异构计算,对数据结构和设计模式有深刻的理解; 4.熟练使用至少一种常见的机器学习框架,如 TensorFlow / PyTorch 等; 5.有优秀的学习能力,分析问题和解决问题的能力,对解决具有挑战性问题充满激情; 6.做事严谨、认真,积极主动,有团队合作精神,具备强烈责任心和严谨工作态度以及良好的沟通能力;
【加分项】 1.有计算机领域顶级会议论文优先,开源项目贡献者优先,有优秀的 GitHub 项目、技术博客优先; 2.有大数据处理、高性能计算、分布式机器学习框架设计和开发等方面的项目经验加分; 3.熟悉网络编程、多线程编程技术,有大规模系统开发和设计经验加分; 4.有Graph Neural Network、Reinforcement Learning、OnlineLearning、TB级大模型训练&inference等相关经验优先;
【工作地点】 北京市朝阳区北辰西路8号北辰世纪中心 A 座(临近国家会议中心、鸟巢、水立方)
简历投递邮箱:wangkunyao@jd.com
一面
百度
- 模型预估服务平台:
- 部门简介和个人工作介绍
- 在线与离线
- cache 1.pb接口 2.不走预估,直接返回 3.无用户信息就cache没有用了
- 亮点工作,对你来说你的提升是什么?
- spcache + 业务需求(???)
- batch
- 基本逻辑(怎么合并,怎么解耦)
- 为啥需要这个东西?
- ???放在结构或者队列里面,满了或者超时做批处理
笔试
- 合并两个有序链表(循环+递归)
- 调整数组顺序使得奇数位于偶数前面(直接在原数组上面改;新建一遍空间)
- 实现一个单例模型
网络小项目
- 服务框架:epoll,rpc,ftp
语法
- 智能指针(shared_ptr, unique_ptr),引用计数,野指针;什么时候用?
- static关键字,c++中什么时候用static ?单例模式
- epoll为什么比select可以更多文件描述符号?基于事件,而不是轮训;
部门简介
模型预估服务平台建设 + 模型优化
- 重视c++后台开发能力 + 网络相关
- 联邦模型
mxps反思
- 什么时候用vector, 什么时候用的list?
二面
实习经历
- 你了解mmdnn的具体实现吗?加tensorrt优化有多少?
- onnx是什么的?
- 你了解bert/ernie模型的具体内容吗?attention机制?transfomer机制
- 对于cache的话,有些加点击数据(历史记录),你们怎么处理?
- 蒸馏的对效果的影响多少?
- 对于cache, URL协议清楚吗?
小项目
- 上传文件用多线程,下载的时候用p2p
- 互斥锁、自旋锁、分布式锁、读写锁
- 百度取模的锁
系统题
- 10亿的数字,每个int32存在一个文件里面,文件在磁盘里面,内存只有1G,找中位数的方法
- 快排的分治思想
- 桶排序
- 位操作,正负号
- 逻辑题:64匹马,8个跑道,怎么找出最快的4匹马
- 10-11次,防止一个对特别的强。
加面:算法工程师
- 百度的paddlepaddle业界其实不好用,你看过tensorflow的源码吗?为什么不看?
- 对于需求对接的时候,注意没有对双方有能力提升的地方少做,只是易用性的工作要少做。
- 有些场景百度可能不存在,但是其他会存在,比如同一个机房可能会用到不同卡,这个非常考虑到自驱动性。
- 对于一个模型做出来预估,策略预估是100ms,但是你要提升到50ms,这个就是算法和工程的协作关系。
- 对于离线训练也有很多东西可以做,比如ps,这些都是需要了解的。
- 关于CPU编程和GPU编程,你的看法是什么?
- 你的薪酬的预期是多少?