百度健康业务部算法实习面经

在byr上邮了简历,上午发的,下午就电话过来约面试,第二天一面,效率非常高。

一面面试官听口音是两广人,有时候听不出来他说的是啥,只能再问他一遍,稍微有丢尴尬。面试主要还是围绕这简历上的项目问,我只有两个没有名次的比赛经历,但是面试官说和他们做的很匹配,就比较感兴趣,然后深入的聊了一下。首先是自我介绍(原来自我介绍的作用就是给面试官争取看简历的时间),介绍完后面试官问了一些比赛的背景,比如这个比赛面向的业务是什么,都有哪些特征等等。
1. tf-idf公式是什么,对于低频词和高频词有处理么,高频词算出来的tf-idf的值会更大还是更小
2. 特征工程是怎么做的,balabala
3. xgboost原理了解么,讲一下,balabala(这个讲的比较深入,好在头天晚上把论文又看了一遍,论文中的算法优化和系统设计都讲了一遍,面试官对这个回答比较认可,追问源码看过没,这个实在是没看过)
4. nn模型是怎么做的,w2v原理是什么,balabala
5. 然后就是问一些基础知识,为什么会产生过拟合,怎么解决;归一化的作用是什么(这个我居然给忘了,百面机器学习第一章)

算法题:象征性的出了一道 有序有重复数组的查找

过了2天,收到二面电话,是技术leader打过来的,没聊技术,说一面面试官对我印象不错,就讲了实习生的工作内容大致是什么,然后说实习生可以做的东西很多,也不一定要做算法之类的,感觉他们部门很缺人?主要是担心我不能实习很长时间,或者导师放不放这种问题,他们都是要长期的甚至是满勤的那种,我说尽量多来。最后说hr会尽快联系你。

之前腾讯和字节的都挂了,感觉这个不算百度核心部门,所以比较简单?会不会是大坑啊,有没有懂行的老哥讲讲,如果是大坑的话,我就不去了。
#实习##面经##百度##算法工程师#
全部评论
健康业务部主要是做百度健康的app,算法应用面小,实习生可能接触不到什么算法相关的任务
2 回复 分享
发布于 2020-10-22 16:40
字节跳动Data团队招多岗位算法实习生~详细JD请点链接https://www.nowcoder.com/discuss/590127?channel=666&source_id=feed_index_nctrack 【岗位类别】 后端开发实习生、前端开发实习生、物流算法实习生、数据挖掘算法实习生、NLP算法(问答、对话方向)实习生、自然语言处理算法实习生、推荐算法实习生(详细JD见后) 【薪酬福利】 1、全勤月薪5K - 7K  2、表现优异可以提供转正面试机会 3、免费三餐+下午茶、免费健身、团队氛围好、大牛带队、就近租房补贴 4、工作地点为杭州市余杭区西溪八方城(近五号线五常站) 感兴趣的同学请发送简历到邮箱:caifeiyang@bytedance.com 邮件名称:岗位+姓名+学校+最早到岗时间+每周实习天数+实习持续时间
点赞 回复 分享
发布于 2021-02-04 11:37
请问你入职了吗?感觉如何?
点赞 回复 分享
发布于 2021-01-03 00:19
研究生?
点赞 回复 分享
发布于 2020-10-14 16:39

相关推荐

常规问题: 1. 3分钟简单自我介绍2. 在实习和开源经历中,你遇到的最大困难或最具挑战性的事情是什么?实习拷打(拓展相应的场景八股)慢 sql 治理相关的1. 你在平台稳定性建设中提到通过添加索引、读写分离优化慢SQL,具体是怎么做的?2. 读写分离可以再详细说一下吗3. 能否举一个添加索引的具体例子?比如在哪个字段上加了什么类型的索引?4. 你加的是单列索引,如果查询只需要表中的几个字段,当前的单列索引是否有优化空间?5. 联合索引相比单列索引的优势是什么?为什么更优?(从回表,索引下推优化那个方向说就好)es 慢查治理相关1. 关于ES扩容主分片优化查询,具体是怎么做的?2. 系统的ES集群资源配置你了解吗?(如CPU、节点数等)3. 扩容分片数量是如何确定的?仅依据数据量吗?4. 分片切割后为什么查询会变快(并行查询)5. 将 long 类型字段转为keyword类型,是如何利用跳表结构的?这里其实并不能,只是切换是为了适应精准匹配的场景,keyword 的底层用的是倒排索引+跳表6. 除了分片扩容和类型转换,还有哪些方式可以优化ES慢查询?(force merge 整理碎片)分布式锁(业务中有个并发修改用到了,主要问的一些分布式锁的实现细节)1. 你在业务中使用的分布式锁是标准库还是自研的?2. 让你自己实现一个最简单的分布式锁,你会怎么实现?3. 如果任务加锁后异常退出,没有释放锁,如何避免死锁?4. 如果任务执行时间很长,锁过期被其他任务获取,原任务完成后误删了别人的锁,如何解决(防止锁的误释放,加标识)5. 如果任务A包含多个子任务,且子任务本身也有加锁逻辑,在嵌套调用时会因重复加锁失败,如何解决?(可重入锁的实现)6. 在秒杀场景下,能否直接用分布式锁控制库存扣减?会有什么问题?7. 如何让秒杀请求不立即失败?(锁的自旋)并发编程1. 你使用CompletableFuture并发查询多个维度,底层是如何实现并发的?2. 你是自己定义线程池,还是使用默认线程池?3. 你是基于什么依据设置线程池参数的?4. 如果一个任务同时包含CPU密集型和I/O密集型操作,共用一个线程池会有什么问题?应该如何设计?(线程池隔离,避免cpu密集型任务阻塞I/O密集型任务)Agent和开源相关的内容1. 你的基座模型切换(DeepSeek → 千问)后,响应是流式还是非流式?2. 为什么关注完整响应时间,而不是首字响应时间?(主要是业务上的一个需要)3. 你的性能优化目标是在保证输出内容不变的前提下缩短生成时间吗?4. 你在Agent框架中使用了责任链模式和观察者模式,请分别解释这两种模式5. 既然有四个固定执行步骤(Agent执行前,执行后,模型执行前,执行后),是否可以用模板方法模式替代责任链模式?6. 你使用观察者模式的具体场景是什么?为什么选择它?7. 你还了解哪些常用设计模式?8. 你提到使用HNSW算法进行向量搜索,能简述其基本原理吗?(避免全表的向量查询)9. 为什么不直接用余弦相似度做全量匹配,而要引入HNSW?10. 你是否使用过BM25算法?它的作用是什么?11. 向量搜索有哪些弊端?12. 向量检索和BM25全文检索的得分量纲不同,如何进行混合排序?(引入一个精排模型重新打分)反问:1. 业务(智能客服相关)2. 不足,基础还需要加强无手撕,总体一个小时总结:面试体验很好,主要就是根据简历延伸一些八股和简单场景,有些还需要加强的地方,挖出来了自己基础上的一些问题
点赞 评论 收藏
分享
11-19 09:45
已编辑
门头沟学院 Java
bg:2本9硕,第一段实习胆小🐭未投递bat整体timeline:10.9开始投递 除jdy外 10.23都已经结束美团(数据平台部)一面 二面 oc蚂蚁(Oceanbase某边缘部门)一面 二面拒绝(脑子进水了)快手(大模型应用开发)一面挂虾皮 (保险那边业务)一面 二面挂京东jdy(京东科技)一面 二面 三面 oc百度(用增后端)一面挂b站 (cicd流水线)一面挂滴滴 (mpt引擎架构)一面过 二面oc面试一些更具体部门或者业务,这里就不展开了,有感兴趣的同学可以私聊面经~一点感想:1.越来越卷了,认识了很多27届的小伙伴现在已经2-3段实习了2.大模型应用开发是趋势,在你学历以及简历深度到位的基础上,了解甚至熟悉大模型应用开发的东西会帮助你脱颖而出,最少能多很多面试(实测),但是也存在一个小风险:简历靠大模型吸引来的,可能一般也只是组里应上面okr要求要做agent,招你进去随便做一个,成长性堪忧,但是总比啥都不做好。3.自己做的项目,不管是点评还是什么其他各种秒杀 电商等,可以想办法多体现一些与众不同,面试官们真看腻了,他们都能给你全文背诵你简历的描述,最重要的在于项目复杂度,一定新颖程度描述到位的基础上,多结合个人的思考,没接触的场景或者问题,玩命调动自己做项目的过程经验以及结合一定八股来回答,在面试官那边印象不会差的4.算法这块,感觉绝大部分厂不会太为难,我手撕十多道的经验上来看,没有超出hot100及其简单变式,不用太担心5.最重要的还是运气,运气面前一切实力高低与否都显得很渺小而运气又和投递时期挂钩,短时间内如果没有面试或者面试结果不尽人意,不用着急,可以继续投递的同时一边优化简历和熟悉八股算法,没准哪天某大厂缺人就一面速通你了,幸福往往就在一瞬间~祝大家都能找到自己满意的实习~也欢迎同一届的后端小伙伴们一起多多交流
发面经攒人品
点赞 评论 收藏
分享
评论
点赞
19
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务