2019秋招头条大数据/数据挖掘面经


第一次发面经,好紧张,历经20+天,get头条意向书啦。过后补上美团面经~

一面 40min

  • 【编程题】有两种数据,分别是被转发的用户和转发的用户,求原视频的用户以及转发的最长深度

    from:1,1,2,2,3,6
    to: 2,3,4,5,6,7
    面试官提示转换成树的结构,我写了求树的最大深度的函数,面试官说构造树比较复杂,差不多写这样可以。

  • 【SQL题】有一张网页访问日志表,记录了user_id,session_id,page_id,timestamp

  • 用户在每点击一个连接跳转,就会记录一个时间戳,并且page_id排序后与时间戳的排序一致,现要求每个用户的每个页面所停留的时间。
    比如:
    1 1 1 10:00
    1 1 3 12:00
    面试官看了后说差不多是这样,但要考虑一个边界的问题,最后一个page_id之类的 (请问这个怎么处理?

  • HiveSQL底层是怎么实现的?比如两张表Join的时候会有哪些操作?需要shuffle这一步吗?

  • mapReduce为什么需要Shuffle这一步

二面 40min

  • TCP四次挥手过程中,time_wait字段的作用?
  • 进程和线程的区别
  • 有一个文件,每一行是一个数字,如何用 MapReduce 进行排序
  • 【编程题】n=3 时的全排列
  • 【编程题】二叉树的序列化和反序列化
  • Hive 中的 Distribute by
  • Partition By

三面 ~2h

三面的时候网真的好差,中间网络断了很多次,重新发起了4、5次视频面试,最后还是打电话了

  • 【编程题】在一棵二叉排序树中,找到比给定数值小的最大节点。
  • 【场景题】打车的场景下,poi记录了建筑物的坐标:poi(pid, x, y),odr记录的是乘客上车点的坐标:odr(oid, x, y);希望对所有的poi,获得其周围的100m的odr:结果(pid, oid)
    我开始用的是欧式距离的暴力求解,面试官让我提出优化的方案,我说可以计算出每个坐标点的geohash值,相等的值说明可以建立映射关系,面试官说geohash存在的一个问题是可能会出现两个相邻100m之内的点各自的geohash不同,这时怎么解决?
  • 【SQL题】有两张表:文章分类表artical_cate(aid, cate)一个文章可能有多种类型; 用户阅读表user_read(uid, aid),一个用户可能阅读多篇文章。
  • 详细问了实习的项目,涉及到业务背景,有哪些特征,整体流程和方法,问到了基于现在这个版本我会怎么继续优化?

总结

编程基础仍然是关键,结合业务场景的问题更需要拓展思路,平时还要多独立思考。

三面由于一道题没做出来,面的不太好,回绝后隔了一段时间后捞我加面

加面 45min

  • 自我介绍
  • 介绍公司实习的项目,准确率和召回率怎么得到的,提升后达到了多少
  • 二分类问题除了准确率和召回率还有什么别的指标?ROC曲线怎么绘制的
  • 训练集效果很好,但在新的样本上效果不好是什么原因导致的?你用Xgboost训练时怎么解决这个问题
  • 项目中运用MR任务来提高效率是怎么实现的?MapReduce的具体流程是怎么样的?
  • 描述一下在count操作的MR过程
  • 写一个SQL题,考察分组聚合、分区排序等
  • 【编程题】给定一个包含非负整数的数组,你的任务是统计其中可以组成三角形三条边的三元组个数。
  • 场景题:如何预测抖音明天的流量
  • 开放题:如何估计一个湖里鱼的数量?你说的方法可能会出现什么问题
  • 操作系统:32位操作系统的内存
  • 数据结构:知道哪些排序算法?归并排序在任何适合空间复杂度都可以达到O(n)吗

五面 20min

聊天面,问能不能来提前实习,毕业论文,是否有别的offer,导师实验室是否自由等问题

#字节跳动##大数据开发工程师##面经##校招#
全部评论
tql
1 回复 分享
发布于 2019-09-27 05:45
楼主参加的秋招吗 想知道大数据实习岗位也是这样吗 每一轮都要撕算法?写不出可咋整啊
点赞 回复 分享
发布于 2020-02-05 20:35
tql
点赞 回复 分享
发布于 2019-11-06 09:10
感谢感谢
点赞 回复 分享
发布于 2019-11-06 09:06
感谢分享
点赞 回复 分享
发布于 2019-10-02 20:04
楼主,三面编程打车,geohash存在的问题,那个问题具体什么意思
点赞 回复 分享
发布于 2019-09-29 15:38
tql
点赞 回复 分享
发布于 2019-09-27 21:35
请问是data组数仓嘛
点赞 回复 分享
发布于 2019-09-26 16:43

相关推荐

bg:双非本,一段中小厂6个月测开实习今天发这个帖子主要是想聊一聊我秋招以来的一个发展我是在8月底辞职,打算秋招,可是看网上都说金九银十就想着自己就是一个普通本科生,现在九月份都是一些大神在争抢,所以9月份基本上没投,等到了10月份才开始秋招,可是这个时间好像已经有些晚了,今年秋招开启的格外早,提前到了7,8月份,我十月才开始,官网投了很多公司,没有任何一个面试机会,这个情况一直到了十月底才有了第一个面试,当时没有面试经验,所以不出意外的挂了后续就是漫长的投递,但是毫无例外没有面试,没有办法我只能另辟蹊径开始在BOSS上边投递,然后顺便也根据BOSS上边这个公司名称去浏览器搜索看看有没有官网投递渠道,毕竟官网上投递后还是可以第一时间被HR看到的,然后一直不停投递,一开始第一个星期基本上都是投的正式秋招岗位到了第二个星期才开始实习和正式一起投,到十一月底的时候已经沟通了700➕才有一共1个正式的,5个要提前实习的,3个实习的面试,最后结果是过了1个要提前实习的和2个实习的每次面试我都会复盘,发现这些小公司面试官问的五花八门,有的专问基础,有的专问项目,有的啥都问,不过自己也是看出来了一下门道,就是小公司不像大公司面试官那样能力比较强基本上你简历上边的他都会,然后会根据简历来问,小公司面试官他们更多的是看自己会什么,然后看看你简历上边哪些他也是会的然后来问,经过不断的复盘加上背各种各样面试题,到了11月底12月初才有了1个要提前实习的offer还有2个实习的offer,而且薪资待遇对我来说已经很可观了可是啊,人总是这样得了千钱想万钱,我又开始不满现状,但是此时的我面试能力经过这么多面试和复盘已经很强了,然后在十二月份运气爆棚,被极兔和小鹏补录捞起来面试,还有个百度测开的实习面试,这个时候因为有了offer所以感觉有了底气,面试也很自信,最后结果是全部都过了那个时候我感觉自己真的很厉害,我问了极兔那边的HR像我这样的双非本收到offer的在极兔有多少?他告诉我产研岗90%都是硕士,10%里边基本上都是211,985,想我这样的很少很少,那一刻感觉自己超级牛逼,小鹏就更不用说了,最后也是不出意外选择了小鹏所以我就我个人经历想对和我学历履历差不多的牛友一些建议第一:秋招一定要趁早,真到了9,10月,那个时候可能你投的结果可能还不如7,8,11月,第二:最好先拿小公司实习或者正式练练手,提升一下面试能力,我个人觉得因为小公司问的五花八门所以你会更加横向去提升自己能力,而且大公司其实面试没有那么难,除了一些非常卷的岗位,公司大神比较多会问的很难,一般好点的公司都不会问的那么难,他们也知道都是应届生不会要求那么高第三:当有一定能力后,就是坚持了,对于我们这样的学历,没有特别强的履历情况下,就是要抓住提前批和补录的机会,这个时候各方面不会卡的很严,是我们很好很好的一个机会第四:就是运气也是很重要的一部分,不过这个很难去说什么最后祝各位牛友都能收获自己满意的offer😁😁😁
秋招,不懂就问
点赞 评论 收藏
分享
评论
9
95
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务