美团暑假数据开发实习一面、二面面经

本人背景 985 大数据专业大三在读,今天参加了数据开发岗的一面,感觉凉了,本科学的东西感觉还是太浅了。
面试开始的挺快的,视频面试开始就直接是自我介绍,本人做的项目比较少,都是些课程的大作业的项目。

自我介绍
然后问了问能实习多久,能不能保研,如果能保研是不是要去读研,以及原因啥的。
介绍项目——选了两个项目详细说说,感觉自己说的也不是很详细
问了项目中主要的难点
第一个项目是一个通讯软件,然后我主要负责的是后端数据库的开发和前端功能实现,但是那个面试官问了我很多服务器和客户端通讯的网络协议之类的,网络这块我都不太熟没怎么答出来。
然后第二个项目是基于Hadoop的一个数据分析系统,我负责hadoop集群搭建和mr编写,面试官又问了我蛮多spark的问题,spark没怎么用过,又没咋答出来,只说了一下spark和Hadoop的一些区别,还有spark的架构啥的(瞎说)
又问了spark数据倾斜怎么处理,还有kafka之类的有没有了解。
我的理解应该是面试官想看看他们部门涉及到的业务我了解多少(spark,网络啥的),并没有太根据我的介绍来问一些我负责的部分的问题。
mysql相关的问题
第一个问了一个mysql的引擎还有和innodb这类数据库的区别,不太清楚
然后问了mysql索引相关的问题,b+树什么的
又问了聚簇索引和非聚簇索引,具体的也不清楚
之后估计是看我很多都答不上来然后开始问我学了哪些专业课,讲了哪些内容
聊了聊数仓
我讲了一些数据挖掘的点,然后问了数仓的分层,我不太了解就随便说了一个数据集市的概念。
之后问了事实表维度表,讲了讲大概是什么东西。
事实表有哪些类?感觉学过但是忘了,也没答上来。
数据库相关
问了一个事务的四个特性ACID
问了四种事务的执行方式,具体问了不可重复读的原因啥的
又问了操作系统
死锁的产生条件还有如何避免
我讲了一个银行家算法,又问我银行家算法的具体算法是什么。
最后还问了一些计算机网络,网络的七层架构
三个逻辑题:
25匹马,5条赛道,找最快的三匹马要比多少次
5L和6L的量杯如何取得4L水
1000瓶药有几瓶有毒,一周发作死亡,最少需要多少只小白鼠才能在一周之内找到所有毒药。
算法题:
当时让我二选一,一个是反转链表还有一个是动态规划的找公共最长字串,我选了反转链表。
写出来之后又让我试试反转区间链表,没写出来讲了讲思路。

感觉应该是凉了,问了太多我都没了解的东西了,感觉大学学了三年还只是九牛一毛,继续努力吧!

居然还有二面!!
5月16日收到二面的电话,约了18日的面试,准备时间蛮短的。
这次面试我的是一个小姐姐,人很好,面试过程让我也感觉比较放松,整个面试都是比较愉快的嘻嘻。

自我介绍
然后主要介绍项目,先介绍了一个有关于hadoop的项目,说的逻辑稍微有点乱,但是感觉比一面说的好。
期间问了问hadoop和spark的区别啥的
然后又介绍了一个自己最有成就感的项目,主要讲了一些困难呀,然后负责的工作和收获等等。
看我是大数据专业的,又学过数据仓库相关的,就又问了我数据仓库是什么等等相关的。
几乎没有什么其他的概念原理上的考核,直接就是做个算法
考的其实不难,是两个有序数组,找到a,b数组中差值的绝对值最小的两个元素,然后我先说了一下想法,用双指针来做
面试官问我这样做时间复杂度是多少,我说应该是O(n),她反问我是吗?我一下就好紧张,支支吾吾说如果是双指针的话,每个数组遍历一遍应该是O(n)呀
然后面试官就笑了,说你说的对,咋没自信呢。
然后开始做,它这个题不是力扣上的那种有现成的测试用例,而是你写完她现场出一个测试用例让你跑,
刚开始写的有点问题,然后改了一下,基本上改对了,面试官说思路是没有问题的。
最后就是问了问个人自我评价优缺点之类的
未来规划是如何呢,以及什么时候可以开始实习
反问

二面总体是比较轻松的我感觉,主要是针对项目进行提问,深挖项目。之前看牛客上其他人的面经都考了sql啥的,我觉得数据开发对sql的要求应该也比较高,还复习了很久sql相关的知识,结果都没有问也没有考sql题,感觉可能还是不同部门面向的业务和技术栈是不太一样的,因此面试考点可能都比较有针对性。



#美团面试##面经##面试流程##MySQL##数据开发工程师##美团#
全部评论
请问你投的暑期实习还是日常实习?
3 回复 分享
发布于 2022-05-15 21:52
兄弟,想问下你二面之后有后续的消息吗😶
1 回复 分享
发布于 2022-05-24 03:19
官网投的还是APP上投的呀
点赞 回复 分享
发布于 2022-05-13 14:16

相关推荐

不愿透露姓名的神秘牛友
12-02 15:49
联想 数据分析师 15k×12薪+10%基础年终1.8w 硕士985
点赞 评论 收藏
分享
一面时间10.29面试了50min,但面试过程中网络经常出问题1、自我介绍2、你觉得大数据专业和计算机科学等专业有啥差异?3、你觉得哪门你的印象比较深刻、对你的影响比较大?4、你觉得大数据和传统数据库的主要区别在哪?5、你觉得事务是什么意思?举个例子6、你觉得整个事务是单纯数据库就可以完成的吗?7、事务能够解决怎样的问题?为啥需要事务——》什么情况下会出现幻读、脏读——》为什么大家不能一个一个读呢?——》并发8、大数据中有并发这种东西吗——》(有时候解决一个问题是靠技术解决,有时是靠一个规范,有的是使用模式)——》数仓怎么解决这个问题?——》(面试官)从技术层面上来讲早期HDFS是有这个问题的,并行写是有问题的,但这个问题是可以忍受的,一是因为不太用的到并发,实际数仓建设中一个表里在一定时间基本只有一个东西在往里写(delete,insert),二是因为出了点问题是可以接受的,早期谷歌大数据搜索,现在记录日志,很少有数仓一边写一边读9、大数据在分布式上的作用是啥,从存储、计算的层面来讲哪些比较有特点——》你觉得100台1G的服务器比较贵还是1台100G的服务器比较贵——》(面试官)100台服务器一直都是比较贵,电力、散热等,但不怎么容易坏——》Yarn解决的啥问题——》啥是计算资源——》讲讲Spark的计算这块介绍一下10、场景:你到现场,没有任何数据平台,给一份文件(数据量极大,以京东白条这种为例),第一列是时间,第二列是用户人名,第三列是消费金额,我现在要做个排序,找出单日消费前10的人,服务器上性能较一般,但啥语言工具都有,你会怎么解决?——》你觉得并行和并发有什么区别——》(面试官)一个大数据任务本质上处理方法是一样的,无非节点多就并行做,节点少就串行做,节点不多不少就整体并行,每个并行里是串行。11、聊聊你的离线数仓——》为什么企业要建数仓?——》数仓分层的依据——》ODS的中文是啥(回答错了)——》如果ODS和数仓只能留一个,你准备留哪个?(回答错,实际是保留ODS)——》你既然回答的理直气壮,那你觉得ODS为什么还留着,为什么没被干掉?(面试官跳过了)12、你觉得数仓几个层要被干掉一个,你觉得哪个层要被合并——》DWS(?)13、你对维度建模理论有了解吗?——》你觉得维度建模理论提出是为了解决啥问题,为什么要搞维度表,事实表,为什么不搞个宽表,2、300个字段堆那?——》你觉得实际工作中宽表用的多不多——》(面试官原话)所以你觉得维度建模理论是扯淡吗(笑)——》你觉得谁喜欢宽表?——》(面试官)政府部门的人相当喜欢宽表,实际工作环境中,不查数据,一般都是要求下载为excel,他只关心本部门的数据,那个数据没有那么多,他也不会写SQL,就要求你整到一起下载到excel让他去操作。(面试官)为什么这些理论和实际差别很大呢——》早期数仓很贵ODS最大的价值——》万一领导马上就要数据,数仓来不及跑,可以直接从ODS拿,像泄洪闸一样的方便的东西,另外一般参与ODS建设的人的资历比较老,ODS可以减小,但不能被干掉。面试官建议:你的逻辑能力、学习能力都不错,再找个方向去积累,数仓有些没那么牛,但可以做很久。
第一次找实习,我建议__
点赞 评论 收藏
分享
不愿透露姓名的神秘牛友
11-30 22:58
字节跳动 数据开发 26*15 本科211
点赞 评论 收藏
分享
不愿透露姓名的神秘牛友
11-30 22:55
小红书 数据开发 32*15 本科985
点赞 评论 收藏
分享
评论
5
63
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务