松鼠ai大数据实习岗位面试

1.问了我项目的问题,spark整合kafka这阶段做了什么事?

答:jdbc工具类向mysql表中插入数据,产生binlog日志文件,maxwell捕获到,kafka进行消费,然后javaapi上面编写kafka工具类,获取主题,编写配置信息,get到消费的内容,是JSON格式,转换json格式为row,然后转换为dataframe表,使用sparksql处理。

2.kafka的acks值有了解吗,给我讲一讲?

答:指定分区副本,控制消息可靠性。

追问,acks值可以取哪些,分别代表什么?

答:0:生产者不等待分区确认,消息到达kafka便会认为消息已经发送成功,低延迟,但是安全性最低。

1:生产者等待分区副本leader确认收到消息,才会认为发送消息成功,有一定的可靠性。

all(-1):生产者等待所有分区副本都确认收到消息,才会认为发送消息成功,可靠性最高,但同时延迟也最高。

3.看到简历中项目用到了phoenix,问一下phoenix的索引上限是多少?

答:根据hbase的表的设计有关,受hbase表的列族、列的数量和Region数量影响。

4.phoenix怎么实现二级索引?

答:先创建一个初始phoenix表,这个表是需要添加二级索引的表,里面包含数据,然后创建需要储存二级索引的表,需要指定包含的列以及索引的名称,然后将数据插入到初始表便可使用二级索引了。

5.hbase的处理器你有了解过吗?可以讲一讲

答:有协处理器。

追问,协处理器的触发点在哪里?

答:hbase的一些操作上,如:Put、Get、Scan、Delete。

6.hdfs的读写过程。

答:(介绍了一下client、namenode、datanode、容器,然后围绕这几个答具体流程)。

7.你的虚拟机是自己搭建的吗,用的是开源的吗?

答:是自己搭建的,(是不是开源我自己不太了解这个)是开源的。

8.虚拟机上hive安装了哪些引擎?

答:就安装了一个可以编写指令的最基础的hive。

9.zk的选举过程。

答:集群的机器拥有自己唯一的myid,根据myid大小来选举leader(这个有点不太熟悉了,答得很简单)。

10.举例说明哪些地方用到了zk?

答:namenode高可用(HA),当active namenode挂掉后,ZKFC进程监视到之后就会传达命令给zk,将standby namenode切换为active状态。

11.还有哪些,了解过zk在hive中的作用吗?

答:这个不太熟悉,答不上来。

12.那zk在hbase中的作用呢?

答:hbase中主节点Master的选举,集群一些组件状态的管理,元数据的存储信息。

13.说一下java的一些结合类。

答:List,Set,Map,Queue等等。

14.说一下他们的区别。

答:(分别讲述了他们的作用和特点)。

15.线程安全用到了哪些?

答:ArrayList和HashMap。

16.ArrayList不是的,hashmap有,有了解过ConcurrentHashMap吗?介绍一下

答:一个线程安全的hash表实现,提供了高并发的访问能力,可以被多个线程同时使用,不需要额外的同步操作。

17.介绍一下hashmap。

答:(没答上来,但面试完之后就反应过来了,基于hash表的键值对无序存储)泪目。

18.手撕题目,在力扣上面自己选了一道中等难度的sql和中等难度的算法题,好在测试都通过了。

19.面试问题问完,给我介绍公司的情况,入职后需要做的事情,跟的团队,说目前公司的框架比较成熟,说了一些公司的优点,然后就是薪资情况,问了我多久可以到岗(一周以内)。

20.反问

1)需要国庆节之前到岗吗?(不需要。不必要这么折腾,国庆节之后到就行,大概7、8、9号这段时间。)

2)通知大概什么时候给?(下周一(22号星期五面的)吧,下周一会给通知。)

面试结束,礼貌语,面试官挂断腾讯会议。

整个过程1h13min,友友们看看这情况怎么样啊,有大概率能通过吗?

#大数据开发面经#
全部评论
从你的描诉感觉能过的概率蛮大的
1 回复 分享
发布于 2023-09-27 22:58 广东
这个只有一次面试嘛
1 回复 分享
发布于 2023-09-27 22:58 广东
可以看看这个,福利待遇都很好,有住宿,有签字费。https://www.nowcoder.com/share/jump/9680024221695558516096
点赞 回复 分享
发布于 2023-09-24 20:31 北京
这个是实习岗?应该是过了吧,面了这么久
点赞 回复 分享
发布于 2023-09-24 18:03 辽宁

相关推荐

01-17 18:15
已编辑
门头沟学院 前端工程师
从上午约我面试然后他迟到,然后中午发消息打电话给我说重约面试时间,我就该意识到。【管理不规范,只是这家公司最小的问题】他妈一个不是技术的人来给我技术面。。。连vvue什么?连react是什么?连普通的HTTP请求是什么?这些东西都不懂的人来给我做技术面,我真的。。。。他妈浪费我40分钟。。一天面了三场,这家公司属实牛逼。不停的问我说上班下班时间谁来派任务公司在哪个区发展怎么样,公司的管理模式什么样,培养机制怎么样带教负责什么。如果出bug了谁来负责。我真的求你了别闹了。我答了15分钟,我已经很不想回答了。然后他就问了我一些很招笑的面试问题。问我前端框架架构设计怎么设计,Websocket可以实现SSE吗??最后还要我硬说,为什么我们公司没转正?为什么?为什么?我说我怎么知道。。这是领导决定,又不是我决定,他说让我分析一下。。。我真的草了,这个人是来搞我的吗?我最后问我说这个没有技术面,他说他就是技术面虽然我今天面的另外两家也很逆天。一个人不停的吹牛,自己100人的公司是全国前几,吹牛了一个小时。我中途几次想跑,真的是底下玩手机在听他那吹牛。。然后最后来了句说,我承诺的东西要实现哦,不然的话,公司会追责的,我我请问我承诺了什么?从头到尾也没有说让我承诺什么。而且我只是作为一个小小的前端卡拉咪,应届生。我要承担什么??好崩溃。。好崩溃的,一天面了三场。两家1000-9999的公司。面试官问的都很傻逼,甚至有些东西我问他估计都答不出来。。 我这是在干嘛呀?浪费我一天的时间,我的奶奶。。我本来是抱着说我很菜,我要面试中发现自己的问题,现在来看他妈的这三场面试,面试本身就是问题。。
点赞 评论 收藏
分享
评论
2
15
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务