携程数仓实习(一二面凉经)

3.20 一面

没有自我介绍

先介绍自己的项目,然后对项目提问(问得很少)

给一个你不熟悉的业务,要求做一些报表、指标,你会怎么做(如何设计数据仓库,数仓建模)

Hive有哪些存储文件格式,对应的应用场景(这块没答好)

给一个txt文件,load数据到Hive中需要考虑哪些问题(这里回答的也烂)

给A、B两张表进行join,描述join的过程

用MapReduce详细的描述join的过程

给定一张订单表请考虑它的一个表结构(分区表?不分区),存储数据使用增量表?全量表?为什么?

基于订单表继续丰富场景,问订单表常发生状态的变化,该怎么存储维度变化?

答:拉链表

详细描述一下该如何实现拉链表,面试官人很好,说得不对的会帮我补充,还会帮我梳理思路

sql题:给定一个打卡表(dep_id,uid,time),求连续打卡次数(用户两次打卡中间没有其他人,则认为是连续打卡)

3.25 二面

面试官迟到了几分钟

自我介绍

介绍项目(以数仓的形式介绍的)

项目中存在的难点

针对说的难点继续挖(说得不是很清晰,面试官说没听懂我说的)

对AI、LLM的了解

对脚本语言的了解,比如shell、python

为什么选择数仓开发,结合LLM说一下自己的看法

在业务实现过程中,可能会遇到好沟通的或者不好沟通的人,你有没有遇到过这种情况,如何处理

反问:

部门具体的业务

面试表现(对我说的项目难点不满意,感觉就是那个问题没答好,后面回答的也很烂

全部评论
友友是风控部门吗
点赞 回复 分享
发布于 04-02 22:21 广东

相关推荐

11-25 10:02
复旦大学 Java
一面:简历项目介绍一下项目内容怎么用定时任务调度解决分布式事务问题缓存穿透、雪崩、击穿是什么为什么要用消息队列,rabbitmq相比其他消息队列有什么特点java异常了解吗synchronized锁的实现(猜测问的是锁升级)多线程了解吗(猜测问的是实现方式)java内存模型是什么gc了解吗(猜测问的是死亡对象判断、垃圾收集)操作系统linux如何查看文件前5行(head -n 5 filename)cpu满载如何排查问题孤儿进程和僵尸进程进程、线程和协程的区别和作用进程通信方式动态链接和静态链接的区别数据库mysql底层数据结构了解吗(B+树)怎么选择主键左连接和右连接的区别redis底层数据结构(猜测问的是键值对和8种数据结构)redis单线程了解吗计网三次握手和四次挥手过程为什么TIME_WAIT要等待2MSL多路复用了解吗客户端从输入网址到显示网页内容经历的过程(解析域名、建立连接、请求与回应、解析网页)其他RPC了解么手撕算法LRU缓存给定一个数组,求和最大的连续子数组(前缀和+哈希表)反问:能过的话什么时候二面二面:简历项目介绍一下项目内容Spring Security+JWT实现用户认证的原理是什么怎么基于RBAC分配用户权限用户-角色-权限的方式来分配权限有什么缺点(为用户分配权限必须创建角色,可以通过用户-权限方式来解决)怎么用定时任务调度解决分布式事务问题还了解多少分布式事务解决方案javajava内存区域是什么局部变量和对象分别存储在哪里垃圾收集算法有哪些垃圾收集器有哪些,介绍一个熟悉的从写完一段java代码到执行经历了什么,类加载过程(双亲委派模型)Spring介绍下Spring核心原理(IoC和AOP)如果自己写一个IoC框架,核心方法是什么(答了HashMap存储Bean对象)提问:愿意转c++吗,有没有困难闲聊:问了英语成绩、文体竞赛、个人生活等,感觉像hr面会聊的问题
点赞 评论 收藏
分享
评论
4
9
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务