与大数据相关的工作职位有哪些?

大数据岗位到底有哪些分类?
要做Spark/Flink,还是做数据平台?
数据湖、数据中台、实时数仓、离线数仓有什么差别?
各方向工资、天花板、发展路线是什么?
哪些方向更容易进大厂?

整个大数据世界可以划分4层:
1.存储层:HDFS+ / HBase+ / Iceberg / Lakehouse+
2.计算层:Spark / Flink / Presto / ClickHouse+
3.平台层:数据平台 / 数据中台 / 数据治理
4.应用层:数仓模型 / 指标体系 / 推荐 / 风控 / 运筹

主攻岗位方向主要工作
存储数据湖 / 存储工程师Iceberg、Hudi、OSS、S3,湖仓架构
计算Spark工程师Spark SQL、RDD、优化、数据管道
计算Flink工程师实时计算、流式任务、CEP
平台数仓开发工程师离线模型、分层、Hive、指标体系
平台实时数仓工程师Kafka + Flink + Hudi/Iceberg
平台数据平台 / 数据中台工程师任务调度、元数据、血缘、治理、权限
应用大数据算法工程师推荐 / 增长 / 风控 / 画像 / 定价优化
应用数据分析 / 商业分析指标分析 / AB实验 / 洞察 / 业务建模

未来都可期!

#牛客AI配图神器#
全部评论
感觉你这写的还行啊,你也是大数据开发吗
点赞 回复 分享
发布于 01-22 23:55 北京
我们学校啥都教 我还以学了一下Hadoop是叫这个吧
点赞 回复 分享
发布于 01-21 19:16 陕西

相关推荐

从25年2月到现在,接触大数据开发已经有一年了,从MySQL,orcal,到flink首先就是写SQL,毕竟大家大部分都是SQLboy,SQLgirl,SQL是基础,可以在力扣牛客上多刷题。手撕常考!数开作为技术岗中最贴近业务的岗位,理解业务过程并进行数仓建模是最重要的一部分建模这块主要涉及,指标维度建设,数仓分层,讲解项目结合业务来讲.技术栈主要分离线和实时,实时门槛工资相对高一点,但应用场景比离线少很多,离线是数仓的基础。大数据技术栈主要是Hadoop生态圈,分布式的一些东西,也就是八股基础的得会,得理解整个架构运作流程,光背是记不住的Hadoop,hive,spark离线最核心的技术栈,也是八股最常考的,实时主要是spark,flink其次是一些数据处理框架kafka,etl转换工具知道一些,怎么用的大数据的框架搭起来比较麻烦,时间赶的不建议亲自搭环境,理解项目业务过程,这个项目做了什么,整个数据链路能讲清楚即可。技术栈的一些相关学习渠道,博主是在B站上找视频学的,也够用,时间赶学重点就行,结合八股来看。最后是算法手撕,本人算法很烂,除了大厂基本不考这个。出的题一般比较简单,会hot100就行个人经验来看,简历上有了实时项目,很少问Hadoop八股,更偏重spark和flink。项目还是以离线为主。实习发现实时数据只占很少一部分,离线是底盘有了实习经历就不咋问项目了
为了入行xx岗,我学了_...
点赞 评论 收藏
分享
评论
3
4
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务