大数据开发框架分类

大数据开发系列知识整合

1.语言

Java、python、Scala基础,能达到使用Scala进行Spark编程。

2.框架(frame)

日志收集工具Flume、Logstash、Filebeat

分布式文件存储系统Hadoop HDFS、Tachyon、KFS

数据库系统:Mongodb(文档类型的NoSQL数据库)、HBase(列族类型的NoSQL数据库)、Redis(键值对类型的NoSQL数据库)、Neo4j(图类型的NoSQL数据库)

分布式计算框架

  • 批处理框架:Hadoop MapReduce
  • 流处理框架:Storm
  • 混合处理框架:Spark、Flink

查询分析框架Hive 、Spark SQL 、Flink SQL、 Pig、Phoenix

集群资源管理器Hadoop YARN

分布式协调服务Zookeeper

数据迁移工具Sqoop

任务调度工具Azkaban、Oozie

集群部署、管理和监控工具:Ambari、Cloudera Manager

自动化构建工具:Maven

全部评论

相关推荐

01-19 12:48
门头沟学院 C++
只想搞钱的鸽子很喜欢...:混账是很多的,还有那些在自己风华正茂的年纪说风凉话讥讽那些下岗前员工的。这些人都是现在职场环境这么烂的帮凶
点赞 评论 收藏
分享
01-29 15:45
已编辑
华中科技大学 前端工程师
COLORSN:可以试一下,小厂看技术栈是不是很落后,如果太拉胯就别去,个人认为有实习氛围比你自己琢磨要高效不少,然后就是小厂其实也有可能会问的很难,这都比较难说,还是看自己项目含金量够不够,寒假还能不能推进学习再选择,毕竟去实习过年就10天假了
点赞 评论 收藏
分享
评论
2
6
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务