设为首页收藏本站

LUPA开源社区

 找回密码
 注册
文章 帖子 博客
LUPA开源社区 首页 业界资讯 开源资讯 查看内容

Hadoop十岁了,核心代码行数已170万+、贡献者800+

2016-1-28 23:30| 发布者: joejoe0332| 查看: 1085| 评论: 0|原作者: CSDN|来自: CSDN

摘要: Hadoop正式诞生于2006年1月28日,它是一个开源项目的生态系统,从根本上改变了企业存储、处理和分析数据的方式。跟传统系统的区别是,Hadoop可以在相同的数据上同时运行不同类型的分析工作。 ...

Hadoop正式诞生于2006年1月28日,它是一个开源项目的生态系统,从根本上改变了企业存储、处理和分析数据的方式。跟传统系统的区别是,Hadoop可以在相同的数据上同时运行不同类型的分析工作。

自2006年2月项目正式启动,短短的十年间,Hadoop逐步发展成为最近十年来最成功的开源社区的历程。

  • 核心Hadoop中目前的代码行数:170万+
  • 自2006年来对Hadoop的提交数量:12000+
  • 自2006年来对核心Hadoop的代码贡献者:800+
  • Hadoop生态系统中的项目数量从2006年的2个到了25个

总有那些时间节点事件让你难以忘却:

  • 2006年1月,Hadoop之父Doug Cutting加入雅虎;
  • 2006年1月,Cutting将Hadoop代码从Nutch中剥离作为一个新的子项目(常被称作Hadoop“创世纪”事件);
  • 2006年3月,Yahoo!创建了其第一个Hadoop研究集群;
  • Google发布了最初的BigTable论文《Cutting:用于结构化数据的一个分布式存储系统》,启发了Hbase的创建;
  • 2008年1月,Hadoop成为了Apache顶级项目;
  • 2008年7月,Hive,第一个Hadoop的SQL访问框架(由Facebook发明),成为一个新的Hadoop子项目;
  • 2008年8月,Apache的Pig发布,第一个Hadoop的高级别非SQL框架;
  • 2010年5月,Hbase,自HDFS以来第一个新的数据存储项目,成为Apache顶级项目;
  • 2012年3月,HDFS HA,做为企业级应用的重要一步,并入了Hadoop支干项目;
  • 2012年8月,YARN(也是企业级应用的重要里程碑)成为Hadoop的子项目;
  • 2014年1月,Apache Spark,Hadoop新兴的默认执行引擎(MapReduce的补充),成为Apache的顶级项目;
  • 2015年10月,Kudu,自HBase以来第一个新的Hadoop存储项目,加入了生态系统;
  • 2015年11月,Impala和Kudu成为Apache孵化项目;
  • ……

如今,Hadoop已被公认为是目前最流行的大数据处理平台。Hadoop生态圈的各个项目,围绕着大数据的存储、计算、分析、展示、安全等各个方面,构建了一个完整的大数据生态系统,如今HDFS、YARN等项目更成为海量数据存储和计算资源调度上的事实标准。


酷毙

雷人

鲜花

鸡蛋

漂亮
  • 快毕业了,没工作经验,
    找份工作好难啊?
    赶紧去人才芯片公司磨练吧!!

最新评论

关于LUPA|人才芯片工程|人才招聘|LUPA认证|LUPA教育|LUPA开源社区 ( 浙B2-20090187 浙公网安备 33010602006705号   

返回顶部