设为首页收藏本站

LUPA开源社区

 找回密码
 注册
文章 帖子 博客

开源发展史:Hadoop的昨天与今天

2011-7-19 15:48| 发布者: joejoe0332| 查看: 5570| 评论: 0|原作者: 存储时代|来自: 存储时代

摘要:   你了解Hadoop分布式计算平台的过去与现在吗?Hadoop是基于Java的开源软件架构,运行分布的、数据密集型应用。它能够让应用安全扩展以处理数千个节点以及PB级数据。日前,Apache透露Hadoop将脱离雅虎,由Hortonwo ...

  3、Hadoop是IBM沃森的关键部分

 

  Hadoop的分析和数据发现能力是IBM Watson计算机能够在《危险边缘》比赛中战胜另外两位人类前冠军的重要原因。

  4、最大的部署:每天200PB的数据

 

  在技术领域最大的部署环境(例如雅虎),每天Hadoop于分析超过200PB的数据,让雅虎变得更人性化,更贴近用户和客户。它与雅虎IT系统的方方面面进行协作,包括包括搜索、广告、用户体验和欺诈发现。

  5、给力的系统 应对大数据

 

  雅虎的Hadoop系统包括超过4万2千台的服务器,以及由4000台设备组成的集群,每个月能够处理超过500万份工作。每天都会有1400万份新文件进入Hadoop系统,这一切根本就是小菜一碟。


酷毙
2

雷人

鲜花

鸡蛋

漂亮

刚表态过的朋友 (2 人)

  • 快毕业了,没工作经验,
    找份工作好难啊?
    赶紧去人才芯片公司磨练吧!!

最新评论

关于LUPA|人才芯片工程|人才招聘|LUPA认证|LUPA教育|LUPA开源社区 ( 浙B2-20090187 浙公网安备 33010602006705号   

返回顶部