100%开源是Hortonworks Hadoop的核心 目前市面上Apache Hadoop的发行版数量繁多,Hortonworks如何能在竞争中脱颖而出? Jeff认为,Hortonworks Hadoop区别于其他的Hadoop发行版(如Cloudera)的根本就在于,Hortonworks的产品均是百分之百开源。据了解,Hortonworks是一家完全支持开源的公司,其所有的代码都会回馈给Apache Hadoop项目。Jeff在采访中大胆预测,到2015年,全球将有一半的数据是通过Apache Hadoop来处理的,Hadoop将会是未来大数据的平台。作为一家致力于创建与推进开源Hadoop的企业,Hortonworks的使命便是为大家提供100%开源的Hadoop平台。只要是Hortonworks的平台,那一定是开源的,而且是对全球来说都是开源的,这样也能使得未来任何一个合作伙伴和供应商都在开源平台上进行合作。此外,Hortonworks对专有代码的依赖也低于Cloudera,因此用户不必担心“厂商锁定”问题。 除了专注于开源,Hortonworks还对Apache Hadoop进行了大量的投资,致力于使其成为企业级的大数据平台,同时公司鼓励生态系统的开发商能够提供更多的生态系统来支持Hadoop平台。广泛的合作伙伴支持可谓是Hortonworks的另一大成功要素,在这其中最受关注的合作方则非“微软”莫属。作为微软的战略合作伙伴,Hortonworks借助自己在此领域的专长,帮助将Hadoop最大化集成到微软的产品之中,在Apache Hadoop上实现搭建Windows Server以及Windows Azure平台。据悉,去年6 月,Hortonworks与微软正式发布了基于Hadoop 的大数据分析平台HDP(Hortonworks Data Platform)。而Windows版Hortonworks 大数据平台HDP也已于今年二月正式发布,这标志着Hortonworks的大数据分析技术能同时应用于Linux 与Windows 两大平台。 据Jeff介绍,除了微软,Hortonworks还拥有140多个技术合作伙伴,如Teradata和Rackspace等都建立了各自的Hadoop产品线,这些都是基于Hortonworks的数据平台。 不过对于广大的Hadoop技术爱好者而言,快速地学习并掌握Hadoop这项技术并非易事。对此,Jeff则强烈建议IT极客们使用Hortonworks的Hortonworks Sandbox辅导教程。他表示,对于寻找解决大数据问题方法的软件架构师,以及正在学习新技术的应用开发人员来说,Hortonworks Sandbox是一个很好的初始课程。在Sandbox中,Hortonworks提供了大量的实用在线培训课程,包括如何使用Apache Pig、Apache Hive和最新的HDP发行版来处理数据等等。据了解,Hortonworks Sandbox可在VirtualBox,VMware,Hyper-V三种虚拟环境中运行,更给力的是,该Sandbox教程完全是免费的,点击进入Hortonworks Sandbox页面。 作为本次Hadoop大会的演讲嘉宾之一,Jeff Markham先生对大会充满期待。在他看来,越来越多的企业开始重视数据分析服务,这预示着Hadoop在全球以及亚太市场即将迎来爆发式增长。他希望这次大会能为参会者带来最新的Hadoop技术发展趋势,届时他将为大家带来Hadoop 2.0和YARN的最新消息和Hadoop未来的发展方向与亮点,将Hadoop2.0旋风带至中国,让我们拭目以待! 据悉,Hadoop中国技术峰会2013是国内基于Hadoop平台的第一次全产业链的大数据行业技术峰会,大会将围绕Hadoop生态系统展开全方位的技术分享、专题讨论与成果展示。大会议题将涉及以下七大方面:Hadoop技术创新、Hadoop基础架构部署与优化、虚拟化与Hadoop、Hadoop在互联网领域的应用、Hadoop在非互联网行业的应用、Hadoop与企业现有IT架构的整合、大数据创业与投资。 |