近日Hortonworks发布了Windows版数据平台(HDP),为ApacheHadoop带来了另一种大数据的运行方式。在之前的2月份此平台还处于测试阶段。我们知道Apache Hadoop大都运行在Linux服务器上,HDP为Windows提供了原生的支持,使得Windows服务器上获得了与Linux服务器同样的效果。此外Hortonworks宣称,他们的平台是100%开源的,不会像一些Hadoop的案例那样。 微软与Hortonworks在HDP上的合作,将会为Windows开发更多的产品。Hadoop是Apache的一个开源项目,主要由 Yahoo负责开发,之后Yahoo的Hadoop团队成员也会加入到Hortonworks当中。因此微软与Hortonworks的合作,将会更好的支持企业在混合环境中使用Hadoop。 这种合作也为微软的大数据智能工具开辟了新的道路。在微软的PowerPivot Excel和Power view SharePoint上都可以用以显示Hadoop的查询结果。Hadoop是一个开源的MapReduce架构,它支持横向扩展的数据处理,在集群中可使用堆栈的非结构化和结构化数据,允许临时查询运行。因此理论上微软更容易使数据和增长分析图形化。微软曾与Apache软件基金会的开放数据库连接,来驱动Hive。并用Hadoop的数据仓库系统支持他的商务智能工具。 当然系统中心也集成了一些Apache Ambari的优点;允许系统中心管理Hadoop集群和一些其他的计算设备。除此之外基于Web的Ambari工具,用于安装、监控和管理Apache Hadoop集群。 可以预见的是微软将使用HDP的能力用于自己Windows Azure的HDInsight服务上,微软的这一做法,相信也是想让使用HDP的用户,在微软基于云计算上的Windows Azure Hadoop运行时,体验到无缝连接,微软的HDInsight服务器也是微软自己运行Hadoop的服务器。 微软的Windows Azure HDInsight服务目前还处于测试阶段。但在一次与Andrew Brust的对话中得知,这项服务将会在今年夏季发布。他指出微软仍需要完成一些工作,使其的装备速度能为企业所使用。 Hortonwork的HDP Windows 1.1产品可点击此处下载,当中包含了Hadoop的一些组件像Pig、Hive和Sqoop。HDP Windows 1.1可运行于Windows Server 2008或者Windows Server 2012上。 |