谷歌在今年2月22日宣布,他们的Cloud Dataproc服务——一个全面的管理工具,基于Hadoop和Spark的开源大数据软件,现在可以被广泛使用。 这些服务支持MapReduce 引擎服务,用Pig平台编写的程序以及Hive数据仓库软件。该服务首先在去年9月份进行了测试,而且谷歌已经加强了该工具。 谷歌产品经理James Malone在博客中写道:
这个工具补充了一个专为批处理和流处理而设计的Google Cloud Dataflow的单独服务。该服务的基础技术已进入Apache孵化项目。 现在,谷歌Cloud Dataproc可供任何人使用,每个虚拟处理器一小时仅需要一美分。谷歌云已经具备了和AWS、Microsoft Azure和 IBM 公有云一较高下的能力,这三大厂商都已经拥有大数据服务。 与此同时也有其他创业公司提供Hadoop as a service。但这个服务区别在于Cloud Dataproc可以和谷歌其他的云服务无缝对接,例如Google Colud Storage、Google Cloud Bigtable和BigQuery。 |