Hive是一个基于Hadoop的数据仓库平台,它是SQL-on-Hadoop框架的代表项目。但是它在处理交互式查询的速度一直不够快。今年4月,Hortonworks完成了Stinger项目的目标,不仅改进了Hive的功能,还将其性能提升了100倍。 9月3日,Hortonworks宣布开始下一阶段的工作,即Stinger.next,以便进一步扩展其功能及提升其性能。它将要实现的一些关键特性可以使Hive满足新的业务应用场景,包括:
Stinger.next计划用时18个月,将分三个阶段交付。事务支持将于2014年底发布,亚秒级查询将在2015年上半年推出,而对SQL:2011 Analytics的全面支持则将于2015年底完成。 此外,Hive还将与机器学习框架Spark集成,使用户可以通过Hive运行机器学习模型。除了上述特性外,Hive还将获得如下增强:
而据Gigaom报道,Stinger.next的成功对于许多公司而言将不是个好消息,因为他们已经投入了大量的人力和财力,用于构建自己的SQL-on-Hadoop引擎,其中包括Cloudera Impala、IBM Big SQL、Pivotal Greenplum等商业产品,以及由Salesforce.com-built构建的Apache Phoenix和由MapR主导的Apache Drill等开源产品。Apache Spark社区也正在开发自己的交互式SQL引擎。虽然Cloudera联合创始人兼首席战略官Mike Olson认为Impala比Hive要快得多,但是,对于已使用Hive多年的用户而言,功能不断扩展、性能不断提升的Hive将非常有吸引力。 另一方 面,Hortonworks声称,他们的关键合作伙伴,如Microsoft、Informatica、Microstrategy和Tableau都将 加入Stinger.next计划。Hortonworks将继续在速度、规模和SQL语义方面对Hive进行扩展。 |