Apache Drill 1.0发布,大型数据集分析系统

2015-5-20 22:37| 发布者: joejoe0332| 查看: 1130| 评论: 0|原作者: oschina|来自: oschina

摘要: Apache Drill 1.0 发布，这是一个里程碑版本。此版本在 SQL-on-Hadoop上提升了安全性能，此外，它还解决了Hadoop上自助服务 SQL 查询的空缺，尤其复杂动态 NoSQL 数据类的查询。它的一大性能优势是能够访问Hadoop数 ...

Apache Drill 1.0 发布，这是一个里程碑版本。此版本在 SQL-on-Hadoop上提升了安全性能，此外，它还解决了Hadoop上自助服务 SQL 查询的空缺，尤其复杂动态 NoSQL 数据类的查询。它的一大性能优势是能够访问Hadoop数据，和 Qlik 一起使用的话，能够让用户发现更多数据方面的商用价值。

Apache Drill 在基于 SQL 的数据分析和商业智能（BI）上引入了 JSON 文件模型，这使得用户能查询固定架构，演化架构，以及各种格式和数据存储中的模式无关（schema-free）数据。该体系架构中关系查询引擎和数据库的构建是有先决条件的，即假设所有数据都有一个简单的静态架构。

Apache Drill 的架构是独一无二的。它是唯一一个支持复杂和无模式数据的柱状执行引擎（columnar execution engine），也是唯一一个能在查询执行期间进行数据驱动查询(和重新编译，也称之为 schema discovery)的执行引擎（execution engine）。这些独一无二的性能使得 Apache Drill 在 JSON 文件模式下能实现记录断点性能（record-breaking performance）。

此版本现已提供下载：

直接下载文件：http://getdrill.org/drill/download/apache-drill-1.0.0.tar.gz
Find an Apache mirror：

HTTP：http://mirror.nus.edu.sg/apache/drill/drill-1.0.0/apache-drill-1.0.0.tar.gz

Backup Sites：

更多信息请查看订阅邮件。

为了帮助企业用户寻找更为有效、加快Hadoop数据查询的方法，Apache 软件基金会发起了一项名为“Drill”的开源项目。Apache Drill 实现了 Google's Dremel.

该项目将会创建出开源版本的谷歌Dremel Hadoop工具（谷歌使用该工具来为Hadoop数据分析工具的互联网应用提速）。而“Drill”将有助于Hadoop用户实现更快查询海量数据集的目的。

Day-zero analytics & rapid application development