Apache Drill 1.0 发布,这是一个里程碑版本。此版本在 SQL-on-Hadoop上提升了安全性能,此外,它还解决了Hadoop上自助服务 SQL 查询的空缺,尤其复杂动态 NoSQL 数据类的查询。它的一大性能优势是能够访问Hadoop数据,和 Qlik 一起使用的话,能够让用户发现更多数据方面的商用价值。 Apache Drill 在基于 SQL 的数据分析和商业智能(BI)上引入了 JSON 文件模型,这使得用户能查询固定架构,演化架构,以及各种格式和数据存储中的模式无关(schema-free)数据。该体系架构中关系查询引擎和数据库的构建是有先决条件的,即假设所有数据都有一个简单的静态架构。 Apache Drill 的架构是独一无二的。它是唯一一个支持复杂和无模式数据的柱状执行引擎(columnar execution engine),也是唯一一个能在查询执行期间进行数据驱动查询(和重新编译,也称之为 schema discovery)的执行引擎(execution engine)。这些独一无二的性能使得 Apache Drill 在 JSON 文件模式下能实现记录断点性能(record-breaking performance)。 此版本现已提供下载: 直接下载文件:http://getdrill.org/drill/download/apache-drill-1.0.0.tar.gz HTTP:http://mirror.nus.edu.sg/apache/drill/drill-1.0.0/apache-drill-1.0.0.tar.gz Backup Sites:
更多信息请查看订阅邮件。 为了帮助企业用户寻找更为有效、加快Hadoop数据查询的方法,Apache 软件基金会发起了一项名为“Drill”的开源项目。Apache Drill 实现了 Google's Dremel. 该项目将会创建出开源版本的谷歌Dremel Hadoop工具(谷歌使用该工具来为Hadoop数据分析工具的互联网应用提速)。而“Drill”将有助于Hadoop用户实现更快查询海量数据集的目的。 数据结构: 兼容已有的 SQL 环境和 Apache Hive: |