设为首页收藏本站

LUPA开源社区

 找回密码
 注册
文章 帖子 博客
LUPA开源社区 首页 业界资讯 开源资讯 查看内容

Teradata Aster在Hadoop和R上的进展

2014-8-19 11:56| 发布者: joejoe0332| 查看: 2816| 评论: 0|原作者: 郭雪梅|来自: CSDN

摘要: 刚刚宣布放宽计算及内存限制,Aster提供R语言分析能力之后,Teradata迅速出手,宣布由Teradata实验室收购了Revelytix和Hadapt。前者主要致力于Hadoop上的数据管理,而Hadapt则是一家专注SQL-on-Hadoop的公司。显然, ...


  在Hadoop基础上进行创新并不鲜见。但能够在企业级市场拥有如此多引擎的并不多。Aster的优势就在于此。以Aster SQL-Graph引擎为例,相比Hadoop Giraph或者Google相关产品,Aster SQL-Graph的优势在于:


图并行架构
通用目标的BSP 框架
无内存绑定,高可扩展
易于开发使用的APIs
面向顶点编程的API
构建用户自定义图函数的SDK 和 IDE
预定义的图函数
开箱即用的函数,适合图并行执行
和现有平台集成能力
和Aster关系存储、文件存储、外部数据源的
数据一起工作
和其它分析引擎集成 (SQL, SQL-MR)
其它企业服务


突破开源R语言的限制

  不止如此,Aster对R的支持已经进入企业级标准。这与趋势相符。Rexer Analytics咨询公司调查显示,70%的调查对象称他们正在使用R语言。数据显示,从2010年开始到2013年,使用R的人群是陡然剧增的


  但R也有不得不面对的挑战。如R分散于各节点或各服务器,各节点或各服务器单独运行,尽管有利于行的独立分析处理,例如模型评分,但并不利于分析功能所需要的所有数据,例如模型搭建等。要突破开源R语言的限制,整合Aster和R,实现企业级分析需求,需要更多技术优化:

  • 通过Aster MPP架构运行开源R语言,实现高效并行分析
  • 放宽内存及数据处理限制,保证大规模并发
  • 利用Aster Discovery Portfolio功能增强R语言分析能力
  • 通过整合超过100项 Aster Discovery Portfolio分析功能和 5000多种R工具包


  孔宇华表示:“Teradata Aster R以软件数据包形式,实现开源R语言的大规模并发,这对数据分析人员而言,更具优势。”


  从Hadoop中读取数据,在Teradata数据仓库或Teradata Aster数据库中智能地运用多种异构处理引擎的功能进行数据分析,形成可视化报告,进而带动业务洞察和创新。这个技术架构已经极为流畅,对Teradata而言,更重要的挑战是如何尽快在更多行业落地,驱动数据分析变革。


酷毙

雷人

鲜花

鸡蛋

漂亮
  • 快毕业了,没工作经验,
    找份工作好难啊?
    赶紧去人才芯片公司磨练吧!!

最新评论

关于LUPA|人才芯片工程|人才招聘|LUPA认证|LUPA教育|LUPA开源社区 ( 浙B2-20090187 浙公网安备 33010602006705号   

返回顶部