设为首页收藏本站

LUPA开源社区

 找回密码
 注册
文章 帖子 博客
LUPA开源社区 首页 IT综合资讯 查看内容

Databricks核心成员专访:大数据时代“智能手机”

2013-11-15 14:25| 发布者: joejoe0332| 查看: 3542| 评论: 0|原作者: 周小璐|来自: CSDN

摘要:   摘要:来自Andreessen Horowitz的1400万美元投资,以及Cloudera在2013 Strata+Hadoop大会抛出的重磅消息,使Databricks再次引起了业界关注。CSDN再次采访了Spark的核心成员、Databricks的联合创始人辛湜。  今 ...
  摘要:来自Andreessen Horowitz的1400万美元投资,以及Cloudera在2013 Strata+Hadoop大会抛出的重磅消息,使Databricks再次引起了业界关注。CSDN再次采访了Spark的核心成员、Databricks的联合创始人辛湜。

  今年4月份,CSDN曾采访过来自UC Berkeley计算机系AMPLab的博士生辛湜(英文名Reynold Xin),他是Shark的作者,同时也是Spark的核心成员(@hashjoin),如今他又多了一个新的身份——Databricks的联合创始人。Databricks可谓阵容豪华,包括了UC Berkeley计算机教授、AMPLab联合创始人Ion Stoica,UC Berkeley计算机科学教授Scott Shenker(Scott计算机历史上论文被引用次数最高的人,同时也是知名SDN公司Nicira的联合创始人及前CEO),Spark原作者、MIT教授Matei Zaharia。近期,来自Andreessen Horowitz的1400万美元投资,以及Cloudera在2013 Strata+Hadoop大会抛出的重磅消息,使Databricks再次引起了业界关注。CSDN再次采访了辛湜,向他了解了关于Spark以及Databricks的最新消息。


  以下为专访整理:


  CSDN:目前Spark的发展状况是怎么样的?未来的研究方向是什么?

  辛湜:UC Berkeley AMPLab今年把Spark贡献给了ASF(Apache Software Foundation)开源社区,Spark已经成为一个ASF项目,正式名字是Apache Spark。很多公司和机构开始利用Spark分析和提取数据,编写机器学习和图的应用等等。在中国我知道淘宝、腾讯、优酷、大众点评等互联网公司都有成功的案例。全球各地已经有接近100个开源贡献者,包括了很多身在中国的工程师。除了Hadoop MapReduce之外,Spark是用户数和贡献人数最多的大数据开源系统。Spark可能会在不久的将来超越MapReduce。



2012年10月-2013年9月Spark贡献者的增长状况


  作为一个ASF的项目,Spark的发展很大程度上是开源社区共同决定的。UC Berkeley和Databricks的团队希望未来Spark的发展重点在以下几个方面:


  • Spark Streaming:大大提高Spark流处理的能力和稳定性,使用户可以用同一套代码进行大数据流处理和批量处理。
  • MLLib:Spark 0.8里面增加的一个高质量的机器学习库。我们希望添加更多的算法到这个库里面,使得Spark成为分布式机器学习应用的标准。
  • GraphX:现在有越来越多的社交网络分析以及机器学习算法可以利用图算法来实现,GraphX是在Spark之上实现的一个图框架,可以让用户凭借短短几行代码简洁地实现多种图算法。
  • 易用性:简化安装、设置以及使用。完善Python/Java的API。我们也在考虑提供其他语言的API,包括R等等。
  • 稳定性:和用户以及开源社区合作,提高稳定性,部署更多的应用在Spark上。
  • 性能:Spark虽然在这方面上起点比较高,但是还有很大的提升空间。


  CSDN:能否介绍下Databricks的情况,您在Databricks主要的工作是什么?创业会对您的研究工作产生什么影响?

  辛湜:今年年中,我和几个AMPLab的同僚(包括Ion Stoica教授和Spark的原作者Matei Zaharia)共同创立了Databricks公司。Databricks的目标是从Spark开始,构建一系列更强大、更简单的大数据分析处理工具和平台。九月份的时候,我们正式宣布从硅谷风投Andreessen Horowitz获得A轮融资1400万美元,利用这些资金吸引人才,提高大数据生态系统发展的步伐。



酷毙

雷人

鲜花

鸡蛋

漂亮
  • 快毕业了,没工作经验,
    找份工作好难啊?
    赶紧去人才芯片公司磨练吧!!

最新评论

关于LUPA|人才芯片工程|人才招聘|LUPA认证|LUPA教育|LUPA开源社区 ( 浙B2-20090187 浙公网安备 33010602006705号   

返回顶部