5、您刚才也提及到了GreenPlum的分支下的Hadoop软件,EMC收购了GreenPlum公司,这是一家面向非结构化的数据库的软件公司,EMC围绕GreenPlum创建了EMC Hadoop和Greenplum 数据库等产品,与Oracle以及Teradata已有的加速业务分析平台形成了强有力的竞争关系。请问EMC的Hadoop与Oracle的Hadoop相比,有哪些核心的竞争优势? 据我所知,Oracle好像最近刚刚在一体机中开始支持Hadoop,它起步比较晚。我们两家公司在业务的焦点上也不太一样。以后Oracle数据库不可能适合所有的企业,不管是在云计算上,还是在hadoop上。 我们的团队也不太一样。原雅虎的核心团队组成了我们现在的Hadoop研发团队,他们是最早一批做Hadoop的。虽然雅虎最近运气不太好,他们的lost成为我们的gain。 除了团队的方面,我们实际上是存储上的老大,存储上面本身有很多CPU,我们在性能上占很大优势。 6、总结一下,我们刚才谈了很多关于What的问题,包括什么是大数据等问题,那么我们到底怎么去分析这些大数据,解决这个How的问题。将有谁来分析这些大数据。目前阿里巴巴有两百个数据分析家,您对数据分析家的前景是怎么看待的? 我如果现在上大学,我可能会朝这个方面努力,这是一个很不错、要求也很高的职业,为什么我觉得数据分析家很重要呢? 因为数据还没有进行深层次的扩展,还有很多商业价值。一方面我们工具不够,另一方面我们人不够,我们大多数还没有想到这个问题,去着手做事情。从提出问题,到解决问题,需要数学、统计学、计算机科学、数据库等综合的知识才能胜任数据分析家的角色。另一方面,做数据分析的非常多,这个vision的投资代表着未来,也就是说,像数据分析家的人群会成为数据分析的主流人群。 总之,世人眼里,EMC一直是存储老大,如今看来,EMC似乎志向更为高远,不仅硬件做到数一数二、在软件、服务、方案也是捷报频传。看来EMC由“硬”变“软”哦。相信EMC会在Hadoop以及其它软件领域一路高歌猛进、越来越好。 |