设为首页收藏本站

LUPA开源社区

 找回密码
 注册
文章 帖子 博客
LUPA开源社区 首页 IT综合资讯 查看内容

李玥:存储大数据成本高考虑多平台

2013-5-2 11:23| 发布者: joejoe0332| 查看: 439| 评论: 0|原作者: 红联Linux门户|来自: 红联Linux门户

摘要:   4月29日消息,大数据挖掘对企业来说可能并不全是机遇,还意味着财政支出,原因是针对大数据存储或者挖掘的成本也很高。在2013 Teradata大数据峰会上,LinkedIn商业分析高级经理李玥接受Sohu IT采访时表示,企业 ...

  4月29日消息,大数据挖掘对企业来说可能并不全是机遇,还意味着财政支出,原因是针对大数据存储或者挖掘的成本也很高。在2013 Teradata大数据峰会上,LinkedIn商业分析高级经理李玥接受Sohu IT采访时表示,企业投入在大数据存储上的成本并不低。因此,很多企业会同时考虑多个解决方案。

  以LinkedIn为例,该公司就同时使用了Teradata的解决方案和Hadoop的解决方案。这样做的原因在于,大部分数据的价值密度很低,如果全部使用Teradata来存储,那么成本就会很高,而Hadoop是公认的成本比较低的解决方案。

  CSDN总编刘江向搜狐IT表示,类似于Linux开源,基于Hadoop开发的公司也很多,他们可以为用户提供产品。通常来讲,Hadoop的解决方案会便宜一些。

  这就要求对涉及到大数据类工作的企业进行筛选。比如,对LinkedIn来说,其报表数据分析对公司来说尤其重要。于是,该公司绝大多数的报表在后台都是 用Teradata数据仓库来支持的。这部分报表要准时发出去给商业代表,而商业代表则要根据数据来做相关的决策,而且很多新功能也是通过 Teradata Aster大数据探索平台开发的。

   据李玥介绍,这些报表数据具有舞台效应,如果有一个延迟,后面的就会全部延迟。而在LinkedIn中,绝大多数的数据是先要从高度可靠Teradata 系统里面读出来,读到LinkedIn的数据挖掘的平台上面,然后再用已有的这些统计上的工具来进行这些数据挖掘的工作。


酷毙

雷人

鲜花

鸡蛋

漂亮
  • 快毕业了,没工作经验,
    找份工作好难啊?
    赶紧去人才芯片公司磨练吧!!

最新评论

关于LUPA|人才芯片工程|人才招聘|LUPA认证|LUPA教育|LUPA开源社区 ( 浙B2-20090187 浙公网安备 33010602006705号   

返回顶部