对于普通企业的IT部门来说,每年发布两次的Top500超级计算机排行榜尽管很吸引眼球,但是对于今天的运营来说没有多大意义。宏伟的口号和目标对于大多数数据中心中的日常运行来说同样没有多大影响,比如2018年之前要达到Exaflop的性能。(快速介绍一下背景知识:FLOP是指每秒执行的浮点运算次数;Exaflop是1018即1000000000000000000 FLOP。)
尽管这样的新闻今天可能不会影响你,但是很重要,因为高端领域取得的进展会影响低中端领域。别忘了就在不久前,今天的智能手机其功能相当于一台超级计算机的功能。想一想Knight's Corner,11月初英特尔在华盛顿西雅图举行的2011年超级计算大会上展示了这款原型芯片。英特尔在这次计算机盛会上发布了这款硅芯片,起初早在6月就宣布了。虽然官方上市发售日期还没有确定,但是已经有了硅芯片产品,并进行了演示。单单一块22纳米芯片就能提供1012 FLOP的可持续双精度性能。这相当于每秒执行1万亿次运算。如果你想相对了解其规模和速度,这个信息图(http://mozy.com/infographics/when-will-we-run-out-of-space/)提供了很直观的感觉。
这不是英特尔第一次提供1012 FLOP系统了。早在1997年,它就在桑迪亚国家实验室首次展示了ASCI Red:9298个奔腾2至强处理器塞入到占用72个机柜的服务器中,服务器的耗电量高达800千瓦。想一下:今天你工作站(或者甚至智能手机)的功能与15年前的典型超级计算机一样强大。
时代确确实实发生了变化
处在另一头的是英伟达。英伟达联合创始人、总裁兼首席执行官黄仁勋(Jen-Hsun Huang)在近日的主题演讲中介绍了,英伟达如何能够充分利用超级计算机的功能:将众多工作站和大众化服务器集群起来,以获得提供所需图形功能所需要的计算功能。“其在市场低端的搅局”加大了给主流市场带来的影响,有可能实际上将超级计算机变成工作站。
当然,大多数企业介于英特尔的高端系统和英伟达的大规模集群比萨盒系统(pizza box)之间。超级计算机对它们会有什么影响呢?
耗电量仍是首要问题
你可以买到市面上速度最快、吞吐量最大的系统;你可以确保自己的服务器拥有高可用性,软件配置完全合适。但是如果你的电费超过了整个大城市的电费,那么这一切都是白搭。
随着性能越来越强大,超级计算机越来越觉得用电紧张,这在某种程度上决定了它们可以放置在什么地方。虽然这些局限性在高性能计算(HPC)环境中体现得尤为明显,但是对于核心业务取决于管理数据仓库中数据的任何公司来说,比如依赖大数据以及为大数据赋予生命的电力的那些公司,这些却是普遍性难题。
Facebook也许是这方面的最佳例子之一。当你想到超级计算机,这家公司其实并不立马浮现在脑海中;但是其核心业务围绕大数据:用户必须可以访问这些大数据,还要确保随时可用,以便用于挖掘分析。大概两年半前,该公司原先依赖的基于行业标准的服务器显然满足不了要求。Facebook的服务器和数据中心工程师Amir Michael开始负责一个项目,旨在对进入到Facebook更新颖数据中心的服务器进行定制。
这些服务器是用基于行业标准的部件做成的。从外观尺寸到造型设计,它们都遵循了更高的能源效率这个标准。Michael解释,从头开始搞自定义设计要比捣鼓现有的设计来得容易。Facebook设计的服务器有更大的散热器,因而显得比普通的1U服务器更高(由于这个原因,这些服务器还放在定制的底架和机架上)。它们还只包括必要部件。塑料边框及添加的其他花哨部分都去掉了,包括“面板”。这样一来,空气就能更轻松自如地进出。由于这些变化,风扇能够更高效地运转,因为需要输送的空气比较少。Michael解释,这将每台服务器的总能耗减少了多达10%至20%。主板也经过了调整,能源效率高达92%。
服务器层面的这些变化,加上数据中心层面的改动(比如依赖可再生能源或数据中心所在地的气候条件),有助于防止Facebook的能源成本急剧失控。
不是只有Facebook这一家公司在处理这些问题。谷歌、亚马逊及大数据对自身业务而言很关键的其他公司都在应对类似的挑战。这时,开放计算项目(Open Compute Project)应运而生,这是Facebook今年4月发起成立的开源硬件项目;到目前为止,其成员包括英特尔、华硕、戴尔、Mellanox、红帽和Cloudera。
Facebook的最新举措:定制的存储设备就是通过这个开源项目做出来的。Michael称之为“具有一些独特属性的一款通用设备。”
谷歌和亚马逊尽管不是该项目的成员,但也在充分利用定制硬件。不过与Facebook不一样,它们选择了不公开各自硬件的规格。
随着大数据对于高性能计算和社交媒体来说变得更重要,适合这些公司计算要求的硬件会变得更加重要。眼下为时尚早,无法确定定制硬件会变得司空见惯,还是原始设备制造商(OEM)会适应出现了变化的要求。
|