Google Brain:重建谷歌帝国的人工大脑

2014-7-21 15:09| 发布者: joejoe0332| 查看: 2874| 评论: 0|原作者: toolate|来自: 伯乐在线

摘要: 　　这是互联网上最无聊的工作之一，一队谷歌员工日复一日盯着电脑屏幕，审查着一张张街景图片，不断的问自己：“我看到的是个地址吗？” 然后点击Yes，点击Yes，点击No。　　这就是谷歌公司地图服务构建工作中极其 ...

人工智能即服务

　　2011年，谷歌大脑项目启动，这只是个内部代号，不是官方称谓，当时斯坦福大学的吴恩达教授加入了谷歌公司具有“探月”意义的Google X实验室团队，来进行深度学习的实验。一年之后，谷歌将安卓语音识别错误率令人惊叹地降低了25%。不久，谷歌开始将它所能找到的深度学习专家全部招致麾下。去年，谷歌请来了世界上最著名的深度学习专家之一的杰夫·辛顿（Geoff Hinton）。接着又在一月，耗资4亿美元收购了颇具神秘色彩的深度学习公司DeepMind。

　　利用深度学习技术，计算机科学家建立软件模型可以在一定程度上模拟人类大脑的学习模型。然后，这些模型可以用大量的新数据进行训练，不断微调，最终应用到全新的任务中去。举个例子，谷歌图像搜索建立了一个图像识别模型，它也可以帮助谷歌地图团队解决问题。为谷歌搜索引擎建立的文本分析模型也可以为Google+所用。

谷歌大脑可以看懂的街景图像示例。

请参见之前的两篇报道：《新算法让谷歌街景和reCAPTCHA技术更加智能了》、《谷歌的机器视觉技术已成功破解自己的CAPTCHA》

　　谷歌在公司内部网上建立了几个AI模型，而迪恩和他的团队编写了后端软件，使得谷歌的服务器群能处理这些数据并将结果显示在软件界面上，让开发者可以看到他们AI代码的运行情况。迪恩说：“看起来就像是个核反应堆的控制面板。”

　　而有些项目，如安卓语音识别，杰夫·迪恩的团队就需要进行一些大改动以使机器学习模型能适应手头的任务。但也许，使用谷歌大脑软件的队伍中有半数都只是简单的下载源代码、微调配置文件，接着就把数据输入到谷歌大脑中。迪恩表示：“如果你想要在这一领域做前沿研究，并超越现有的技术，为新问题建立合适的模型，那么你必须要在机器学习领域接受过多年的训练。但是如果你只想应用一下这个技术，而你要处理的问题和深度模型已解决的问题有点类似，那么，人们已经用它取得了很大的成功，你也无需是个深度学习专家。”

新版MapReduce

　　这样的内部代码共享也对另一项谷歌领先的技术MapReduce产生了重大影响。十年前，迪恩作为团队一员编写了MapReduce，使它成为了利用谷歌数以万计服务器的可行之路，并训练它们来解决如为万维网建立索引这类单一问题。MapReduce的代码最终在内部公开，而谷歌思维敏捷的工程师们就想出了如何训练它来解决新的大数据计算问题的方法。MapReduce背后的思想最终写成了开源项目Hadoop的代码，将谷歌曾经独享的超强数据处理技术拱手献给世界。

　　随着谷歌宏伟的人工智能项目细节不断流出，谷歌大脑也许最后也会成为开源项目。今年一月，谷歌发表了一份关于谷歌地图的论文，考虑到谷歌有分享其研究成果的记录，很可能有更多的论文将会发表。

　　考虑到深度学习算法要解决的问题范围非常广，谷歌与迪恩以及他团队的代码还有大量工作要做。他们发现，使用的数据越多，这些模型就会变得更精确。那也许是谷歌下一个宏大目标：建立十亿级数据点的人工智能模型，而不是百万级的。就像迪恩所说的：“我们正在尝试将可扩展性推进到下一个级别，可以训练准确的、真真正正的大数据模型。”

原文链接： ROBERT MCMILLAN 翻译：伯乐在线 - toolate
译文链接： http://blog.jobbole.com/73825/