究竟什么是“深度学习”? 深度学习是人工智能技术朝新的研究方向迈出的第一步。简单地说,深度学习包含了构建能够模仿人类大脑行为的神经网络。这些多层次的电脑网络像人类大脑一样,可以收集信息,并基于收集到的信息产生相应的行为。这些电脑网络可以逐渐对事物的外形和声音进行感知和理解,也就是“认识”事物。 比如,为了赋予机器“视觉”,研究人员需要建立最基本的一层人工神经元,用来探知如物体的边缘形状等基本信息,第二层神经元可以将第一层感知到了物体边缘性状拼凑起来,鉴定较大块的物体形状,然后再加一层将第二层检测到的信息再拼凑从而使机器明白物体整体的形态。这里面关键的一点是,软件可以自行做到这一切——旧的“伪人工智能”往往需要工程师人工输入物体视觉或者声音的信息,然后由机器学习算法来处理这些信息数据。 吴恩达介绍,在深度学习算法之下,我们可以给这个系统很多数据,使其“自己学会世界上的一些概念”。去年,吴的一个深度学习算法机器通过扫描互联网上无数的猫的图片“认识”了猫,机器不认识单词cat,吴需要为机器输入这个单词,然后经过一段时间,机器将这种毛茸茸的小动物与单词cat联系到了一起,可以自行鉴别什么样的事物是 cat。 教机器学习的方法本身就是在模仿人类的学习机制,当我们还是婴儿的时候,我们通过观察周围,开始认识我们接触到的事物,但是如果父母不告诉我们一样东西的名字是什么的话,我们自己无法知道。 当然,吴恩达的深度学习算法目前还比不上人脑的精确性和灵活性,但他说,那一天会到来的。 从谷歌、中国到奥巴马政府,谁在研究深度学习? 吴恩达不是一个人在战斗,深度学习已经是计算机科学发展的大势所趋。2011年,吴在谷歌内部领导建立了Google Brain项目,最近几个月,谷歌在深度学习领域的投入明显加大,收购了加拿大多伦多大学教授杰弗里·辛顿(Geoffrey Hinton,人称“神经网络研究教父”)创建的人工智能机构。中国搜索巨头百度也建立了深度学习实验室,誓要在深度学习领域投入大量资源。吴恩达称,其他科技巨头公司如微软和高通也都开始招聘于聘请更多研究“基于神经科学的计算机算法”的科学家。 与此同时,日本的工程师开始构建控制机器人的人工神经网络,南非神经科学家亨利·马克曼(Henry Markman)正与来自欧盟和以色列的科学家们合作,希望能利用数千次实验得到的数据在一台超级计算机中模拟出人脑。 研究的困难仍在于我们无法完全掌握人类大脑的工作原理,但科学家目前在这方面进展飞速。中国的科学家正在研究一个新的大脑图谱,他们将之命名为“脑网络穹顶”(Brainnetdome)项目。在美国,随着奥巴马政府宣布将支持筹建一项跨学科的科研项目“基于神经科学技术创新的人脑研究”(Brain Research Through Advancing Innovative Neurotechnologies Initiative,简写为BRAIN项目,该项目也在美国社会引发了许多争议),许多类似的项目正雨后春笋般得涌现,“大神经网络时代”(Era of Big Neuroscience)已经到来。 BRAIN项目筹备委员会上周末召开了第一次会议,本周还将展开更多的项目筹备工作。 BRAIN项目的目标之一,是为绘制大脑复杂回路图开出所需的新技术,种种迹象表明,BRAIN的工作重心就是人工智能。美国政府对BRAIN项目拨款的 1亿美元中,一半来自美国国防部高级研究项目局(Defense Advanced Research Projects Agency,简称Darpa),超过了美国国立卫生研究院(National Institutes of Health , NIH)的拨款数,美国国防部研究部门称,希望 BRAIN项目能够“催生新的信息处理架构或者计算方法”。 如果我们能够搞清楚人类大脑成千上万的神经元如何互相连结以及中枢神经系统存储和处理信息的原理,那么像吴恩达这样的工程师对于“人工大脑”的设想就能够更加清晰,对于人脑的研究成果和数据将能购帮助深度学习算法的研究,也能加速诸如计算机“视觉”、语言分析,以及苹果和谷歌等公司为智能手机提供的语音识别等技术的发展。 “所以我们要学习生物生存使用的技巧,问题的关键在于生物将秘密隐藏得太深了。”加州大学伯克利分校计算神经科学家布鲁诺·奥尔斯豪森(Bruno Olshausen)感慨道,“我们还没有掌握这些秘密所需要的工具。” 未来:得人工智能者得天下 随着移动设备的崛起,“破解人类神经密码”愈发迫在眉睫。由于设备越来越小,我们需要它们运算更快、更准确。然而,随着电子设备的基础元件晶体管的尺寸不断缩小,将它们变得更精确更高效的难度也越来越大。比如,想要加快设备的运算速度,需要给设备提供更多电能,但更多电能会让设备的运算系统更“嘈杂”,也就是说,它得运算精确度会下降。 奥尔斯豪森介绍,目前工程师们智能通过避开问题核心的方式来应对上述问题,力求在设备大小、运算速度、能耗之间取得平衡,而人工智能技术对此则能提供更好的解决方案。“生物科学能让我们直面问题的根本所在,生物内部的转换机制也是天生‘嘈杂’的,但其找到了一个办法来适应和忍受这些干扰噪声甚至对之加以利用。如果我们可以搞明白生物内部应对这些杂音的方法,我们就能开创一套截然不同的计算模型”。 科学家的目标并不是将计算设备变得更小,他们的目标是让计算机能够做到的事情更多。不管背后的算法多么复杂,目前的计算机无法帮助人类去杂货店购买物品,或者帮助人类挑选适合的衣服、钱包,处理这样的事情,计算机需要添加更高级的图像智能识别技术以及像人类一样的注意力和记忆力,如果能够实现这一点,那么计算机能够处理的事情的想象空间将变得无穷大。 “全世界都意识到,如果你可以解决这些问题,人工智能领域存在的无限商机就会被打开。” 奥尔斯豪森预测。 而驱使谷歌、IBM、微软、苹果、百度这些公司竞相开发高级机器学习技术的原因,正是其背后蕴藏的巨大商业潜力。纽约大学教授、深度学习领域的专家燕乐存(Yann LeCun)教授预测,两年内,将出现大量的机器学习领域的初创公司,其中很多可能会被大公司收购。 虽然最优秀的工程师一般不会同时是人类大脑研究的专家,但如今对于计算机科学领域的工程师来说,掌握一些神经科学的知识可能成为巨大的优势。“我们需要与神经科学领域的科学家更加紧密的合作,”百度的于凯(音译)表示,于凯正在考虑招聘一名神经科学领域的科学家,“我们已经在与他们合作,但是我们做得还不够。” 吴恩达的梦想正在照进现实。“我有了希望,不只是希望,我们可能能够实现真正的人工智能,”他说,“我们当然还没有找到正确的算法——这可能需要长达几十年的时间,要实现它很不容易,但我看到了希望。” |