5月29日消息,在今年的谷歌I/O开发者大会的会场上,你可以看到很多人都佩戴了谷歌眼镜,但只有少数幸运者戴着“验光版”的谷歌眼镜——它拥有正常的眼镜框。可以矫正视力的镜片。这些幸运者中就有乔治亚理工学院教授萨德·斯特纳(Thad Starner)。2010年,斯特纳被传说中的谷歌XLab招募,参与当时还属绝密的谷歌眼镜项目。 作为这个团队的技术领导者,斯特纳在谷歌眼镜的开发过程中起到了至关重要的作用。以下是科技媒体Engadget 对他的采访: 斯特纳1990年时提出了“增强现实”(augmented reality)这个术语。在可穿戴技术方面,他有20年的丰富经验。在我们的采访中,他从一个难得一见的角度,介绍了这种技术的发展和未来走向。 斯特纳说,在过去的20年里,他几乎每天都穿戴着某种形式的计算设备。在成为乔治亚理工学院的助理教授之前,他创立了麻省理工学院的可穿戴计算项目。那些年里,他结识了两位名为拉里·佩奇(Larry Page)和谢尔盖·布林(Sergey Brin)的研究生。他们一起讨论过搜索的前景以及可穿戴设备在那个世界中的位置: “我们谈到,如果你可以就在眼球前面进行web搜索,你将会变得多么强大……但问题之一,就是打造一个足够好的搜索引擎,搜索到的前4个链接里,就有正确的结果。而使用AltaVista搜索引擎,正确的结果藏在前14个链接中。这也太多了,翻看起来很不方便。” 之后他们各奔东西,斯特纳继续完善他的可穿戴设备原型,而佩奇和布林创建了谷歌搜索引擎。大约十年之后,斯特纳认为大家重新联系的时机到了: “大概在2010年,我给谢尔盖发了一封邮件,说‘既然你们正在搞Android和智能手机这样的东西,你真的应该了解一下可穿戴计算技术,我们一直致力于在学术界开发这种技术,不如你来趟亚特兰大,我给你详细讲讲?’接下来发生的事情,就是我坐上飞机,去了谷歌总部,加入了谷歌眼镜团队。其实他们的想法跟我一样。时机已经成熟,接下来我就开始参与谷歌眼镜的早期原型开发了。” 增强现实和AR “增强现实”是斯特纳在1990年提出的一个术语。实际上,斯特纳当时更想用“人工现实”(Artificial reality)这个词,但是蒂莫西·利瑞(Timothy Leary)已经在用它描述药物诱发的状态了,所以他退而求其次,使用了“增强现实”这个词。斯特纳用它来描述“一种用技术来增强的生活”,跟我们通常认为的AR大不相同。我们一般用AR来形容Layar浏览器这样的东西。 斯特纳说的增强现实指的是“当你在做其他事情时,你可以使用的相关信息。”他说:“从某种意义上说,你在地图上的位置就是增强现实。知道什么样的餐厅在附近就是增强现实。”我们通常说的AR是增强现实的一种扩展,名为“注册图形”(registered graphics)。系统可以使用AR方式,把你在三维空间中的位置以及朝向了解得一清二楚,并利用这些信息来虚拟绘制出周围的信息。 对于很多用户来说,这就是可穿戴技术的圣杯:完全浸入式的体验,虚拟显示的东西可以随心所欲地出现和消失;你在现实世界中的认识的每个朋友,头上都漂浮着虚拟图标,你可以根据悬浮在空中的绿色箭头的指引,找到要去的地方。对于斯特纳来说,这种应用的吸引力远不如他所说的增强现实:那是一个可以在你需要的时候迅速提供信息,然后同样迅速地消失的系统: “人们还没有意识到增强现实的重点:它的意义不是全视场(full-field-of-view)的注册图形AR体验。 拥有某种你可以与之微交互的东西,这种体验更加精彩得多。谷歌眼镜的全部意义就在于此,它让你可以整天都获得这些微交互。我们做的事情就是提供界面,让人们增强自己的眼睛、耳朵和心智,但却不会深陷在虚拟的世界中。” 增强记忆 实体很重要,他继续说:“设备及其界面的有形特质很重要,我讨厌放弃有形的界面……有一个实物,人们可以看到它,使用它,这是一件十分重要的事情。” 通过这种方式,谷歌眼镜已经在AR前沿阵地上占据了有利位置。但斯特纳认为,这只是可穿戴设备的三个关键方面之一。1993年时,他在的一篇名为《即将到来:一半是机器,一半是人类》的文章中提到了另外两个关键方面。 首先是增强记忆(augmented memory),它指的是一种能力,一种查找以前知道但可能已经遗忘的信息的能力。在这个方面,斯特纳的主要侧重点是交谈的记忆。“你可以找到你学过的东西,找到你的日常对话,这样你就可以把它们用在教学上,这是非常有价值的事情,”他说;“这让教授们显得更加聪明——如果你是一名教授它对你很有用处!” 斯特纳用一个名为“追忆代理”(Remembrance Agent)的系统进行了简略的演示,他的各种可穿戴设备上都安装了这个系统。这实际上行一个巨大的文本缓冲区,存储着斯特纳说的、想的,值得录入的东西。通过这个系统,他可以快速方便地使用单手键盘(名为Twiddler, 尽管是单手键盘,斯特纳每分钟可以输入130个英文词,对此他颇感自豪)进行搜索。斯特纳可以搜索自己几十年来的记录,效果不算太好,但有潜力可挖,他说: “我说的东西录入到了文本缓冲区中,然后它会自动搜索我之前的历史,寻找相关的东西。大多数时候,它找出来的东西都不重要,但有5%的时候,它可以找到真正相关的东西。只需要看到短短一行字的小结,我就能想起整个事情的要点。就像这样,它唤醒了我的记忆。电脑善于召回记忆,不善于识别东西。人则恰恰相反。” 集团智能 斯特纳把第三个关键称之为“集团智能”(intellectual collectives),从某些方面来说,它是三个关键方面中最复杂的一个。“集团智能”涉及到社交网络 ——不是类似于Facebook或Google+那样的,而且更加专注于实时信息共享和协作。换句话说:它们提高而不是削弱了人们的生产力。 斯特纳举了个例子:谷歌眼镜团队在面试求职者时,由面试官和求职者进行一对一的面对面交谈,其他团队成员则远程观看面试过程,并建议面试官提出哪些问题,面试官再就这些问题跟求职者交谈。这听起来好像让面试官很分心,但斯特纳说,事实并非如此: “集体交谈的内容侧重在你正在进行的谈话上,所以不会喧宾夺主。如果你想一边读电子邮件,一边跟求职者谈话,那么你的智商会下降40个点。如果你一边跟求职者谈话,一边做笔记或做跟面试相关的其他事情,就不会有什么影响。” 采用这种方式,整个团队都可以参与面试,而无需实际到场。求职者无需面对很多个提问者,而只是从一个人那里听到所有人想提的问题。这听上去可能有点让人紧张,但采用很多公司的标准面试程序,求职者会先后去好几个办公室,一遍又一遍地回答同样的问题。采用这种方法显然效率更高。 斯特纳还举了一个例子,当他在美国国家科学院(National Academy of Science)介绍可穿戴技术的时候,头上就戴着一台这样的设备,他打开了一个聊天室,让乔治亚理工学院学生参与演示。这些学生们观看了来自斯特纳的流媒体直播视频,并通过聊天室为他提供信息,同时也提出问题。 而这一切也通过一个更大的显示屏,展示给了到场的与会者。一开始,只是学生在斯特纳的演示过程中提供信息并提出问题。后来,现场与会者也开始直接与学生们对话,而学生全都不在现场。“集体智能”通过这种方式得以实现。 谷歌眼镜能做到这一点吗?当然可以,斯特纳说,但他认为谷歌眼镜在这方面不具有优势: “这得由学院人士来做。是否有商业价值是一个关键。当你开发谷歌眼镜那样的东西时,需要有明确的重点,明确的用途,还得把它做得精致迷人 —— 但是当我大学里的朋友们拿到学院风格的硬件时,会把它们派上一些非常有趣的用场。” 这是一条界限,把斯特纳在可穿戴技术方面的丰富经验,跟以后的谷歌眼镜及其他衍生工具设备划分开来。在学术环境中,你可以背着一大包电路板,戴着一副沉重的大眼镜,并不断地调整它在你鼻子上的位置。毕竟你在搞科研,大家都能理解。 一旦涉及到商业界,标准就变高了,你必须创建一个有利可图的、蓬勃发展的生态系统,让普通世界里的普通人能够利用它。设备的尺寸必须缩减,界面必须非常直观,使用起来必须简单有效。从科研工作者的角度来看,是碍事的限制条件。从工程师的角度来看,这是必要的挑战。从消费者的角度来看,事情必须是这个样子。 从某些功能来看,目前的谷歌眼镜还比不上斯特纳数年前穿戴过的设备。当然,真正的问题是谷歌眼镜能否产生足够大的吸引力,最终让可穿戴设备变成主流?结果如何还有待观察,但如果它真的做的了这一点,请记住:在它变得炫酷之前,斯特纳早就戴过它了。 |