设为首页收藏本站

LUPA开源社区

 找回密码
 注册
文章 帖子 博客
LUPA开源社区 首页 IT综合资讯 查看内容

谷歌搜索产品总监:谈谷歌三大搜索创新

2011-9-13 13:57| 发布者: joejoe0332| 查看: 8823| 评论: 1|原作者: 腾讯科技|来自: 腾讯科技

摘要:   9月13日消息,Google搜索产品管理总监Johanna日前对Google语音搜索、图像搜索、Google Instant三项搜索技术进行了盘点。  以下为详细内容:  Johanna:在十年之前搜索技术本身只是说能给你找出十条蓝色的链 ...

  问:基于桌面的语音搜索是如何做到不同声音、语音的识别的?是否需要大量的语音数据上传或是一个大型的语音数据库?

  Johanna:我们在搜索上用的一项技术就是大家称之为“Big Data”(大数据)的技术。我们在之前搜集、聆听了数百万、上千万人发出的声音,人说的话。我们主要是通过电话搜集这些人不同的声音,并建立起一个非常大的语音数据库,在这个数据库当中我们会把人发出的声音和说出的话的模式进行匹配,在搜索的时候就根据你输入的语音和我们数据库当中我们发现经常出现的高频率的模式进行匹配。我们是通过Android手机,当时是推出了一个语音搜索的功能,手机用户用语音搜索的时候需要点一下麦克风的小按钮,然后对着手机说话就可以进行搜索了。我们就把对着手机发出来的声音,说出来的话收集起来了。我们确实是通过我们的用户在Android设备上做语音搜索时所输入的语音,搜集到了数百万、上千万的语音样本。

  问:我比较关心图像搜索,我知道图像搜索现在还是一个前沿技术,不知道现在Google推出的图像搜索达到什么程度了?比如说图像换一个角度,或者是照相的时候取景只取了一部分能否搜索出来?

  Johanna:其实我们做图像搜索是不是能够找到非常准确的搜索结果就取决于你想查的图像的对象在网络上出现的频率是不是非常高。我们有一个技术是网上的图像数据库,比如说一些大家非常熟悉的图像,像法国的埃菲尔铁塔,不管你从哪个角度去拍,因为网上的图像非常多,这个图像数据出现的频率非常高,我们就能够非常快的识别出来,给您提供非常准确的搜索结果。但是如果你给我们提供的图像是您的朋友或者是自己家住的房子,网上并没有出现过您的朋友或者是您的房子这种图像,我们可能就需要更多数据的累积。

  问:能否介绍一下这个背后是用的什么样的技术?怎么实现的?

  Johanna:我们的技术采用的是内容识别技术,我们之前有一个图像的数据库,有很多世界各地街道的角落,各种线条、颜色,我们就会把您上传的图像的一些模式和特点和我们现有的网络内容数据库当中的内容进行匹配,然后为您提供一个准确的答案。

  问:我问一下关于隐私方面的问题。刚才说的图像搜索,是否存在会泄漏隐私?比如说我搜索一个人脸或者是一个人的房子,内部有图片的话最终会进行匹配,最终导致隐私的泄漏?Google在隐私方面做了哪些工作?

  Johanna: Google一直以来都非常重视用户的隐私,其实我们这项图像搜索技术就是要搜索出网上非常常见的,大家经常会看到的图像,都是非常大众化的,大家非常熟知的图像,并不是要特意的挖掘某一个个人的隐私。其实我们经常会搜索到的一些图像都是大家可以看到,在网上有很多类似图像的。我们的技并不是说一定要去把一些隐藏得很深的信息、图像故意挖掘出来,故意把个人的隐私泄漏出来,并不是这样。

  问:刚才讲到Instant Pages产品的时候说是因为会判断出用户正在查找的结果然后预加载。我想这个产品怎么判断出用户就想要这个结果?后面采用了什么技术?

  Johanna:我们主要就是要用Google的相关性的技术来实现Instant Pages的功能,而且Instant Pages就是在那些你想搜索的东西是有一个单一的、最好的答案,最适合你的情况下,用的是最方便的。比如说你输入的内容是IBM,你想查IBM。适合IBM这个搜索需求最好的答案就是IBM公司的网站了,所以我们应用相关的技术就可以识别到是有一个单一的,最优的页面是最适合你、最匹配你的,就会在后台进行预加载。而且哪怕我们这个技术预测错了,预加载的内容不是你想要的界面也没有关系,你还可以去查找其他的页面。

  问:刚才一直强调说在Google Chrome用Instant Pages,我想知道这个技术和浏览器有什么特别的关系吗?浏览器是不是需要做特别处理才能进行这些技术的使用?

  Johanna:其实用户自己不需要做任何特殊的处理,我们这个Instant Pages功能已经内置到Chrome浏览器当中了,就是在Chrome浏览器当中已经内置了一个预加载的功能。同时,我们的Chrome浏览是一个开源的浏览器,所以其他的浏览器厂商的开发人员可以选择用我们的代码,也可以在他们的浏览器当中实现这个预加载的功能。目前还是只有Chrome浏览器上面具有这个Instant Pages的功能。

  问:我刚才听介绍说Google Instant在中国还没有推出相关的服务,我想问一下大概什么时候推出?在中国没有推出的原因是什么?是因为中国的网站和网页基础架构大不相同吗?

  Johanna:现在Google Instant在中国还没有推出,主要就是因为Google Instant技术是需要和Autocomplete这个技术一起来配合使用的。Autocomplete这个技术就是在搜索框当中输入内容的时候,一边输入它一边预测,搜索框就会自动的跳出来一个菜单,上面列出来已经猜测出来你可能会需要找的内容。现在在中国我们还没有办法实现Autocomplete这项功能,在未来我们在中国能够推出Autocomplete功能的时候就可以推出Google Instant了。还有一点我想补充一下,中国的用户在Google.com上用简体中文进行搜索的话是可以使用Google Instant这个功能的。

  问:包括Google Instant和之前说的图像搜索,都是根据大部分需求,就是网上有很多搜索的情况来做的选择。如果有个性化需求,比如说我的需求和其他人不一样的话,Google未来会不会根据我自己的搜索习惯推出我个性化的搜索结果?或者是根据在Google+上面的数据和行为,对搜索结果做个性化的优化?

  Johanna:这个问题问出了很多问题,我一个个回答。第一点就是首先我们这个图像搜索的技术不仅仅是要看有多少人、多少用户在频繁的搜索这一个图像。我们这个图像搜索技术更多的是看在网上图像的内容出现的频率是不是非常高,网上图像的内容被搜索的次数是不是非常多。比如说网上已经有很多埃菲尔铁塔的图片了,即便以前从来没有一个用户在我们图像搜索上搜过艾尔菲铁塔,我们这个技术也能马上帮用户找到埃菲尔铁塔的图片。

  第二点就是有关个性化的搜索,对于Google的登录用户,确实我们会根据用户,比如说根据您以前搜索过的内容,根据您以前的搜索历史把搜索结果进行个性化。我们如果发现您经常频繁的搜索某一个内容,或者是频繁的点击某一个搜索结果,而且这个搜索结果以前是在网页比较下方的位置,下一次您搜索的时候我们就会把它放到网页上方的位置,这样我们就会识别出这是您经常想要找的东西。

  问:搜索引擎还是正在发展过程中,这项技术未来会向什么样的方向发展?我特别想知道Google和Bing在技术演变上有什么区别没有?

  Johanna:在我们看来,未来搜索引擎技术前景是非常广阔的,而且我们Google的愿景就是要使得搜索变得个性化、智能化和互动起来,所以未来您会看到在个性化、智能化和互动每一个领域我们都会做很多的改善,会推出很多新的功能。

酷毙
1

雷人
1

鲜花
2

鸡蛋

漂亮

刚表态过的朋友 (4 人)

  • 快毕业了,没工作经验,
    找份工作好难啊?
    赶紧去人才芯片公司磨练吧!!

最新评论

关于LUPA|人才芯片工程|人才招聘|LUPA认证|LUPA教育|LUPA开源社区 ( 浙B2-20090187 浙公网安备 33010602006705号   

返回顶部