论文部分内容阅读
近日,国外一则关于谷歌的消息引起广泛关注。报道称,谷歌将在数月内对其搜索引擎进行“有史以来最大的改动”,今后的搜索结果呈现的不仅是一系列网络链接,还将在页面顶部展示更多的“事实和直接答案”。
消息进入国内后,一些舆论的反应也非常有趣,其中一个下意识的举动,就是将谷歌与当前国内搜索引擎的代名词——百度进行比较。他们的结论是:谷歌的下一代搜索引擎理念是让用户需求在搜索的呈现页面即被满足,而不必进行二次点击进入相关网站,这与百度力推的“框计算”类似。因此,这一次谷歌是“山寨”了百度的模式。
如果这是事实,当然值得高兴,遗憾的是,经过仔细比对之后,就会发现谷歌的“下一步”与框计算存在本质的差异:百度追求的是信息应用的聚合,而谷歌则专注于将信息转化为“知识”。
笔者曾经采访过谷歌搜索引擎科学家阿米特·辛格哈尔,他表示现在的搜索引擎已经将“数据转化为信息”做得足够好,比如键入“青海湖”进行搜索,你就能获得几乎所有关于青海湖的信息。“但是,用户的需求不止于此。未来的搜索结果体现的应该是‘人对世界的理解’,是真正的‘知识引擎’,而不是将一堆信息扔给用户去挑选。”
身为谷歌负责搜索引擎技术研发的高管,阿米特·辛格哈尔这段对于未来搜索技术的描述,应该可以被认为是谷歌下一代搜索引擎将要解决的事情。举例来说,当用户键入“中国最深的10个湖泊”,如果是当前基于“爬虫”系统进行字符串匹配的搜索引擎,返回的结果很可能解决不了这个问题,除非有人曾经统计过这个问题,并上传到某个页面上。而在新一代的“知识引擎”中,用户键入相同的字符串或许就能直接在搜索页面上得到想要的答案。
很显然,这样基于理解语义的搜索引擎需要将前端用户的搜索请求与后端数据库内海量的“Entity(实体)”进行匹配,包括人物、时间、地点以及它们之间的关联性,也需要从搜索算法结构层面进行大量的改进。而以谷歌一贯的“极客”企业文化来看,新一代搜索引擎也应该体现在算法本身的改进。
再看百度的框计算,其理念是打造一个开放的生态系统,拉拢合作者在其中投放应用,再利用百度的搜索引擎进行流量导入、推广,“所搜即所用”,进而为用户提供一站式服务。综上所述,框计算使用的还是字符串匹配的形式,并未从根本上改变搜索算法本身,而只是将搜索引擎这一工具平台化了。
所以,说谷歌要做框计算,无从谈起。
消息进入国内后,一些舆论的反应也非常有趣,其中一个下意识的举动,就是将谷歌与当前国内搜索引擎的代名词——百度进行比较。他们的结论是:谷歌的下一代搜索引擎理念是让用户需求在搜索的呈现页面即被满足,而不必进行二次点击进入相关网站,这与百度力推的“框计算”类似。因此,这一次谷歌是“山寨”了百度的模式。
如果这是事实,当然值得高兴,遗憾的是,经过仔细比对之后,就会发现谷歌的“下一步”与框计算存在本质的差异:百度追求的是信息应用的聚合,而谷歌则专注于将信息转化为“知识”。
笔者曾经采访过谷歌搜索引擎科学家阿米特·辛格哈尔,他表示现在的搜索引擎已经将“数据转化为信息”做得足够好,比如键入“青海湖”进行搜索,你就能获得几乎所有关于青海湖的信息。“但是,用户的需求不止于此。未来的搜索结果体现的应该是‘人对世界的理解’,是真正的‘知识引擎’,而不是将一堆信息扔给用户去挑选。”
身为谷歌负责搜索引擎技术研发的高管,阿米特·辛格哈尔这段对于未来搜索技术的描述,应该可以被认为是谷歌下一代搜索引擎将要解决的事情。举例来说,当用户键入“中国最深的10个湖泊”,如果是当前基于“爬虫”系统进行字符串匹配的搜索引擎,返回的结果很可能解决不了这个问题,除非有人曾经统计过这个问题,并上传到某个页面上。而在新一代的“知识引擎”中,用户键入相同的字符串或许就能直接在搜索页面上得到想要的答案。
很显然,这样基于理解语义的搜索引擎需要将前端用户的搜索请求与后端数据库内海量的“Entity(实体)”进行匹配,包括人物、时间、地点以及它们之间的关联性,也需要从搜索算法结构层面进行大量的改进。而以谷歌一贯的“极客”企业文化来看,新一代搜索引擎也应该体现在算法本身的改进。
再看百度的框计算,其理念是打造一个开放的生态系统,拉拢合作者在其中投放应用,再利用百度的搜索引擎进行流量导入、推广,“所搜即所用”,进而为用户提供一站式服务。综上所述,框计算使用的还是字符串匹配的形式,并未从根本上改变搜索算法本身,而只是将搜索引擎这一工具平台化了。
所以,说谷歌要做框计算,无从谈起。