百度王海峰:知识图谱让搜索更智能互联网

砍柴网 / / 2018-04-22 20:00

“知识是人工智能进一步发展的阶梯,人工智能技术应用于搜索,对用户需求深入洞察,让用户体验更加丰富便捷,搜索也在与用户的互动中不断进步,变得越来越智能。”4月21日,在苏州第十三届中国电子信息技术年会上,百度副总裁、AI技术平台体系总负责人王海峰发表题为《知识图谱与智能搜索》的演讲,介绍百度知识图谱技术及应用,并重点阐释融合了知识图谱等人工智能核心技术的智能搜索。 

王海峰是人工智能研究及应用的行业领军人物之一。他是自然语言处理领域世界上最具影响力的国际学术组织ACL五十多年历史上唯一出任过主席的华人。自2010年初加入百度以来,他先后为百度开创了自然语言处理、机器翻译、语音、图像、深度学习、数据挖掘、知识图谱等技术领域,并于2014年担任百度搜索的总负责人,使百度中文搜索遥遥领先,其中既有前沿的算法研究,又有最先进的大规模工程实现,取得了大量业界首创及领先的成果。2017年3月,王海峰作为总负责人组建百度AI技术平台体系(AIG),下辖百度研究院及多个人工智能技术部门,同年8月,兼任百度研究院院长。他是百度人工智能的奠基人,被业界称誉为少有的学术与工程并举的科学家。王海峰出席本届中国电子信息技术年会,除了分享研究成果,另一个重要原因,是他带队研究的“知识图谱技术及应用”荣获2017中国电子学会科技进步一等奖。

    AI推动时代变革生产力,知识让AI更智能

王海峰在演讲中表示,人工智能是新的生产力,是引领第四次工业革命的核心科技,它由互联网渗透到各行各业,推动传统行业转型升级,催生很多新的产业,创造新的价值。

在谈到AI如何进一步发展时,王海峰指出,“知识是AI进步的阶梯。”依托深度学习技术的发展,语音、图像等感知技术取得了巨大进步,但认知技术的突破,会越来越依赖知识,需要提升对知识和大规模知识图谱的运用能力。

数据是构建知识图谱的养料,百度知识图谱依托海量的网页数据、日志数据和垂类数据,综合运用语义理解、知识挖掘、知识整合与补全等技术,提炼出高精度知识,并组织成图谱。

王海峰以最近的热门影片《头号玩家》为例,生动阐述了知识图谱的构建过程。通过知识抽取技术,从非结构化、半结构化和结构化网页中提取知识点,比如《头号玩家》的导演是史蒂文·斯皮尔伯格,中文名是“头号玩家”,影片类型是科幻,进而根据知识点构建出《头号玩家》的知识图谱。

据悉,百度知识图谱目前拥有数亿实体、千亿事实,具备丰富的知识标注与关联能力,不仅构建了通用知识谱图,还构建了汉语语言知识图谱、关注点图谱、以及包含业务逻辑在内的行业知识图谱等多维度图谱。百度的知识图谱能力目前已深度应用于百度产品和业务中。从2014年上线至今,百度知识图谱的服务规模已经增长约310倍。

    搜索映射真实世界,AI与搜索共同发展

搜索是百度的核心业务之一。王海峰表示,百度搜索引擎不断变革,背后的核心驱动力就是人工智能。“融合了知识图谱等AI技术的智能搜索引擎,可以更好地理解用户需求,给用户更直接的答案,并以一种更便捷友好的方式呈现。” 

在智能移动设备迅速普及、人工智能技术快速发展的时代背景下,用户期望以自然语言表达搜索需求、直接获取正确答案,基于关键词的传统搜索引擎已不能满足便捷、高效、精准地获取信息的需求。据介绍,百度创新地融合知识图谱、自然语言处理及深度学习技术,研发深刻理解意图、精准呈现结果、自然便捷交互的智能搜索引擎,已具备图谱问答、推理计算、智能推荐、语义理解、智能排序、深度问答等能力,并结合语音、图像、AR等感知技术能力,更便捷地与用户交互,为用户提供更精准高效的信息服务。

例如,用户用自然语言搜索“飞得最高的鸟”,智能搜索引擎能够理解用户的意图,并结合知识图谱以图文并茂的形式把标准答案“黑白兀鹫”呈现给用户。

智能搜索引擎还可以根据已有知识进行计算和推理。例如,它可以根据“打火机不可以带上飞机”、“Zippo是打火机”这两个知识,推断出Zippo不可以带上飞机。当用户输入“Zippo能不能带上飞机”时,智能搜索引擎就可以直接反馈推断结果,告诉用户“Zippo不能带上飞机”。

主动预测用户需求的智能推荐能力,也是智能搜索引擎的特点之一。基于知识图谱丰富的属性和关系,搜索引擎可以自动判断用户想要触及的“知识点”,进而给出用户最想要的答案,同时主动激发和满足用户的潜在需求。例如,搜索热门电视剧《琅琊榜2》,搜索结果不仅聚合了影视内容简介、在线播放源等影片相关信息,还能根据对用户需求的预判,提供演员表及演员简介、演员其他影视作品等更多信息。

互联网是真实世界的镜像,搜索引擎是互联网的镜像,搜索引擎也由此成为了真实世界的镜像,随着搜索引擎的进化以及它与真实世界的相互作用,将加速通用人工智能时代的到来。正如王海峰所言:“AI技术在产品中的应用,将不断推动AI系统迭代进化,这也是智能搜索引擎对于AI的价值。” 



1.砍柴网遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.砍柴网的原创文章,请转载时务必注明文章作者和"来源:砍柴网",不尊重原创的行为砍柴网或将追究责任;3.作者投稿可能会经砍柴网编辑修改或补充。


阅读延展



最新快报

1
3