搜狗王小川:2020年 机器翻译的某些指标可以赶上人类翻译互联网

砍柴网 / / 2018-05-23 10:23

北京时间5月20日,2018全球人工智能技术大会(GAITC)在北京召开。作为中国人工智能技术和产业领域规模最大、影响力最强的专业会议之一,GAITC邀请到了中国工程院院士李德毅、图灵奖得主姚期智、欧洲科学院院士汉斯·乌思克尔特等数十位业界专家,共同献上了数场精妙绝伦的主题演讲和对话。搜狗CEO王小川应邀在活动上发表了主题为《语言AI之路与挑战》的演讲。他回顾了人工智能在语言领域取得的进展,并指出“到2020年,机器翻译在一些指标上可以赶上人类翻译。”

作为国内用户量第四大的互联网公司,搜狗多款产品获得了市场的认可,搜狗输入法市场占有率多年保持第一的位置,搜狗搜索引擎市场份额为中国第二。基于在语言领域积累的海量数据和领先能力,搜狗率先布局了以语言为核心的人工智能战略。

从软件到硬件,搜狗让AI技术能够融入每个人的生活,构建起翻译、问答、辅助对话等使用场景。

搜狗翻译:让华语世界连接全世界

翻译是搜狗近两年来着力发展的方向。搜狗CEO王小川介绍道:“搜狗机器翻译是以搜狗独创的基于神经网络的机器翻译技术为算法;同时,凭借搜狗输入法、搜狗搜索引擎多年用户使用积累,产生了丰富语料供AI自主学习。”经过大量的训练和积累后,搜狗神经网络机器翻译的准确率愈发提高,屡获国际大奖。在国际学术赛事WMT 2017中,获中译英系统八项机器评价指标中的七项第一。

神经网络机器翻译技术,目前已经在搜狗的核心产品中进行应用:搜狗输入法上线翻译功能,用户可在聊天场景中进行中、英、日、韩等语言的翻译;搜狗搜索中的英文搜索频道,可以帮助用户用英文搜索全世界。此外,搜狗还上线了翻译App,帮助有专业需求的用户进行声音、图片和文字的翻译。

2018年,搜狗的两款智能硬件——旅行翻译宝、录音翻译笔正式发售。这两款产品是搜狗神经网络机器翻译技术、语音识别技术、OCR图像识别等高精尖技术的集合性落地,让AI机器翻译技术融入到生活和工作场景中,让每个人都可以享受AI技术给生活带来的便利。

值得一提的是,本次大会的所有中英互译同传字幕均由搜狗机器同传提供。随着演讲者的话语,字幕条即刻滚动更新,因其迅速的反应、准确的翻译,获得了参会嘉宾的认可。王小川表示:“机器和翻译人员还是有距离的。我们内部研发人员认为,在2020年时,可以在一些指标上赶上真人翻译,一些地方甚至会更好,一些地方还有不足。”

搜索的未来是问答 让回答一步到位

作为国内第二大搜索引擎公司,搜狗一直致力于搜索技术的深耕和应用。去年,搜狗问答机器人汪仔参加《一站到底》,与节目中顶尖选手同场竞技并取得胜利;今年的搜狗答题助手也帮许多人在“直播答题”类竞赛中获得了名次和奖金。但王小川显然并不满足于现有成绩,他断言:“搜索的未来是问答。未来搜索引擎不应该只给用户一个网页,而是给用户直接提供答案,这中间包含着知识推理和检索的能力。”

对此,他进行了更多的阐释:“搜索引擎所做的不仅仅是搜索、检索,更需要完成阅读理解,因为用户输入的关键词五花八门,问题的真实意思是机器所不能确定的。”比如,有网友搜索“王者荣耀排位上分最好的时间段”而最佳答案其实是“需要组队、有给力的队友”。这些语言的多样性、问题的不确定性,都是搜索引擎、问答产品在未来需要面临的问题。在这个方面,搜狗和学界持续合作,共同搭建数据库、解决更多的问题。在双方的通力合作下,相信搜狗会带来更加贴合用户心理的问答产品。

AI辅助对话:不炒“自动回复”冷饭

日前,在谷歌I/O大会上,主讲人请虚拟语音助手Duplex自行预约理发,测试中的Duplex在思维逻辑、对答正确性和速度方面,甚至还有极其类似真人的语音语调,都令业界惊叹。

与这款虚拟语音助手类似的“搜狗辅助对话”,或许是被大多数人忽略的一项功能,它不同于以往的“任务型对话”如siri,“聊天机器人”如微软小冰,不再是机器按照模板对人类的问题进行反馈,而是基于大数据,对人类对话时最可能出现的回复进行提示,由人类来掌控最终决定权,敲定最终回复的话语。机器所做的是为人类提高效率,而不是代替人类去回复、去思考。

而人类点选的动作和主动输入的动作,也是对机器提供答案的评价,这类评价数据,可以为机器的自主学习、自主更新提供资料,便于机器辅助对话性能的优化提升。如今,机器辅助对话的应用场景已由手机短信扩展到聊天软件,针对用户多样化、趣味性、个性化的表达需求,搜狗也在持续研究更复杂的检索模型、深度学习模型,让“搜狗辅助对话”实现更好的效果。

在演讲的最后,搜狗公司CEO王小川透露,搜狗输入法致力于自然交互,搜狗搜索则以知识计算为主,搜狗会考虑将二者的功能结合——“搜狗将不断研发新的智能硬件产品,会在各种垂直领域推出虚拟个人助理,帮助用户更好地表达和获取信息。”



1.砍柴网遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.砍柴网的原创文章,请转载时务必注明文章作者和"来源:砍柴网",不尊重原创的行为砍柴网或将追究责任;3.作者投稿可能会经砍柴网编辑修改或补充。


阅读延展



最新快报

1
3