太污了,阿里云速记把马云说的nationally翻译成了“男生弄乱”业界

砍柴网 / xyzhang / 2016-10-13 14:22
10 月 13 日上午,一年一度的阿里云栖大会在杭州云栖小镇召开。在开场的浙江省政府、杭州市政府各级官员致辞之后,阿里巴巴集团董事局主席马云按照惯例发表了一通关于“DT ...

对于同步语音识别产生的这些小错误,阿里巴巴集团技术委员会主席王坚博士笑着解释说,机器翻译的错误其实也是一种智能。人类最了不起的就是会有“意外”,现在机器也产生了“意外”。

4

10 月 13 日上午,一年一度的阿里云栖大会在杭州云栖小镇召开。在开场的浙江省政府、杭州市政府各级官员致辞之后,阿里巴巴集团董事局主席马云按照惯例发表了一通关于“DT 时代的创业创新”的主题演讲,但这次最特别的地方在于,阿里云的同学用阿里自己研发的语音识别技术为马云配备了一个机器速记员,在大会现场的两块大屏幕上以字幕的形式同步发出。

根据观察,这个“云速记”对马云杭州腔的普通话,翻译的准确率至少已经在 95% 以上,而且在不断自动纠错,如果没有人工干预校准的话,这已经是一个相当优秀的成绩。据相关人士介绍,这个智能语音识别系统不久前已经应用于浙江高级人民法院的庭审。

但仍然产生了一些误差,我们总结了一些实时语音识别中产生的主要问题如下:

1)马云说的“nationally”被翻译成了“男生弄乱”。马云是英语老师出身,被誉为最具有国际视野的中国企业家之一,尤其是在他那个年龄的中国人中,他的发音是相当不错的。机器仍然没有根据语义语境识别出夹杂在中文中的英文单词。有趣的是,当字幕翻译与讲话原意发生这种误差的时候,会场的哄笑让马云意识到了什么,看着字幕无声地笑着停顿了五秒钟。

2)马云提到此前浙江省长车俊时说的“刚才车省长讲”,被翻译成了“钢材车身钢架”。这个错误说明,遇到一些特定语境中的专有名词组合,比如一个姓与职务的结合,机器识别起来很困难,甚至会影响上下文语境中其它语义。这是中文这类表意文字的局限所在,各大科技公司的语音识别产品在面对表意文字时的表现普遍差于表音文字。

3)马云说“B2C 向 C2B”转化的时候,机器只能识别出“B2C”,但错把 C2B 翻译成了“示意图 B”。这是涉及到一个专有名词库丰富程度的问题。包括后面,云速记还能识别出 AlphaGo 等名词,也可能是因为这个单词已经在此之前就加入到了专有名词库里。

4)王坚博士说数字“几十亿”的时候,字幕翻译成了“几 1000000000”。凡是涉及到数字的情况,云速记一律选择用阿拉伯数字呈现,其实会给看字幕的观众带来不小的认知困难。

有意思的是,马云和王坚博士的杭州普通话演讲结束之后,台湾鸿海董事长郭台铭也带着他的台湾腔普通话出场了。为了配合云速记,郭台铭还特意放慢了语速,以便更好地被机器识别。但随后不知出于何种考虑,云栖大会的工作人员撤去了郭台铭的云速记字幕。

两年前,当我还在一家报社做实习生的时候,曾有过一次痛苦的录音整理经历:一桌好几个山东人,操着口音很浓的曲阜话(而北方方言本来就与被定为普通话的北京话源出一处),七嘴八舌地讨论关于大学里的孔孟教育话题。对一个南方来的人类耳朵来说,那真是可想而知地崩溃。实际上,在速记公司的价目表上,也会特别将方言腔很浓的活儿单独列出还要加价。期待在人工智能和机器学习的帮助下,语音识别最终能适配中国庞大复杂的方言体系。

【来源:品玩网   作者:xyzhang



1.砍柴网遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.砍柴网的原创文章,请转载时务必注明文章作者和"来源:砍柴网",不尊重原创的行为砍柴网或将追究责任;3.作者投稿可能会经砍柴网编辑修改或补充。


阅读延展



最新快报

1
3