天才人工智能也学习 光鲜智能背后由人工撑伞家电

砍柴网 / HEA.CN / 2017-04-08 18:55
有IT数据公司的员工表示,标注数据和富士康的流水线没有多大区别,属于不断重复着同一个动作同一件事情,都处在价值链的底端。

2016年,谷歌旗下的人工智能公司DeepMind研发了一个能够读懂唇语的人工智能系统。让AI系统学习了5000个小时的BBC新闻节目后, 其准确率攀升至46.8%,秒杀唇读专家的12.4%。同样的情形还发生在围棋冠军李世石与阿尔法狗身上。AI深度学习之所以能取得巨大成功,一个重要因素是其背后起着绝对支撑作用的人工标注数据,这些数据由大量的人工从众多数据样本中搜集、清理、标注和分类加工而来。隐藏在人工智能背后的并不只是衣着光鲜的技术,而是代价极高的人工标注。目前AI尚未摆脱对大规模数据和样本必须先由人工标注方可学习的依赖。

目前的人工智能,由两个部分组成:“智能”和“人工”。也即现阶段的人工智能仍未达到完全智能的境界,而是仍然处于深度学习的过程。在这个背负着世界上最先进的科技代名词的背后,矗立的是一个庞大由人类构成的群体,他们不是人工智能公司的科学家和工程师,而是数据标注团队。

据HEA了解,数据加工公司的工作人员会手动为图片、视频和语音内容打标签、做标记。标注好的数据会被人工智能公司用来训练算法模型,然后应用到图像识别、语音识别等不同领域。如在图片中标注所有人眼可见元素,包括人物、动植物、景色、物体、类别等,这便是图像识别技术运用的初始模样。

经常与图像识别打交道的人工智能领域研究者们,大多都使用过数据庞大且对外开源的数据集ImageNet,包括此前从百度离职的吴恩达。ImageNet中拥有1500万张标注图片,据了解,这些图片是由全球167个国家的近50000名工作者花费2年的时间,对近10亿张通过互联网搜集到的图片进行分类和标注,才造就而成的。有数据标准公司员工向家电网称,一个标注员一天标准10张图片已经很不错。

值得一提的是,2月26日,谷歌宣布开放了一个基于 Youtube 视频的图像数据集 Youtube-BoundingBoxes Dataset,为所有研究者进行模型训练和研究提供了新资源。谷歌宣称这个数据集的检测数量(detection count)为ImageNet的五倍。这个数据集包含1050 万人工标注的帧,500 万边界框,从 24 万个截取的视频中标记了38 万条 15-20 秒钟长度的视频片段。

如今在众多科技公司背后,都会有数据标注公司的身影,他们负责对图像、视频、语音、文本等数据进行清晰、评估、提取以及标注,而同一张照片或者同一个视频,每一家人工智能公司所需要的数据内容需求和用途大不相同,用来训练人工智能学习能力的类别也不同,因此同一张照片可能会有多种标注。

人工智能所依靠的是大数据,大数据却是由众多数据加工公司手动处理过的结构化数据构成。大数据支撑着人工智能系统,数据公司支撑着大数据的结构化,数据标注员支撑着数据的准确性和高质量。在公众眼中,看到的是家电厂商展现在客厅里的智能识别技术,实际上对团队而言,是日夜颠倒、枯燥乏味的一张一张图片的耐心标注。

有IT数据公司的员工表示,标注数据和富士康的流水线没有多大区别,属于不断重复着同一个动作同一件事情,都处在价值链的底端。当外界赞叹人工智能改变了大众生活的方方面面、让生活变得更加美好的同时,是由众多的数据标注员们的耐心和专注搭建而成。人工智能的火热带动了大量的数据加工初创公司的涌现,而这些将人工智能推向科技顶端的标注员并未因此站在科技顶端。

据了解,微软亚洲研究院的研究人员们于去年提出了一种全新的人工智能深度学习范式——对偶学习。对偶学习可以将未标注的数据用起来,从而降低对人工标注大量数据的已有学习范式的依赖。

作者:HEA.CN 来源:家电网



1.砍柴网遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.砍柴网的原创文章,请转载时务必注明文章作者和"来源:砍柴网",不尊重原创的行为砍柴网或将追究责任;3.作者投稿可能会经砍柴网编辑修改或补充。


阅读延展



最新快报

1
3