基于AI手机的主动服务背后,究竟有哪些秘密存在?手机

砍柴网 / 脑极体 / 2018-04-22 21:19
当手机的主动服务被徐徐打开,工具从此被赋予了更广阔的意义:它不再是被人施以冰冷的指令去执行,而是用心去感知人的灵魂与情感。

三百万年以前,古人类第一次使用工具,便天然地揭示了人和动物的最大区别。斗转星移,人类缓慢地跨过了石器时代、青铜时代、铁器时代乃至于近代的蒸汽、电气时代。时至今日,信息科技日新月异,人类使用的工具也愈来愈丰富和便捷。

然而,纵然时代不同,世界经历了沧桑巨变,人和工具的本质关系却从未被真正地动摇。一直以来,人都必须主动地使用工具。工具是静止的、无意识的,它只能被动地为人类服务。即便是堪称是人类历史以来最伟大的发明——智能手机,也难逃天命。

直到最近几年人工智能技术的迅速发展,乃至去年全球第一款AI芯片麒麟970的问世和使用,我们看到:随着手机AI的日益强大,人类和工具的关系似乎悄悄出现了某种被颠覆的可能性。这种可能性,正是基于AI手机的主动服务。

那么,手机主动服务的背后,究竟有哪些秘密存在?

AI的主动:开启解放双手的时代

一直以来,要想获取手机的信息或者对其发出指令,就必须要依赖手动操作。比如最原始的密码或图案解锁。这些都存在操作失误的可能,如果哪个熊孩子多输错了几次,手机出于自我保护就可能要几分钟甚至几十分钟无法解锁。为此,手机厂商开始探索藏于人体的天然的生物密码。

移动端现有指纹识别、人脸识别和虹膜识别三种生物识别方式,而应用最广泛的当数指纹识别,其被广泛应用于解锁、支付、进入应用等种种场景。与此同时,更为安全和精准的虹膜识别也处于紧锣密鼓的开发当中。而随着手机算力的提高,尤其是AI芯片的推出,其对人脸结构的分解也更为细致,手机人脸识别也正在成为标配。

在语音交互领域,当苹果的Siri出现,其立刻引领了一股语音助手的热潮。随着技术的进步,市面上的绝大多数手机都加入了语音助手的功能。利用语音助手,人们只需要动动嘴就可以完成打电话、搜索等任务。有意思的是,给用户讲笑话却是目前语音助手的常用功能。这可能也充分体现了我国人民风趣幽默的性格特点。然而如果只用手机讲笑话,恍若有点大炮打蚊子的感觉。

生物识别和语音助手出现的历史性意义比实际用途更为重要:对人的双手的解放。而这,也是手机AI为实现主动服务而迈出的坚实的一步。

当华为P20发布,我们看到AI的主动服务已经聚焦在了摄影领域。其搭载的AI摄影大师系统可以实现从场景检测、推荐规则、用户习惯三个层面定义拍摄技术,为用户带来更加强大的拍照体验。看起来,摄影技术是让用户越来越傻,所有的问题都交由手机来解决,用户只需要点一下快门甚至说一声“拍照”,就可以享受手机为自己带来的视觉盛宴。

当手机主动服务的范围越来越广,或许有必要把这些分散式的服务综合起来,来给用户带来更深度的服务体验。比如荣耀推出的Magic Live系统,其可以自动添加联系人、识别微信聊天内容,为你建立事件档案并发布提醒。

而主动服务目前在华为手机上体现最为直接的应属情景智能功能。比如你购买了一张火车票,手机会在出发前的三天对你进行每天的提醒,在出发之前为你规划路线,预计所需时间等。又或者记录你的停车位置,不止于在开开心心地逛完商场之后出门不知道车停在那儿了。更多的比如提示下雨出门带伞、即时跟踪快递信息等。

这些智能提醒功能实际上已经初步具备了主动服务的形态。其运行模式也相对简单,集中对单个的信息进行独立的提取分析,而且主要是基于地理、天气、交通三个系统的提醒。换句话说,这些都是既定的模式,只需要经过少量的数据分析和处理就能得出相应的结论,然后作出提醒。

然而,更高级的主动服务形态势必不是基于既定程序和数据的分析,而是通过对人的习惯、爱好和思维方式的学习,来实现手机对人的思考。

这样一个实现的过程可以总结为:从一开始的人学习操作手机,到现在的手机向人学习,从而更像人。

乍一听似乎非常玄妙,其实体现在主动服务的进化上,完全可以用两个词来解释:提醒和建议。

我们上面说到,情景智能的运行模式是对单个信息进行独立的提取分析,再结合地理位置等信息后作出有关交通、天气等“提醒”。那么,更深度的主动服务对单个信息的处理则要调动更为复杂的手机模块来进行综合分析处理,然后提出“建议”。

比如你对手机说“我想看电影”,手机就会根据你的观影倾向比如评分、题材、电影院等给你买好一张电影票,然后安排好最适宜的出行方式、路线,给出观影结束后的活动建议。又如你来到一家餐厅,手机会根据你的习惯主动帮你点餐,或者根据你的用餐口味点一些你从来没有吃过但是会喜欢吃的菜。

这就需要更强大算法和算力来进行数据的储存和处理。在慢慢对人进行学习的过程中,能够进一步地理解和判断人的意向,从而由最初的人能用手机干什么向手机能为人做什么转化,手机也就越来越像人。

我们的双手,也便在这样的被理解中解放,得以腾出空来去完成其他的事业。

托起的可能:硬实力的背后加持

世界上第一台计算机问世的时候,谁也没有想到它的体积会越来越小,但算力会变得如此之强大。从电子管、晶体管、集成电路再到如今的量子计算机,从最初的每秒5000次计算到如今的接近10亿亿次,人类技术进步的脚步快得令人窒息。

正是拥有如此强大的运算能力,计算机在当下的应用广泛程度才无可匹敌。由此观之,要实现对人类行为的计算理解,硬件的保障显得十分重要。

所以,首先必须要为手机装上一个智能大脑,而这个大脑就是AI芯片。麒麟970是球首款内置神经网络单元(NPU)的人工智能处理器。它的加入,让手机各主体单元的分工更加明确和细致:GPU和CPU负责计算的速度和力度,NPU则负责计算的深度,再加上负责提高AI性能密度的HiAI移动计算架构则,计算任务被明确分配,资源调配的独立进行在各个模块上实现了可能。这就实现了在移动终端进行深度学习、神将网络技术等任务的进行,为整体计算工作大大的提高了效率。可以说,AI芯片的算力加持,是一切主动服务的首要前提。

然而,在提升配置、改进AI芯片的基础上,也必须要对手机的基础的传感器硬件进行升级。比如现在手机更新中非常重视的摄像头。从最初诺基亚的200万像素到如今P20的高达4000万像素,摄像头像素的提升令照片更清晰、更精细。在未来你看到一件喜欢的东西,只需要拍照就能自动购买的时候,高清的照片会让手机识别得更快更精准,减少买错的可能。又如对语音识别模块的技术提高,可以让手机适应多种环境下的收音功能,尤其是在嘈杂的环境或者会议低声场下,让手机更快速精准地识别语音,从而做出相应的理解和应答。

除了让手机轻松地进行图像识别和语音识别,为了推进更好的主动服务,也可以尝试着加强手机的空间感知能力。这样,当你从口袋里拿出手机,手机就可以根据你掏出手机的角度、方向等来判断你的目的是解锁、拍照还是接听电话。在拍照的时候,陀螺仪可以检测你按下快门的瞬间的手机抖动幅度,然后自动修复偏移误差。再比如借助陀螺仪的定位功能,在GPS信号弱的时候可以根据手机移动距离来进行暂时的导航。此外,在VR游戏等场景下,陀螺仪的重要性也不言自明。

这就像一位学武之人,他若想修炼出一套独门剑术,就必须要有一身钢筋铁骨、一把绝世利器。外修于形,内练于神,才能利刃出鞘,天下拜服。

同样,以AI芯片为主导,围绕着其增强硬件配置,同时发挥手机内部各模块之间的聚合效应,才能为手机主动服务的落地提供硬性条件。

风险的平息:安全是上台的底气

也许会有人担心:如果一切硬件、软件、AI生态等条件统统达到了标准,基于用户个性而打造的主动服务也必然会读取大量的用户私人信息。可以说,人好似在手机里裸奔。其绑定的各种金融账户一旦遭窃,轻易就能令人一夜回到解放前。Facebook隐私泄露事件至今折腾得小扎焦头烂额,万一在手机里出现这样重大的安全事件怎么办?

所以,数据安全、本地算力和传感器丰富三者协同共进,才能共同构成手机主动服务的前提。

AI芯片的研发与应用其实正是解决这个问题的最好办法。普通的CPU和GPU算力不足,其在处理用户数据的时候往往会将其上传到云端。虽然云端加密技术也在不断地进步,但在上传和返回的途中仍然会存在泄密的可能。苹果的iCloud被破解导致好莱坞众女星颜面尽失,惨痛的教训历历在目。而AI芯片的强大算力令对数据的处理在移动终端就可以实现,不上云就断绝了泄漏的可能。移动终端就相当于一个U盘,把U盘揣兜里还能有被复制的可能的话,那这个世界的技术估计必须得经历一次前所未有的爆炸,甚至……推翻现有的物理理论体系。这个在理论上显然不太可能。

另一方面必须要注意的是,AI获取用户的数据必须要建立在一个基础上:用户的授权。一切未经用户的授权而读取隐私和硬性要求授权的行为都是耍流氓,我们必须要坚决抵制这种流氓行径。只有用户让手机理解自己,手机才能理解。生杀大权仍然是用户掌握。

用户的数据又可以分为两类:核心数据和非核心数据。

核心数据,顾名思义,是对用户极其重要的数据内容。如支付密码。上文提到的即拍即买中“买”的行为就必须要涉及到手机支付,而手机支付就必须要用到支付密码。由于涉及到资金的安全,手机只有在用户授权自动划拨的情况下,才能完成这一服务,否则就是无稽之谈。又如对用户地理位置信息的记录。如果用户不授权AI的GPS定位,那么诸如停车位置、目的地规划也就无法实现。因此,种种涉及到用户的资金、位置、照片等隐私数据的读取,都必须要经过用户的授权才可以。

非核心数据,则是手机必须要读取的用户信息,且只在本手机上才能使用。如开锁用的用户指纹、面部结构,用于接收语音服务、识别等指令的声纹等,这类信息功能定向,不具有普遍适用性和价值,是进行手机操作的必备数据。这类数据基本不存在授权的问题。

从这个层面上来讲,主动服务实质上是用户的一种情愿行为。在用户授权的前提下读取数据,训练手机AI的理解力和关怀力,才会让用户觉得到被理解和被关怀的温暖。牛不喝水强摁头,不是AI服务的逻辑。

此外,在应对本地数据安全方面,手机也会提供一些加密方法。比如为了保护用户的图片、音频、视频和文档等数据,专门开发保密柜功能,给用户隐私再加上一块防盗大锁。

移动终端计算、用户授权和保密功能的多重数据隐私保护手段齐下,让用户的隐私零泄漏,才是能让用户主动服务在这个温暖的旅馆中安然入睡的最优方案。

当手机的主动服务被徐徐打开,也就意味着更多变革的可能。工具从此被赋予了更广阔的意义:它不再是被人施以冰冷的指令去执行,而是用心去感知人的灵魂与情感。它愈加像人,又保持着距离,跟随着刀耕火种一路走来,也将以新的姿态紧随着我们,在未来之路上昂首而立。

来源:脑极体



1.砍柴网遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.砍柴网的原创文章,请转载时务必注明文章作者和"来源:砍柴网",不尊重原创的行为砍柴网或将追究责任;3.作者投稿可能会经砍柴网编辑修改或补充。


阅读延展



最新快报

1
3