2019AI势头强劲,百度大脑开年大波产品技术更新来袭

互联网
2019
02/15
15:19
分享
评论

2018年是AI全面落地的一年,2019年,AI行业将更加呈现出锐不可当之势。2019年一开年,百度大脑就动作频频, 2月13日,百度大脑一月一次的技术更新如期而至,给企业和开发者送来大礼包。

此次更新,百度大脑开放了全新AI技术能力、优化了AI技术模型、强化了百度EasyDL和UNIT两大定制化平台、推出了全新的AI硬件产品与服务和百度大脑解决方案,此外,百度AI市场,百度AI体验中心微信小程序也进一步完善,可谓干货满满。大量的技术和产品为企业和个人开发者提供了更好拥抱AI的机会。

新开放 AI 技术能力

百度大脑一直致力于构建开放的技术生态,目前已经对外开放了150多项领先的AI能力。此次升级中,百度大脑再次开放多项AI技术能力,包括车辆分析,人体分析,智能写作等全新能力,满足了企业和开发者更多的应用场景。

1. 图像识别

百度视觉团队从2013年起开始构建超大规模的图像分类系统,其中大部分训练数据均通过互联网搜索引擎获取,目前已构建起包含10万类 Tag(标签),近亿图片的训练系统。此次图像识别新上线两项功能:车辆分析、红酒识别。车辆分析能准确识别图像中的车辆相关信息,提供车型识别、车辆检测、车流统计、车辆外观损伤识别等能力。

红酒识别技术可以快速识别各种品类的红酒,只需输入一张红酒图片(酒标清晰可见)即可识别出红酒名称。目前,红酒识别功能邀测上线。

2. 人体分析

人体分析能力一直备受开发者的喜爱,此次人流量统计(动态版)千呼万唤始出来,上线的公测版主要面向门店、通道等出入口场景,以头肩为识别目标,进行人体检测和追踪,开发者可以根据目标轨迹判断进出方向,实现动态人流量统计。

3. OCR 

百度OCR技术是目前全球最准确的中文通用识别技术,它是基于百度领先的深度学习技术,拥有整图文字检测和识别、整图文字识别、整图文字行定位和单字图像识别等能力,并成功的应用于多个应用场景。此次3个 OCR 新接口邀测上线:保单识别、税务局通用机打发票识别、行程单识别。

4. 自然语言处理-智能写作邀测上线

连续两年,百度大脑与央视网在春节期间合作推出智能春联,掀起一股新春热潮,此次升级百度大脑为开发者发放自然语言处理技术红利,上线了包括智能春联、智能写诗、结构化数据写作、热点事件脉络、人物图谱功能接口,满足各类智能写作业务需求,让每一位开发者都能平等便捷地获取AI能力。

AI 技术模型优化 易用性提升

随着技术场景需求的增加,企业和开发者对AI技术对服务的易用性也提出了更高的要求,百度大脑在这次升级中,重视了技术和产品易用性的开发,提升了技术使用效率的同时降低了开发难度。

1. 图像识别-通用物体和场景识别高级版开放购买

调用量增加,除平台提供的500次/天免费调用量外,还可以开通付费购买更多调用量,后付费阶梯计价(2-3元/千张),并享受10 QPS 的稳定并发能力。

2. 图像搜索图库管理后台易用性升级

升级了图像搜索图库管理后台的应用性:支持在线测试检索效果,相同图搜索、相似图搜索、商品图搜索同步升级,不用调接口就能测试体验以图搜图的真实效果。

3. 人脸识别

人脸识别的人脸离线识别、人脸检测和人脸搜索都迎来更新。人脸离线识别 SDK 升级到2.0版本,有以下主要特点:

1)人脸检测/活体检测/特征抽取速度提升150%;

2)全新生活照及证件照模型,精度同比1.0系列提高近1.5%;

3)重写20余个底层 API,可降低30%开发量;

4)新增人脸通行、人证比对场景化示例工程,增加10余个场景化配置能力,1分钟跑通全流程业务逻辑,应对各类场景细节需求的二次开发。

同时,人脸检测轮廓关键点数量从72个增加至150个,升级后可以快速检测人脸并返回人脸框位置,定位五官与可更好地支持人脸特效场景。

此外,人脸搜索1:N 识别接口 max_user_num (即用户最大调用量)参数上限从20增加到50,支持最多返回50个相似人脸。还提升了用于人脸检索操作的非精准匹配场景的易用性。

4. 人体分析

人体分析的两个重要模型--手势识别和人体检测与属性识别此次也获得了升级。其中手势识别增加了“竖中指”手势,如今已累计支持24种手势可用于审核场景,同时全面优化远景拍摄场景(1~3m距离)的识别效果。

而人体检测与属性识别模型则升级了以下内容:

1)优化了模型算法,显著提升了人体检测和属性分类的准确率;

2)增加了“是否是正常人体”属性,方便使用者过滤严重遮挡、大面积被截断的“无效人体”;

3)所有属性增加“不确定”输出项取值,帮助开发者更好区分不确定的识别结果,例如吸烟属性以前输出项为“未吸烟、吸烟”,现在则为“未吸烟、吸烟、不确定”。

5. 自然语言处理-评论观点抽取(定制版)优化

此次升级优化了自然语言处理在媒体场景应用,输出标签不再局限于现有“名词+形容词”的形式,解决原名词+动词(如:包裹破损)提取不出来的问题。

定制化平台与工具

百度EasyDL和UNIT是百度大脑针对企业和个人开发者推出的两大定制化平台。此次升级新增了多项功能,优化了模型训练流程。让用户更加方便快捷的调用平台能力。

1. 百度EasyDL 定制化训练及服务平台

2018年,百度EasyDL定制化训练及服务平台用户迅速增长,累计已超过10万注册用户,应用于22个行业。百度EasyDL具备可即用、更轻快、高精度、强安全四大特点,开发者可以零算法基础定制高精度AI模型,快速验证效果,成为助力各行各业智能化升级的“利器”。此次百度EasyDL带来了以下更新。

物体检测模型训练效率提升:物体检测中“高精度标准算法”分布式训练后端优化,可将训练模型所用时间缩短至原先的1/2-1/3时间,大大提升模型训练效率。您可以从 PC 端访问 ai.baidu.com/easydl/ 直接使用。

新增功能:可实时查看模型训练进度。现只需将鼠标移到模型训练状态为“训练中”旁边的叹号,即可查看模型训练进度条。此外,还可以添加短信提醒,训练完成时就会收到提醒信息,再也不用担心不知何时才能将模型训练完成了!

新增功能:云服务调用数据。在训练操作页面左侧增加“接口数据管理”功能(支持图像分类和物体检测)。可用于管理调用接口时上传的数据。使用该功能,可以提高模型的迭代效率,实现训练数据的持续丰富和模型效果的持续优化。

2. 理解与交互技术 UNIT

百度UNIT是专业的对话系统训练平台,它开放了百度领先的需求理解、对话控制及底层的机器学习、自然语言处理、知识挖掘等核心技术,以及对话技能的创建、训练、评估、优化等功能。开发者和企业都可以快速在UNIT平台上搭建一套对话系统。此次更新中,UNIT新增6个预置技能

1)电视剧:可用于电视剧查找的场景,支持精确搜索与模糊匹配;

2)机器人控制:解析用户与智能机器人的互动指令,提供做表情、拍照、举手等指令;

3)提醒:提供日程管理的功能,包括设置、查询及删除提醒;

4)发微信:识别用户对微信的操作指令,支持打开和关闭微信应用、收发微信等功能;

5)发短信:识别用户对短信的操作指令,支持打开和关闭短信应用、收发短信等功能;

6)屏幕控制:解析控制智能设备屏幕的指令,提供屏幕划动、列表的排序和选择、翻页等控制指令。

现 UNIT 已累计提供23个预置技能,开发者只需点点鼠标即可轻松获取对应场景的智能对话能力!

此外,UNIT平台还正式推出“技能复制”功能,开发者可通过该功能,将技能复制至任意账号中。基于此功能,开发者可以快速实现技能的备份、将账号内技能迁移至新账号、以及复制多个技能进行二次开发用于相似业务。大幅度提升工作效率,降低数据复制成本。

【UNIT 对话测试助手】小程序,新增机器人和预置技能体验功能

【UNIT 对话测试助手】是一款测试开发者在百度 UNIT 平台训练出的对话模型效果的微信小程序。本次 UNIT 对话测试助手小程序强势升级,在原有支持自定义技能的基础上,增加机器人、预置技能的对话效果体验功能,还可以通过分享小程序来向其他开发者展示,体验对话效果从此更加轻松便捷。

AI 硬件产品与服务更新

2019年1月16日,“在端上思考”百度大脑AI硬件平台及产品发布会在深圳召开。发布会现场,百度大脑发布了12项新产品和1项新服务,包括端计算工具与计算卡、多款视觉模组、视觉开发套件、语音开发套件、以及硬件评测与认证服务等。此次是百度大脑自2016年启动开放以来,首次面向AI端应用集中发布硬件平台与产品矩阵。

1. 远场语音开发套件

此次更新发布了软硬一体的远场语音开发套件,包含麦克风阵列和开发板,支持声源定位、噪声消除等信号处理算法,5米内完美拾音,支持远场唤醒、远场识别、语音合成能力,使语音开发评估更简便、高效。

2. EdgeBoard 终端计算加速方案 重磅发布

同时发布的还有EdgeBoard 终端计算加速方案,该解决方案为深度学习软硬一体化加速方案,具备模型剪枝&量化加速工具,可将原始模型性能提升4倍以上。高性能的加速引擎提供2.4 Tops 的强大 AI 算力,完整的嵌入式参考设计,便于硬件产品的结构设计及二次开发。AI 硬件产品通过集成 EdgeBoard,可大大提升终端设备 AI 推理能力。

百度大脑解决方案

基于百度大脑领先的计算机视觉技术,百度的人脸考勤凭借精准、高效的识别能力受到越来越多开发者的信赖。此次升级百度大脑发布了人脸考勤解决方案,将考勤功能集成到手机、摄像头等设备中,以较低成本实现刷脸考勤,随时随地打卡。活体检测功能有效抵御照片、视频等作弊手段。提升考勤效率,提高防作弊能力。

百度 AI 市场

百度大脑于去年五月份上线了“AI市场”,通过一站式生态上下游协作和交易机制,与开发者、服务商一起面向终端客户推出更多优质的解决方案,进而实现商业变现。到今年1月份,AI市场在入驻商家数量不断增加,服务方面得到了进一步完善。

1. 数家优质服务商入驻 AI 市场

深圳视派尔、北京蚂蚁玖玖、北京文安智能、唐山莱锐思等多家优质服务商入驻 AI 市场,镜头模组、人脸抓拍机、人脸门禁闸机、机器人视觉定位系统等 AI 相关产品也成为市场爆款。

2. 功能升级

未发货自动提醒功能上线

针对24小时未发货的服务商,系统将通过邮件与短信提醒,避免长时间未发货,影响交易。

服务商入驻流程优化

服务商入驻、开店、发布商品可完成内容后,一次性提交审核,缩短审核流程;在做服务商信息、店铺信息更新时不影响前端正常展现。

交付信息可修改

针对服务商更换快递公司,补发货物等场景,增加交付信息可修改功能,方便对业务需求的灵活调整。

商品价格升级

商品价格明确含税、运费说明,并补充增加阶梯价与起售数量,满足 AI 市场中各类产品定价需求。

3. 百度 AI 市场域名更改为 aim.baidu.com  

百度 AI 体验中心微信小程序

为了帮助企业和个人开发者在更多平台使用到百度AI的技术,百度于去年推出了百度AI体验中心微信小程序,此次升级,小程序上使用的AI能力的数量和体验都得以增加。

1. 优化语音识别能力

语音识别服务优化,时延更低。并在小程序中增加了识别、合成用时信息。帮助开发者更好使用语音识别能力。

2. 新上线3项能力

百度AI体验中心此次还丰富了应用场景,新上线了人像分割、情绪识别、智能春联3项能力。目前共提供34项 AI 能力可体验。开发者可在微信搜索“百度AI体验中心”小程序体验或使用。

百度大脑是百度AI技术多年积累和业务实践的集大成,包括视觉、语音、自然语言处理、知识图谱、深度学习等AI核心技术和AI开放平台,对内支持百度所有业务,对外全方位开放。

百度大脑AI开放平台已经搭建起从深度学习框架、深度学习实训平台、通用AI能力、定制化训练平台,到软硬一体模组和解决方案的全栈式开放平台。从这份百度大脑于2019年开年的月度大更新就已经囊括了百度大脑各个层面的布局,展现出AI行业“头雁”应有的速度和姿态。

2019年,无疑是AI深入落地的一年,百度大脑将助力合作伙伴和开发者,加速AI技术落地应用,繁荣AI技术生态,赋能各行各业转型升级,开拓新行业和新业务。欢迎开发者&企业持续关注百度大脑的月度更新,更多关于百度大脑的最新技术和产品信息,欢迎进入百度 AI 开放平台(ai.baidu.com)查看、申请邀测或直接使用。

THE END
广告、内容合作请点击这里 寻求合作
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表砍柴网的观点和立场。

相关热点

相关推荐

1
3