软件定义算力 第四范式携手英特尔开启企业AI转型的算力时代

互联网
2019
04/12
17:28
分享
评论

近日,Intel在京召开了人工智能技术研讨会,ACM世界冠军、第四范式副总裁&基础技术研发负责人郑曌应邀出席,并发表了题为“第四范式在算力时代赋能企业AI转型”的主题演讲。

早在去年9月,第四范式就已经与英特尔成立了"英特尔与第四范式人工智能联合实验室",通过软硬一体化技术加速推动AI产业化进程。郑曌在演讲中公布了联合实验室的技术突破,第四范式基于Intel最新发布的第二代至强可扩展处理器(CascadeLake),在金融、医疗等行业中的AI算力研究和场景应用实践上已经取得卓有成效的成果。与传统系统相比,第四范式通过将自主研发的企业级AIPaaS平台“先知”,与IntelCascadeLake、Intel傲腾固态等先进的处理器和内存架构相结合,打造出更加低门槛、低TCO和高可用的软硬一体AI基础设施,使企业开发、部署和应用AI更便捷,在AI转型的过程中获得竞争优势。

图为第四范式副总裁&基础技术研发负责人郑曌发表演讲

实践出真知软件定义算力时代来临

随着AI应用在各个行业不断验证和深入,数据规模、算法复杂度、企业业务场景数量都呈几何倍数增加,导致基于大数据的数据治理基础架构、AI算法拼接+CPU/GPU等野蛮硬件堆砌方式难以支撑企业多场景、集中管理AI应用的需求,从而引发由服务器规模激增带来的投入产出比低、运维成本高等一系列问题;另一方面,面向AI的数据治理,更深、更宽、更复杂,“用算力换智能”的AutoML自动机器学习算法正在快速、规模化应用。对此,郑曌认为,机器学习算法的突飞猛进和算力的捉襟见肘,成为目前企业在AI转型过程中共同面临的艰难抉择。在服务企业的过程中,第四范式发现先进的机器学习算法、完整的AI治理能力,也在倒逼和推动硬件技术的迭代与演进,特别是针对企业业务、算法、数据、平台、治理的体系化建设和统筹优化。“软件正在重新定义AI时代的计算。”郑曌表示。

通过高性能AI软硬一体优化打造AI系统闭环、搭建更适合AI的体系结构,贯通从算力到业务的价值链条,可以弥补现有IT架构导致的算力不足、软硬件不匹配等问题,帮助企业充分激发机器的算力构建AI能力,完成业务场景中的智能决策。第四范式先知是领先的AIPaaS平台,内置AI数据治理平台—DataPlatform、AI应用开发与运行中间件—Hyper-Engine、模型调研与开发工具—Studio、应用上线与运维管理工具—Console和应用市场SolutionShop等5大核心产品组件,以及自研AutoML算法、高性能实时特征数据库RtiDB和高维机器学习框架GDBT等核心技术,并提供灵活、高效、能力全面的开发环境,赋能企业全栈式AI能力,覆盖更广泛的开发者。同时,第四范式也在探索如何将AI平台层与硬件服务器基础层一体化优化。在系统方面,AI软硬一体化集成系统做到端到端优化适配,最大限度发挥软硬件效能,大幅提升性能表现;而软硬一体的交付模式,可以大幅提升企业部署效率,为企业解决软硬件兼容问题,同时提升系统稳定性。

软硬一体化提供企业AI转型捷径

第四范式通过软硬一体化技术,帮助多个客户实现了AI应用的快速转化与部署。以金融行业最普遍的智能风控场景为例,第四范式领先的AutoML算法通过对算法的自动调参探索、自动的特征组合,带来了显著的业务效果提升,但普通的中低配CPU和低速大容量存储介质,受制于访存带宽限制,无法支撑高维稀疏机器学习模型在AI训练过程中的数据高效访问,从而降低了AI流程的运行速度。而Intel推出的OptaneSSD则解决了AI训练和计算过程中的频繁特征数据计算的难题,结合第四范式自研的Memory/SSD自动缓存切换技术,能够为企业AI应用提供了领先的硬件存储特性,特别是革命性的3DXPoint技术,打破了内存和固态硬盘之间的边界,融合了高吞吐量、低延迟、高服务质量、高耐用性和非易性特性等特点,成为第四范式构建高效分布式多级存储系统的磐石,让“第四范式先知”平台获得了更高效的存储和查询能力,极大提升了客户AI场景下的计算能力。

除了智能风控场景,在金融监管合规越来越严苛的趋势下,反洗钱领域也成为AI技术应用的热点,得益于在机器学习领域的有深入研究和创新理念,第四范式已经在该领域取得了全球同业瞩目的案例应用。在某行的反洗钱项目中,第四范式通过两年交易数据训练了案宗识别精准模型,模型每日预估5000万-8000万案宗交易量,十个月完成225亿个案宗交易流水。该模型基于第四范式推出的深度稀疏网络(DeepSparseNetwork,DSN)算法,支持的模型维度达到千亿级,确保模型效果有了更大的提升空间。深度稀疏网络与传统模型或向“深”(模型优化)发展,或向“宽”(特征优化)发展不同,它对数据的高维处理,使之有能力将两种发展方向进行融合,从而兼顾两方面的优势。另外一点,它与其他反馈型算法模型所要求的强大并行计算能力也不同,构建的是一个巨型的金字塔型数据矩阵,整体的模型维度可以达到万亿级,因此其对于通用计算能力,以及海量内存支撑能力有着更迫切的需求。Intel新一代“CascadeLake”可扩展Xeon至强服务器处理器,除了支持OptaneSSD高速存储技术外,也展现出AI算力的“天赋”,集成最高56核的全新微架构物理核心和革新的核内互联架构,并支持12通道原生DDR4内存,这对于加速包括建模、仿真、机器学习和高性能计算在内的一系列数据密集型工作起到了重要的加速作用,整体性能相比上一代产品有了大幅提升。这种性能提升让第四范式AI平台有了足够的算力来应对万亿级高维数据处理提出的挑战,以其强大的并行计算处理能力,满足了具体业务场景中的算力需求。

这些成功案例正是同为AI领域领先企业的第四范式和Intel共同努力的成果,未来,第四范式将继续与Intel展开深度合作研究,充分发挥自身在算法、数据等方面的优势,融合Intel领先硬件技术,为客户和合作伙伴带来更多的创新技术和产品,为AI在更多行业的落地贡献力量。

THE END
广告、内容合作请点击这里 寻求合作
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表砍柴网的观点和立场。

相关热点

相关推荐

1
3