Arm 全新 Lumex CSS 平台实现两位数性能提升,驱动消费电子设备“更智能、更高效、更个性化”

互联网
2025
09/10
16:11
分享
评论

新闻重点:

· Arm Lumex CSS 平台支持实时端侧 AI 用例,覆盖智能助手、语音翻译及个性化服务;依托搭载全新 SME2 技术的 Arm CPU,该平台可实现高达五倍的 AI 性能提升。

· 开发者可借助 KleidiAI 调用 SME2 技术带来的性能优势;目前 KleidiAI 已集成至所有主流移动操作系统及 AI 框架中,包括 PyTorch ExecuTorch、谷歌 LiteRT、阿里巴巴 MNN 及微软 ONNX Runtime。

· 针对旗舰级设备,Arm Lumex CSS 平台创造了前所未有的成就——连续六年缔造两位数的每时钟周期指令数 (IPC) 性能提升。

· 全新 Mali G1-Ultra 专为游戏玩家设计,可带来两倍的光线追踪性能提升,重新定义移动娱乐体验。

1757490659495186.png

Arm今日宣布推出全新 Arm® Lumex™计算子系统 (Compute Subsystem, CSS) 平台,这是一套专为旗舰级智能手机及下一代个人电脑加速其人工智能 (AI) 体验的先进计算平台。Lumex CSS 平台集成了搭载第二代可伸缩矩阵扩展 (SME2) 技术的最高性能 Arm CPU、GPU 及系统 IP,不仅能助力生态伙伴更快将 AI 设备推向市场,还可支持桌面级移动游戏、实时翻译、智能助手及个性化应用等多样的丰富体验。

1757490666378979.png

Arm 高级副总裁兼终端事业部总经理 Chris Bergey 表示:“AI 已不再仅仅是一项技术功能,它已成为下一代移动与消费技术的支撑底座。依托 Arm Lumex 平台,我们持续提升端侧 AI 体验,以满足用户日益增长的需求与期待。为此,我们正积极将 SME2 技术扩展至每一个 CPU 平台。预计到 2030 年,SME 与 SME2 技术将为超过 30 亿台设备新增超 100 亿TOPS 的计算能力,为端侧 AI 性能带来指数级跃升。”

合作伙伴可灵活选择使用 Arm Lumex 的方式,为其打造系统级芯片 (SoCs)。例如,他们可直接采用 Arm 交付的平台,并借助为其需求定制的先进物理实现方案,从而获得缩短产品上市时间和快速兑现性能价值等双重优势;或者,合作伙伴也可根据他们的目标市场,对平台寄存器传输级 (RTL) 设计进行配置,并自行完成核心模块的硬化工作。

全新 Arm Lumex 平台包含以下核心组件:

· 新一代搭载 SME2 技术的 Armv9.3 CPU 集群:包括 Arm C1-Ultra 和 Arm C1-Pro,为旗舰设备提供支持

· Arm C1-Premium:专为次旗舰市场打造,可提供一流的面积效率

· Arm MaliG1-Ultra GPU:配备新一代光线追踪技术,在实现先进的图形和游戏体验同时,还可提升整体 AI 性能

· Arm C1-DSU:Arm 迄今为止最灵活、高能效且具多种电源模式的 DynamIQ Shared Unit (DSU)

· 针对三纳米工艺节点优化的物理实现

· 跨软件栈的深度集成,为使用 KleidiAI 软件库的开发者提供无缝的 AI 加速体验

搭载 SME2 技术的 CPU:助力实现全场景 AI 加速

搭载 SME2 的 Arm C1 CPU 集群,为实际场景中的 AI 驱动型任务带来了显著的 AI 性能提升,包括:

· AI 性能提升高达五倍

· 语音类工作负载延迟降低 4.7 倍

· 音频生成速度提升 2.8  倍

全新的 Arm CPU 在 AI 计算能力上的飞跃,让实时的端侧 AI 推理成为现实,为用户在音频生成、计算机视觉及情境助手等多种交互场景中带来更流畅、更快速的体验。

在实际场景中,SME2 技术将响应速度与运行效率提升至全新水平。例如,在“智能瑜伽教练”演示应用中,得益于 SME2 技术,该应用的文本转语音生成速度提升了 2.4 倍,这意味着用户能即时获得姿势反馈与指导,且全程不用担心设备的电池续航问题。此外,通过 Arm、支付宝与 vivo 的三方合作下,将大语言模型 (LLM) 的交互响应时间缩短了多达 40%,充分证明了 SME2 可为终端设备带来更快速的实时生成式 AI 体验。

SME2 技术的价值不仅在于速度的提升,更在于释放出传统 CPU 无法企及的 AI 驱动功能。例如,在搭载 SME2 的单个核心上运行神经摄像头降噪功能,可以在 1080P 分辨率下实现帧率超 120 帧/秒 (fps),或在 4K 分辨率下实现帧率达 30fps。这使得智能手机用户即使身处光线最暗的场景,也能捕捉到更锐利、清晰的图像,进而在日常设备上获得更流畅的操作交互与更丰富的使用体验。

不同于受到延迟、成本及隐私问题等挑战的云优先 AI,Lumex 将智能引入设备端,能够在本地实现更快、更安全且随时可用的智能体验。SME2 已经广受业界领先生态伙伴的采用,包括阿里巴巴、支付宝、三星 System LSI、腾讯及 vivo。

为全线产品层级赋予架构自由

Arm Lumex 为合作伙伴提供了充分的自由度,使其能从高端智能手机、PC 到新兴 AI 优先设备的各类产品中,实现峰值性能、持续能效与芯片面积之间的灵活平衡。

1757490726806672.png

Mali GPU:实现桌面级游戏体验和更快的 AI 推理

1757490674573421.png

随着搭载 Arm GPU 的芯片累计出货量突破 120 亿颗,Arm 持续稳居手游体验领域的核心地位。全新的 Arm Mali G1-Ultra GPU 进一步突破移动游戏的性能边界,为手游玩家带来高保真、主机级画质。这一突破得益于全新的第二代光线追踪 (Ray Tracing Unit v2, RTUv2) 技术,该技术显著提升光照、阴影与反射效果,使其光线追踪性能相较前代提升了两倍。在 AI 工作负载方面,Mali G1-Ultra 可将推理性能提升最高 20%,显著增强各类实时应用的响应速度。

在各类图形基准测试中,Mali G1-Ultra 较前代产品实现了 20% 的性能提升,为《暗区突围:无限》《堡垒之夜》《原神》《崩坏:星穹铁道》等主流游戏带来了全面的性能增强。同时,Mali G1-Premium 与 Mali G1-Pro 两款 GPU,也为硬件资源受限的设备提供了更出色的性能与能效表现。

开发者友好的端侧 AI 解决方案

1757490680173391.png

开发者可在 Arm Lumex 平台上获取开机即用的 AI 开发体验。通过 KleidiAI 与各大主流框架的集成,包括 PyTorch ExecuTorch、Google LiteRT、阿里巴巴 MNN 及微软 ONNX Runtime,开发者无需修改任何代码,即可自动取得 SME2 的加速能力。

对于需要构建跨平台应用的开发者而言,Lumex 带来了全新的可迁移性:

· Gmail、YouTube 和 Google Photos 等 Google 应用现已全面支持 SME2 ,搭载 Lumex 的设备一经上市即可无缝运行

· 跨平台可迁移性意味着针对安卓构建的优化功能可无缝扩展至采用 Arm 架构的 Windows 及其他操作系统

· 支付宝等合作伙伴已成功验证:依托 SME2 技术,终端设备上的大语言模型 (LLM) 可实现高效运行。

Apple、三星和 MediaTek 等科技领军企业,正积极集成 AI 加速功能,推动端侧 AI 向更快速、更高效的方向发展。其中,Apple 正凭借该能力为“苹果智能” (Apple Intelligence) 提供核心支撑;三星与 MediaTek 则借助 Google Gemini 提升翻译、摘要、个人助手等实时 AI 应用的响应速度与运行效率。

Arm Lumex:AI 时代的平台级智能

Arm Lumex 不仅是 Arm 面向消费计算市场的最先进 CSS 平台,更是开启新时代智能 AI 体验的基石。无论是 OEM 厂商还是开发者,Lumex 均可提供所需工具,助力其在关键端侧场景实现兼具个性化、隐私保障与高性能的 AI 体验。作为专为 AI 时代打造平台, Arm Lumex 将成为未来移动创新的全新起点。

THE END
广告、内容合作请点击这里 寻求合作
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表砍柴网的观点和立场。

相关热点

相关推荐

1
3