Arm把手机AI芯片开发变简单!最强CPU塞进AI加速,vivo阿里都说好

芯东西 2025-09-10 13:42
资讯配图

资讯配图资讯配图

已针对3nm优化。
作者 |  ZeR0
编辑 |  漠影
芯东西9月10日报道,今日,Arm在上海发布全新Arm Lumex计算子系统(CSS)平台,专为旗舰级智能手机及下一代PC加速AI体验而打造,可实现两位数的性能增长。
资讯配图
这套先进计算平台集成了搭载第二代可伸缩矩阵扩展(SME2)技术的最高性能Arm CPU、GPU及系统IP,为桌面级移动游戏、实时翻译、智能助手、个性化应用等各种实时端侧AI用例带来更流畅、更快速的体验。
资讯配图
搭载SME2的Arm C1 CPU集群实现了显著的AI性能提升,包括AI性能提升高达5倍,语音类工作负载延迟优化至4.7倍,经典大语言模型任务性能提升多达4.7倍,音频生成速度提升多达2.8倍
资讯配图
Lumex能够在设备端本地实现更快、更安全且随时可用的智能体验。SME2已被阿里巴巴、支付宝、三星System LSI、腾讯、vivo等业界领先的生态伙伴采用。
资讯配图
Arm的每个计算子系统(CSS)都针对细分市场的独特需求进行了调整,通过缩短设计用时和降低开发风险来加快开发,已获得超过16次授权,其中超过一半都是去年完成的。
Arm还将发布面向PC、物联网和边缘计算的CSS平台。
资讯配图

9月17日,智猩猩发起主办的2025全球AI芯片峰会将在上海举办。大会设有主论坛,大模型AI芯片、AI芯片架构两大专题论坛,以及存算一体、超节点与智算集群两大技术研讨会,近40位嘉宾将分享和讨论。IEEE Fellow王中风教授将开场,华为昇腾等国产AI芯片力量集结,华为云、阿里云领衔超节点与智算集群势力。扫码报名~


01.
Lumex:多款CPU与GPU
 按需组合,针对3nm优化


针对旗舰级设备,Arm Lumex CSS平台连续6年实现两位数的每时钟周期指令数(IPC)性能提升。
全新Arm Lumex平台包含以下核心组件:
资讯配图
(1)新一代搭载SME2技术的Armv9.3 CPU:包括Arm C1-Ultra和Arm C1-Pro,为旗舰设备提供支持,设备端性能可提升多达5倍、能效提升多达3倍。
(2)Arm C1-Premium:专为次旗舰市场打造,可提供一流的面积效率。
(3)Arm Mali G1-Ultra GPU:配备新一代光线追踪技术,在实现先进的图形和游戏体验同时,还可提升整体AI性能。
(4)Arm C1-DSU:Arm迄今为止最灵活、高能效且具多种电源模式的DynamIQ Shared Unit(DSU)。
(5)针对3nm工艺节点优化的物理实现。
(6)跨软件栈的深度集成,为使用KleidiAI软件库的开发者提供无缝的AI加速体验。
相比Cortex-X925,C1-Ultra CPU的单线程性能提高25% ;相比Cortex-A725,C1-Pro的持续能效提升12%;相比Immortalis-G925,Mali G1-Ultra的性能提升20%,能效提升9%。
资讯配图
合作伙伴可灵活选择使用Arm Lumex的方式,来打造SoC芯片。
例如,可以直接采用Arm交付的平台,并借助为其需求定制的先进物理实现方案,从而获得缩短产品上市时间和快速兑现性能价值等双重优势;也可以根据目标市场,对平台寄存器传输级(RTL)设计进行配置,并自行完成核心模块的硬化工作。
Arm Lumex为合作伙伴提供了充分的自由度,使其能从高端智能手机、PC到新兴AI优先设备的各类产品中,实现峰值性能、持续能效与芯片面积之间的灵活平衡。
资讯配图

02.
将AI加速集成到CPU中,
用SME2大幅提升AI性能  


新款CPU的一大核心技术是SME2。该技术能加快设备端CPU直接运行模型及AI工具的速度。
Arm高级副总裁兼终端事业部总经理Chris Bergey说,AI已成为下一代移动与消费技术的支撑底座,依托Arm Lumex平台,Arm持续提升端侧AI体验,正积极将SME2技术扩展至每一个CPU平台。
在实际场景中,SME2技术将响应速度与运行效率提升至新水平。
SME2是最新CPU集群的一项关键特性,为高效执行单侧AI而生,就是给CPU配备了一个新的矩阵加速器,让复杂计算变得更快更省电,同时支持SME2的新硬件与CPU、GPU等其他计算单元分工协作,实现更高效的端侧AI异构计算。
资讯配图
例如,得益于SME2技术,“智能瑜伽教练”演示应用的文本转语音生成速度提升多达2.4倍
此外,Arm、支付宝与vivo的三方合作,将大语言模型的交互响应时间缩短了多达40%,证明了SME2可为终端设备带来更快速的实时生成式AI体验。
据vivo高级副总裁、CTO施玉坚分享,vivo蓝晶芯片技术栈新增对SME2的支持,vivo计算加速平台VCAP已全面支持SME2指令集,对视觉、语音、文本等AI计算任务实现了显著的性能加速,例如在全局离线翻译场景,开启SME2硬件,能实现额外20%的性能收益。
再比如,在搭载SME2的单个核心上运行神经摄像头降噪功能,可在1080P分辨率下实现帧率超120帧/秒(fps),或在4K分辨率下实现帧率达30fps。这意味着智能手机用户即使身处光线最暗的场景,也能捕捉到更锐利、清晰的图像。
Arm预计到2030年,SME与SME2技术将为超过30亿台设备新增超100亿TOPS的计算能力,为端侧AI性能带来指数级跃升。

03.
全新Mali G1-Ultra GPU:
AI性能提升20%,光追性能翻倍


Arm GPU的芯片累计出货量已突破120亿颗
全新Mali G1-Ultra GPU专为游戏玩家设计,拥有14个核心,可将AI推理性能提升最高20%,显著增强各类实时应用的响应速度;在各类图形基准测试中实现了20%的性能提升。
其第二代光线追踪(Ray Tracing Unit v2, RTUv2)技术显著提升光照、阴影与反射效果,使光线追踪性能提升至前代的2倍,并实现每帧功耗降低9%为手游玩家带来高保真、主机级画质。
资讯配图
同时,Mali G1-Premium(6~9核心)与Mali G1-Pro(1~5核心)两款GPU,也为硬件资源受限的设备提供了更出色的性能与能效表现。

04.
跨平台易迁移,
满足生态系统AI开发需求


Lumex具备灵活性和可定制性,并提供全新的可迁移性:
    • Gmail、YouTube、Google Photos等谷歌应用现已全面支持SME2 ,搭载Lumex的设备一经上市即可无缝运行;
    • 跨平台可迁移性意味着针对安卓构建的优化功能可无缝扩展至采用Arm架构的Windows及其他操作系统;
    • 支付宝等合作伙伴已成功验证:依托SME2技术,终端设备上的大语言模型可实现高效运行。
    苹果、三星、联发科等芯片巨头正积极集成AI加速功能,推动端侧AI向更快速、更高效的方向发展。
    阿里巴巴淘天集团业务技术MNN负责人姜霄棠说,通过与 SME2的深度集成,MNN现已能在智能手机端,为通义千问等十亿参数级大模型提供低延迟的量化推理能力。
    支付宝终端技术负责人翁欣旦谈道,在Arm、支付宝与vivo的三方密切协作下,支付宝已在vivo新一代旗舰智能手机上完成了基于Arm SME2技术的大语言模型推理验证。结果显示,在预填充与解码阶段,其性能分别实现了超过40%和25%的提升。
    据腾讯机器学习平台专家杨晓峰分享,SME2技术通过突破关键性能瓶颈,高效助力大语言模型在移动端落地部署,如腾讯混元大模型,为端侧大语言模型提供强劲加速,最终带来更优质的用户体验。
    开发者可在Arm Lumex平台上获取开机即用的AI开发体验,借助KleidiAI调用SME2技术带来的性能优势。
    KleidiAI已集成至所有主流移动操作系统及AI框架中,包括PyTorch ExecuTorch、谷歌LiteRT、阿里巴巴MNN、微软ONNX Runtime等。开发者无需修改任何代码,就能自动取得SME2的加速能力。
    资讯配图

    05.
    结语:为端侧AI加速
    提供定制芯片套餐


    Arm Lumex是Arm面向消费计算市场的最先进CSS平台,也被Arm视作开启新时代智能体验的基石。
    面向OEM厂商及开发者,Lumex可提供所需工具,助力其在关键端侧场景实现兼具个性化、隐私保障与高性能的AI体验。
    这标志着Arm战略的重大转变,从提供半导体IP到提供全面的AI平台解决方案,以加速客户芯片设计及开发流程,满足日益增长的设备端实时、保障安全隐私、始终可用的AI应用需求。
    资讯配图


    资讯配图

    声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
    AI AR 芯片 vivo
    more
    刚刚,世界首富易主!81岁甲骨文创始人凭AI算力单日暴涨1010亿美元,反超马斯克
    活动预告丨2025亚洲人工智能技术大会(ACAIT2025)将于9月12-14日在鄂尔多斯举办
    高德 AI 别再打古典互联网战争了
    张宏江演讲:中美AI算力储备差距大,Agent将改变人类组织构成
    王坚院士外滩演讲全文:开源不只是开放代码,把AI送入太空人类才能走出地球
    AI如何成为生产力?2025云栖大会将给出答案 | 甲子光年
    阿里云 王坚 9大论断:关于AI、算力、太空
    OpenAI,最新技术分享
    邀请参会:测试测量大会(上海)--NI Days 2025邀您共探AI+测试新纪元
    央广经济之声|梁正:AI政务加速落地,人类是否会被边缘化?
    Copyright © 2025 成都区角科技有限公司
    蜀ICP备2025143415号-1
      
    川公网安备51015602001305号