华为发布AI推理创新技术

半导体芯闻 2025-08-12 17:45
资讯配图
👆如果您希望可以时常见面,欢迎标星🌟收藏哦~
来源:内容来自新浪财经

8月12日下午消息,在2025金融AI推理应用落地与发展论坛上,华为联合中国银联共同发布AI推理创新技术UCM(推理记忆数据管理器),实现高吞吐、低时延的推理体验。


在当今数字化时代,AI发展日新月异。大模型训练的热潮尚未消退,AI推理体验却已悄然成为AI应用的关键。在2025WAIC期间发布的白皮书指出,AI正从训练向推理的结构性转变而快速增长。在这样的大背景下,AI推理体验的重要性愈发凸显。


推理体验直接关系到用户与AI交互时的感受,包括回答问题的时延、答案的准确度以及复杂上下文的推理能力等方面。资料显示,国外主流模型的单用户输出速度已进入200 Tokens/s区间(时延5ms),而我国普遍小于60Tokens/s(时延50 - 100ms),如何解决推理效率与用户体验的难题迫在眉睫。


据介绍,华为此次发布的AI推理创新技术UCM(推理记忆数据管理器),作为一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。


点这里👆加关注,锁定更多原创内容


*免责声明:文章内容系作者个人观点,半导体芯闻转载仅为了传达一种不同的观点,不代表半导体芯闻对该观点赞同或支持,如果有任何异议,欢迎联系我们。


推荐阅读

10万亿,投向半导体

芯片巨头,市值大跌

黄仁勋:HBM是个技术奇迹

Jim Keller:RISC-V一定会胜出

全球市值最高的10家芯片公司

资讯配图

喜欢我们的内容就点“在看分享给小伙伴哦~资讯配图

资讯配图

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI 华为
more
华为突然官宣:8月9日,全面降价!
董明珠喊话:不用格力你就是在犯错误;华为将发布AI推理领域突破性成果,或能降低对 HBM 依赖;京东将在智能机器人领域投入超百亿
曝华为即将发布AI推理领域突破性成果;腾势回应网传N9高速爆胎;阿里云Qwen Code每日可免费运行2000次...
华为或首发国内 eSIM 手机/董明珠回应格力玫瑰空调争议/iPhone 九月有望接入 GPT-5
别骂AI卡了!华为新推理技术救场,9月开源免费给全行业用
华为发布AI推理创新技术
16G+512G!新款华为Mate70Pro突然开卖,6799元的价格很疯狂
朱华荣、尹同跃、冯兴亚、项兴初……为何大佬们密集“捧”华为
英特尔回应特朗普要求CEO辞职,快手上线外卖独立入口,华为或首发eSIM手机,马斯克回应超算团队解散,这就是今天的其他大新闻!
狐讯 | 快手布局自营电商;华为纯血鸿蒙系统支持回退
Copyright © 2025 成都科技区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号