一周AI丨AI全面落地双11;AMD获甲骨文大额订单;Meta新框架30倍提速RAG;李飞飞世界模型单GPU可跑实时3D宇宙……

世界人工智能大会 2025-10-18 17:00
一周AI丨AI全面落地双11;AMD获甲骨文大额订单;Meta新框架30倍提速RAG;李飞飞世界模型单GPU可跑实时3D宇宙……图1


要闻列表

AI万象

AI全面落地双11

大平台动作

谷歌推出Veo3.1视频生成模型,光影效果突出生成更快


AMD获甲骨文大额订单,明年第三季度起部署五万块AI芯片


Meta超级智能实验室推出新技术,使大模型RAG推理速度提升30倍


苹果M5芯片正式发布:CPU提升15%、图形性能提升30%!


百度整合资源加码短剧与AI业务布局

新力量崛起

单块GPU上跑出实时3D宇宙,李飞飞世界模型新成果震撼问世


Anthropic发布Claude Haiku4.5:三分之一成本实现前沿模型性能

投融资风向

Oura智能戒指E轮融资8.75亿美元,估值升至109亿美元


获1.34亿美元巨额种子轮,General Intuition利用电子游戏,训练智能体空间推理能力





01

AI全面落地双11




AI万象

一周AI丨AI全面落地双11;AMD获甲骨文大额订单;Meta新框架30倍提速RAG;李飞飞世界模型单GPU可跑实时3D宇宙……图2


10月16日,天猫“双11”发布会上,淘天首次将AI纳入大促真正的实战中。


据了解,此次“双11”淘天向消费者推出了6款AI导购应用,包括“AI万能搜”“AI帮我挑”“拍立淘”等产品。这些产品分别满足不同场景的购物需求。例如,“AI万能搜”可以精准理解复杂语义表述,来为用户提供购物攻略;“拍立淘”则提供多模态AI搜索,实现同款价优、同类商品推荐。


不仅如此,天猫在整个大促500亿消费券的发放上,也运用了AI技术,部分消费券将由AI“智惠引擎”统一决策发放,以提升消费补贴的精准度。试点期数据显示,AI“智惠引擎”发券转化率相比以往提升了15%。


在商家侧,目前天猫旗舰店也已升级为3.0“智能态”,聚合货架、品牌、会员、服务四大中心,通过AI实时感知用户需求,提供千人千面的个性化展示与服务。


“我们不满足旗舰店的作用仅仅是展示,而是要以更强的算法能力来提升店铺效能。”天猫总裁家洛表示,例如店铺能精准识别消费者的地理位置,根据当地温度差异展现不同的服装、价格带。此外,平台还会向商家提供多种AI工具,让店铺变得更智能化。


电商行业正从流量争夺转向全链路效能竞赛。除了淘天,此次“双11”京东物流首次大规模投入“超脑+狼族”智能设备集群,基于数字孪生的智能决策体系,超脑大模型2.0将千万级别变量模型求解时间缩短至2小时内,并实现“狼族”等智能设备的互联互通,助力一线效率提升近20%。


与此同时,京东还将在“双11”携JoyAI全线产品,为商家提供超千万免费资源与超50款专业AI工具,并推出多个核心产品优惠政策。其中,京东数字人JoyStreamer、京东大模型品牌JoyInside、模型开发平台JoyBuilder均将向合作伙伴开放并提供免费体验机会。


新闻拓展:




02

谷歌推出Veo3.1视频生成模型,光影效果突出生成更快




大平台动作

一周AI丨AI全面落地双11;AMD获甲骨文大额订单;Meta新框架30倍提速RAG;李飞飞世界模型单GPU可跑实时3D宇宙……图3

当地时间10月15日,就在OpenAI于上月底推出全新的Sora 2后不到三周,谷歌也端出了自家视频生成模型的最新版本——Veo 3.1。


根据谷歌官方博客公布的信息,Veo 3.1作为今年5月推出的Veo 3的迭代更新,主打“更丰富的音频、更强的叙事控制和增强的真实感”。这次更新同步登陆了谷歌旗下的多个平台,包括面向普通创作者的Flow影视制作工具、供开发者使用的Gemini API以及企业级的Vertex AI平台。


从技术规格上看,Veo 3.1延续了前代的基础架构,支持720p和1080p两种分辨率输出,帧率固定在24fps。单次生成可以选择4秒、6秒或8秒三种时长,通过“Extend”延展功能,用户理论上可以将视频延长至148秒。


音频能力的提升是 Veo 3.1此次更新的重点之一。在之前的版本中,诸如“Frames to Video”(首尾帧插值)、“Ingredients to Video”(多图像合成)和“Extend”(场景延展)等功能都不支持原生音频生成,用户必须在后期手动添加配乐或音效。现在这些功能全部打通了音频通道,可以根据画面内容自动生成对应的环境音、对话和音效。


此次更新中,谷歌还引入了几项新的编辑功能。“Insert”功能允许用户向现有场景中添加任何元素——从写实的细节到奇幻的生物都可以,系统会自动处理阴影和场景光照,使新增内容能够自然融入。还有“Remove”让用户可以无缝移除场景中的任意对象或角色,系统会重建背景和周围环境。这些功能如果成熟,将极大地改变视频后期制作的工作流程,但目前“Remove”功能尚未在Flow中上线,依旧处于“即将到来”的状态中。


值得一提的是,Veo 3.1终于开始支持竖屏16:9视频的生成,此前Veo 3只能输出横屏720p内容。


不过,从目前的社区实测与反馈来看,除了功能上的丰富,Veo 3.1在生成质量上貌似没有特别大的提升。


新闻拓展:




03

AMD获甲骨文大额订单,明年第三季度起部署五万块AI芯片




大平台动作

一周AI丨AI全面落地双11;AMD获甲骨文大额订单;Meta新框架30倍提速RAG;李飞飞世界模型单GPU可跑实时3D宇宙……图4


当地时间10月14日,云服务供应商甲骨文(Oracle)和AMD宣布扩大合作,甲骨文将从2026年第三季度起在其数据中心中部署5万块来自AMD的Instinct MI450芯片,采用AMD的下一代“Helios”机架设计,并计划在2027年之后进一步扩大部署规模。


不过,甲骨文和AMD并未具体说明本次芯片部署的时间计划,也没有透露甲骨文所获芯片占AMD总供应量的比例。


甲骨文OCI(云基础设施)高级副总裁Karan Batta表示:“我们认为客户会非常积极地采用AMD的芯片,尤其是在AI推理领域。”


OCI执行副总裁Mahesh Thiagarajan表示:“我们将继续携手AMD,提供具有最佳性价比、开放、安全且可扩展的云基础设施,以满足客户在AI新时代的需求。”


本次合作将帮助AMD进一步提升对英伟达的竞争力。目前,英伟达依然是AI芯片领域的龙头企业。根据研究公司IDC的数据,今年第二季度,AMD出货了约10万台AI处理器,而英伟达的出货量为150万台。


就在不久前,OpenAI与AMD宣布达成重磅协议。OpenAI将在未来数年部署高达6GW(千兆瓦)的AMD Instinct GPU。根据协议,首批1GW设备将于2026年下半年投入使用。同时,AMD已向OpenAI发行最高1.6亿股认股权证,行权条件与芯片部署进度及股价里程碑挂钩。


在后续采访中,AMD首席执行官苏姿丰(Lisa Su)提到,Instinct MI450显卡加速器将采用2nm先进制程,成为全球首个应用此工艺的GPU加速器产品。据介绍,和英伟达计划在明年推出的Rubin芯片相比,MI450同样提供FP4/FP8运算能力,而显存总容量和内存带宽直接提升1.5倍。


新闻拓展:




04

Meta超级智能实验室推出新技术,使大模型RAG推理速度提升30倍




大平台动作

一周AI丨AI全面落地双11;AMD获甲骨文大额订单;Meta新框架30倍提速RAG;李飞飞世界模型单GPU可跑实时3D宇宙……图5


10月13日,Meta的超级智能实验室(Meta Superintelligence Labs,MSL)发表了首篇重要论文,研究成果显著提升了大语言模型在检索增强生成 (RAG) 任务中的推理速度,提升幅度达到了30倍以上。


这篇论文名为《REFRAG: Rethinking RAG based Decoding》,主要探讨如何让大型语言模型在执行RAG任务时,快速提炼出重要信息,以减少计算量并缩短反应时间,而同时保持准确性不变。


Meta超级智能实验室于今年6月正式成立,总部位于加利福尼亚州的门洛帕克,旨在研发超级智能技术。根据报道,扎克伯格在4月份对Meta最新发布的Llama4模型表现不满,甚至要求员工加班加点来改进。这促使他成立了这个新实验室,并引入了大量顶尖人才,包括Scale AI的创始人Alexandr Wang。


在实验室内部,团队被分为四个小组,分别负责大语言模型的研发、人工智能基础研究、产品技术落地以及基础设施的保障。REFRAG框架的提出,正是实验室在优化大语言模型性能方面的第一步。


REFRAG框架的核心理念是,通过一个轻量级模型将冗长的上下文内容压缩成摘要,减少解码器处理的输入信息。这种方法不仅加快了处理速度,还降低了计算量,提高了模型的效率。此外,研究团队还采用了 “持续预训练” 的方法,通过重建任务训练模型,以便在压缩信息的同时,尽量保留重要的细节。


经过全面测试,REFRAG在多种任务中表现出色,尤其在时间延迟和吞吐量方面大幅提升。实验结果显示,REFRAG在压缩比为16倍的情况下,能够在速度上超越之前的最先进模型CEPE,并且在准确性上几乎没有损失。


新闻拓展:




05

苹果M5芯片正式发布:CPU提升15%、图形性能提升30%!




大平台动作

一周AI丨AI全面落地双11;AMD获甲骨文大额订单;Meta新框架30倍提速RAG;李飞飞世界模型单GPU可跑实时3D宇宙……图6


10月15日,苹果正式发布M5芯片,这款采用第三代3nm工艺打造的处理器在AI运算、图形性能及能效方面均实现重大提升。


相较前代M4,M5的GPU在AI计算中的峰值性能提升超过四倍(最高相当于M1的6倍),并首次在每个GPU核心内集成Neural Accelerator神经加速单元,为AI工作负载带来显著加速。


据介绍,M5芯片采用全新一代10核GPU架构,每个核心均内置独立的神经加速单元,使GPU的AI计算能力比M4提升超过4倍,比M1提升超过6倍。


该GPU同时配备第三代光线追踪引擎与增强的着色核心,整体图形性能比M4提高约30%,比M1提高2.5倍,在使用光线追踪的应用中可实现最高45%的图形性能提升。


M5标志着Apple芯片在AI性能上的又一次重大跨越。通过在GPU中引入神经加速单元,M5为AI工作负载带来了巨大提升。再加上更快的神经引擎、世界上最快的CPU核心以及更高带宽的统一内存,M5将为MacBook Pro、iPad Pro和Apple Vision Pro带来更强大的性能与能力。


伴随着M5芯片发布,搭载其的首批新品同步登场,苹果CEO蒂姆·库克宣布,全新14英寸MacBook Pro、iPad Pro发布,两款新品均首发搭载M5芯片,售价分别为12999元起/8999元起。


全新14英寸MacBook Pro和iPad Pro在10月17日上午9点接受预购,并在10月22日发售。


新闻拓展:




06

百度整合资源加码短剧与AI业务布局




大平台动作

一周AI丨AI全面落地双11;AMD获甲骨文大额订单;Meta新框架30倍提速RAG;李飞飞世界模型单GPU可跑实时3D宇宙……图7


10月16日,百度搜索宣布旗下AI短剧生成平台正式开启公测,将通过亿元创作基金、百亿流量扶持、长期IP变现等方式,为创作者提供全方位支持。


据悉,百度搜索AI短剧生成平台具备自动生成、人机协作等不同模式,可辅助创作者完成80%以上的内容创作。创作者只需在AI创作的基础上进行微调和优化,即可快速生成高质量的短剧作品。并且在保障风格统一的同时实现批量生产,提升创作效率、降低制作成本。


值得一提的是,百度搜索将联合头部版权方提供丰富的IP内容,帮助创作者解决版权问题,专注于内容创作。针对精品和爆款内容,百度还会提供深度的IP孵化和经营模式,为创作者提供多元的变现方案。


据悉,中国微短剧市场近年来迎来爆发式增长。据艾媒咨询《中国微短剧市场研究报告》显示,2025年,中国微短剧市场规模将达到677.9亿元。在AI技术发展和多元文化创新推动下,微短剧行业将迈入精品化、智能化发展阶段。


新闻拓展:




07

单块GPU上跑出实时3D宇宙,李飞飞世界模型新成果震撼问世




新力量崛起

一周AI丨AI全面落地双11;AMD获甲骨文大额订单;Meta新框架30倍提速RAG;李飞飞世界模型单GPU可跑实时3D宇宙……图8


当地时间10月16日,李飞飞转发推文介绍全新实时生成式世界模型RTFM(Real-Time Frame Model),称这是一个实时、持持续运行且保持3D一致性的生成式世界模型,亮点是可在单个H100 GPU上运行。


根据官方介绍,RTFM的设计围绕三个关键原则:效率、可扩展性和持久性,这意味着模型可以在很小的GPU上运行,同时随着数据和计算量的增加而扩展,且这是一个永久的3D世界,“永远不会被遗忘”。


在技术上,RTFM是一款基于大规模视频数据进行端到端训练、效率极高的自回归扩散Transformer模型,最终仅通过观察训练集中的样本就学会了建模3D几何、反射、阴影等特征。


World Labs团队认为,随着技术的发展,日益清晰的一点是,生成式世界模型的算力需求将极其庞大,远超当今的大语言模型。因此,若直接套用现有视频架构,生成60帧的4K交互视频流每秒需产生超过10万个token(约等于首部《哈利·波特》的篇幅),而要维持一小时以上的持续交互,需处理的上下文token更将突破1亿大关。


以当今的计算基础设施而言,这既不可行,也不具备经济效益。团队相信,那些能够随着计算能力的提升而平滑扩展的简单方法,往往将在AI领域占据主导地位,因为它们能够受益于计算成本的指数级下降,而这种下降在过去几十年里推动了所有技术的发展。


因此,李飞飞团队设定了一个简单的目标,设计一个高效的生成式世界模型,使其能够高效部署,并随着计算能力的提升而持续扩展。最终得到了这个能够部署在单个H100 GPU上的模型,无论用户与其交互多长时间,都能保持交互帧率和持久的世界。


新闻拓展:




08

Anthropic发布Claude Haiku4.5:三分之一成本实现前沿模型性能




新力量崛起

一周AI丨AI全面落地双11;AMD获甲骨文大额订单;Meta新框架30倍提速RAG;李飞飞世界模型单GPU可跑实时3D宇宙……图9


10月16日,Anthropic官网发布博文,宣布推出小型AI模型Claude Haiku 4.5。官方表示该模型以极低的成本提供了接近前沿模型的强大性能,目标成为实时、低延迟任务的理想选择。


Anthropic Claude系列模型拥有三种尺寸规模:Haiku(小型)、Sonnet(中型)和 Opus(大型)。较大的模型基于更大的神经网络,通常包含更深层次的上下文知识,但运行速度较慢且成本更高。


而Haiku系列模型通常通过“蒸馏”技术,构建出规模较小的 AI 模型,让其在编码等功能性任务中达到大型、老旧模型的性能。


在应用场景方面,Anthropic表示,Haiku 4.5能够完美结合高智能与惊人的处理速度,满足用户对即时反馈的需求,专门针对实时聊天助手、在线客户服务代理以及辅助编程工具等需要高响应速度的应用场景设计。


在性能方面,Claude Haiku 4.5编码性能与Sonnet 4基本持平,但在成本上仅为后者的三分之一,处理速度则提升了超过两倍。


在衡量编程能力的权威基准测试SWE-bench Verified中,Haiku 4.5取得了73.3%的高分,略微领先于Sonnet 4的72.7%。


定价方面,Haiku 4.5展现出巨大的市场竞争力。对于Claude网页端和App的订阅用户,该模型已包含在服务内。而对于开发者,其API调用价格设定为每百万输入token 1美元,每百万输出token 5美元。


作为对比,同系列的Sonnet 4.5模型定价为3/15美元,而更高阶的Opus 4.1则高达15/75美元,让Haiku 4.5成为旧版Haiku 3.5和Sonnet 4的高性价比直接替代品。


更重要的是,Anthropic还为Haiku 4.5设计了创新的多模型协同工作流。在该模式下,更强大的Sonnet 4.5模型负责将一个复杂的总任务分解为多个步骤清晰的子计划,然后调度多个Haiku 4.5实例并行执行这些子任务。这种架构类似于一个项目经理带领多个高效的执行者协同工作,能够以更高效率和更低成本解决复杂问题,为AI代理式编码等高级应用场景开辟了新的可能性。


新闻拓展:




09

Oura智能戒指E轮融资8.75亿美元,估值升至109亿美元




投融资风向

一周AI丨AI全面落地双11;AMD获甲骨文大额订单;Meta新框架30倍提速RAG;李飞飞世界模型单GPU可跑实时3D宇宙……图10


10月14日,芬兰健康科技公司Oura宣布成功完成新一轮融资,筹集资金高达9亿美元。本轮融资由富达管理研究公司领投,参与投资的还有ICONIQ、Whale Rock和Atreides等新投资者。此次融资使得Oura的公司估值达到了110亿美元,相比于去年12月的上一轮融资,估值翻了一倍多。


Oura首席执行官Tom Hale表示:“这轮融资的成功不仅印证了Oura业务的强劲实力,还体现了数百万用户对我们的信任。我们致力于打造的不仅是一款智能硬件产品,更是一场推动主动健康的全球运动,帮助人们更好地了解自己的身体,做出更优的生活方式选择,并与医疗服务提供者更有效地沟通。”


自2015年推出以来,Oura已售出超过550万枚智能戒指,过去一年销量的增速尤为显著,占总销量的一半以上。根据国际数据公司IDC的报告Oura在智能戒指市场的份额超过80%。该公司预计2024年的营收将增长超过一倍,达到5亿美元,并预计销售额有望突破10亿美元。


为进一步扩大市场份额,Oura计划将新募集的资金用于人工智能和生产技术创新,开发新的健康功能,以及拓展全球分销渠道。同时,该公司还积极吸引不同年龄层的消费者。Oura首席商务官Dorothy Kilroy在多伦多的Elevate大会上表示,20岁出头的女性正逐渐成为公司的核心客群之一。


在产品创新方面,Oura近期推出了最新产品Oura Ring4,并在本月初推出了陶瓷材质版本的智能戒指,同时还发布了一款可选配的新充电底座。此外,Oura也在向健康检测领域拓展,推出了“Health Panels 新功能,用户可以通过该功能预约血液检测服务,检测费用为99美元,覆盖美国境内2000家奎斯特诊断公司的实验室。


需要注意的是,Oura虽然提供检测服务,但并不提供医疗建议,用户可在App内查看检测报告,并与平台的AI机器人进行交流,获取一般性健康建议。


新闻拓展:




10

获1.34亿美元巨额种子轮,General Intuition利用电子游戏,训练智能体空间推理能力




投融资风向

一周AI丨AI全面落地双11;AMD获甲骨文大额订单;Meta新框架30倍提速RAG;李飞飞世界模型单GPU可跑实时3D宇宙……图11


游戏视频分享平台Medal近日分拆成立了一家名为General Intuition的AI研究实验室,并宣布完成1. 337 亿美元种子轮融资,由Khosla Ventures和General Catalyst领投,Raine参与跟投。这家初创公司利用Medal积累的海量游戏视频数据训练基础模型和AI智能体,专注于理解物体和实体如何在空间和时间中移动——这一能力被称为空间-时间推理。


General Intuition认为,Medal的数据集在训练智能体方面优于Twitch或YouTube等替代平台。该数据集包含来自 1000 万月活跃用户的每年 20 亿段视频,覆盖数万款游戏。Medal和General Intuition首席执行官Pim de Witte解释说,玩家上传的视频片段往往是非常负面或正面的极端案例,这恰好为训练提供了非常有价值的边缘数据。“你会得到一种选择偏差,恰好指向你真正想用于训练工作的那类数据。”


这一数据优势据报道引起了OpenAI的关注。根据The Information的消息,OpenAI去年曾试图以 5 亿美元收购Medal,不过OpenAI和General Intuition均未对此报道发表评论。


从技术进展来看,创始团队已经取得了一些突破。General Intuition的模型能够理解未经训练的环境,并正确预测其中的行动。该模型完全通过视觉输入来实现这一点——智能体只能看到人类玩家所看到的内容,并通过控制器输入在空间中移动。公司表示,这种方法可以自然迁移到机械臂、无人机和自动驾驶车辆等物理系统,因为这些设备通常也是由人类使用游戏手柄操控的。


General Intuition的下一个里程碑包括两个方向:生成用于训练其他智能体的新模拟世界,以及在完全陌生的物理环境中自主导航。


在商业化策略上,General Intuition与其他世界模型开发商有明显区别。虽然该公司也在构建用于训练智能体的世界模型,但这些模型本身并非产品。不同于DeepMind和World Labs分别销售其世界模型Genie和Marble用于训练智能体和内容创作,General Intuition选择了其他应用场景以避免版权问题。


新闻拓展:



息来源:WAIC综合整理



一周AI丨AI全面落地双11;AMD获甲骨文大额订单;Meta新框架30倍提速RAG;李飞飞世界模型单GPU可跑实时3D宇宙……图12

一周AI丨AI全面落地双11;AMD获甲骨文大额订单;Meta新框架30倍提速RAG;李飞飞世界模型单GPU可跑实时3D宇宙……图13

点击阅读原文查看WAIC 2025精彩!

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI GPU AMD
more
北极雄芯GPU芯粒点亮
高通最强笔记本芯片骁龙 X2 Elite Extreme 跑分曝光:CPU 单核超苹果 M4 Max 5%,GPU 性能暴涨
腾讯字节等60家豪华投资天团豪赌,前英伟达高管All in的国产GPU黑马有多狠?
英伟达下一代GPU,巨幅升级!
GPU贸易警示录:从暴利到薄利,智算赛道门槛浮出水面
李飞飞造了个「永不消逝的世界」!单张GPU就能跑
【AI】一年4次迭代,狂堆GPU成真!微软AI冷液灌芯,散热暴涨3倍
热点关注丨单块GPU上跑出实时3D宇宙,李飞飞世界模型新成果震撼问世
【硬件资讯】AMD与OpenAI合作达成!将为其部署6吉瓦的AMD GPU算力,但代价呢??
Flash Attention作者最新播客:英伟达GPU统治三年内将终结
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号