
李飞飞发布全新世界模型RTFM,单GPU即可实时运行 OpenAI Sora2模型完成重大升级,视频生成时长翻倍 豆包超越DeepSeek成为中国最受欢迎AI应用 OpenAI放宽成人内容引发争议,奥特曼回应称公司并非世界道德警察 甲骨文披露AI基建项目毛利率可达35%订单已超5000亿美元 AGI量化标准确立,Bengio主导定义,当前进度达58%



李飞飞发布全新世界模型RTFM,单GPU即可实时运行
“AI教母”斯坦福大学教授李飞飞创立的World Labs于10月17日发布实时生成式世界模型RTFM。该模型基于大规模视频数据训练,仅需单张或多张2D图像即可生成不同视点的3D一致场景,无需依赖显式3D表征,并能精准建模几何、反射等物理现象。
团队强调,RTFM在单块H100 GPU上即可实现实时渲染,解决了世界模型长期存在的可扩展性难题。此前,World Labs已获2.3亿美元融资,计划于2025年推出产品,未来将应用于AR、机器人及自动驾驶等领域,推动空间智能与AI技术深度融合。(钛媒体)
淘宝新增6款AI导购应用,今年将是首个AI全面落地的天猫双11
2025年天猫双11将于10月20日晚8点正式启动,本届活动将成为首个AI全面落地的购物节。
面向消费者,淘宝同步推出6款AI导购应用:包括能理解复杂语义的“AI万能搜”、通过对话筛选商品的“AI帮我挑”,以及自动生成品类清单的搜索功能、支持一键试穿的“AI试衣”和个性化“AI清单”。这些工具旨在解决不同场景下的购物需求。
在商家端,AI美工月均生成2亿张图片及500万个视频,带动商品点击率提升10%;AI数据分析工具累计生成超1000万份报告,获得85%商家好评;AI客服系统每日为商家节约成本2000万元,同时带来1912万元的GMV增量。(新浪科技)
OpenAI Sora2模型完成重大升级,视频生成时长翻倍
OpenAI于10月16日正式发布视频生成模型Sora2的重大升级。新版将免费用户视频生成时长提升至15秒,Pro用户更可生成25秒视频,且新增音频生成功能,可自动匹配环境音、对话及背景音乐。其专属社交应用支持用户通过一次性身份验证后在生成内容中使用自身形象,显著降低创作门槛。
据Appfigures数据,Sora应用上线首周在美加两地通过邀请制获得62.7万次iOS下载,已超越ChatGPT首发同期表现,并迅速登顶美国AppStore免费榜。(搜狐)
谷歌发布Veo 3.1视频生成模型新增音频支持和对象添加功能
10月16日,谷歌推出了其新款视频生成模型Veo 3.1,该版本在音频输出、精细化编辑控制以及图像转视频效果方面均有提升。新模型允许用户向视频中添加对象,并使其自然融入原有画面的风格。此外,公司还预告,不久后用户将可在视频编辑工具Flow中移除视频中的现有对象。
目前,谷歌正将Veo 3.1模型陆续部署至其视频编辑平台Flow、Gemini应用程序,以及Vertex AI平台和Gemini API接口。谷歌透露,自今年5月Flow上线以来,用户已在该应用上创作了超过2.75亿个视频。(IT之家)
上海AI Lab推出科研智能体FlowSearch助力科研探索
上海人工智能实验室近日推出科研智能体FlowSearch,该智能体在多个权威科研基准上表现突出,展现了AI在复杂科研任务中的动态协作与深度推理能力。FlowSearch通过动态结构化知识流构建科研任务的多层依赖图,实现任务的并行探索、知识的递归整合和流程的自适应优化。它由三大核心模块组成,协同完成复杂任务,让科研过程更加高效和智能化。FlowSearch的推出标志着科研智能体从“被动工具”迈向主动探索伙伴的新阶段,为科研领域带来新的突破和进展。(量子位)
为AI“降温”:微软亮出散热王牌HXU,性能提升100%
微软10月14日宣布为解决AI时代数据中心日益严峻的散热挑战,推出新一代热交换单元(HXU)。该设备在物理尺寸保持基本不变的情况下,散热性能比上一代产品提升了一倍,可支持单机架超过240千瓦的功率密度。新一代HXU通过引入多水泵和双电源配置等组件冗余设计,该设备的目标是实现高达99.9%的正常运行时间,以防止单点故障影响业务。系统还集成了泄漏检测和滴水盘等coolant管理功能,在固件层面,该单元符合安全启动、NISP SP 800-53及ISO/IEC 27001等多项高级安全标准。(IT之家)

豆包超越DeepSeek成为中国最受欢迎AI应用
字节跳动旗下AI助手豆包凭借亲切拟人化设计与全功能整合,成功超越技术领先的DeepSeek,登顶中国AI应用市场。豆包提供文字、语音、视频交互及图像生成等多元化功能,并与抖音深度打通,形成“便利性与多巴胺结合”的社交传播生态。
截至今年8月,其月活跃用户达1.57亿,超DeepSeek的1.43亿。分析指出,豆包的成功并非依赖顶尖AI技术,而是源于字节跳动打造“爆款应用”的成熟经验——通过快速迭代、跨平台导流及低认知门槛设计,精准触达非技术用户群体,甚至吸引中老年一代加入使用。目前,字节跳动正将豆包拓展至车载系统等更广泛硬件生态,持续扩大其市场影响力。(WIRED)
腾讯发布超低成本AI训练法,仅120元效果秒杀7万元微调方案
腾讯提出了一种名为Training-Free GRPO的无训练组相对策略优化方法,该方法无需调整模型参数,只需在提示词中学习简短经验即可显著提升模型性能。
实验表明,在数学推理和网页搜索任务上,利用该方法训练DeepSeek-V3.1-Terminus模型展现出显著的跨领域性能提升。与微调32B模型相比,该方法在671B大型模型上所需训练数据更少、成本更低。(量子位)
德勤向澳洲政府退钱:用AI写报告漏洞百出,大量内容“胡编乱造”
咨询业巨头德勤于本周宣布,将在全球范围内为全部50万名员工部署Anthropic的Claude AI助手,彰显其全面拥抱AI的决心。然而同一天,德勤为澳大利亚政府撰写的一份价值44万澳元的评估报告被发现有虚假参考文献和虚构法院判决。
经悉尼大学学者指出后,德勤承认在编写过程中使用了Azure OpenAI GPT-4o生成式AI工具,并已更新报告删除不实内容。澳大利亚就业和劳资关系部确认,德勤已同意退还合同的最后一期费用,但未透露具体金额。德勤表示报告的核心结论和建议未受影响。(TechCrunch)
OpenAI被曝8亿月活用户只有5%付费
据英国《金融时报》报道,OpenAI计划通过向政府和企业客户提供更多定制化产品服务来达成合作协议,同时借助新推出的购物工具创造额外收入,并推动其视频生成模型Sora以及AI智能体实现商业化销售。
知情人士表示,OpenAI正在探索“创新性”的债务融资方案,以支持其AI基础设施建设。此外,OpenAI还在评估如何通过开发新型AI基础设施、进军在线广告领域,以及与苹果前明星设计师Jony Ive合作推出消费级硬件产品来使其知识产权资产变现。
目前,OpenAI的资金支出远超其收入水平,其年化经常性收入约为130亿美元,其中约70%来自ChatGPT用户的订阅费用,但付费用户比例仅为5%。尽管收入较去年同期翻了一倍多,但OpenAI今年上半年的运营亏损仍高达约80亿美元。(APPSO)
OpenAI放宽成人内容引发争议,奥特曼回应称公司并非世界道德警察
OpenAI近日宣布将于12月起推出“成人模式”,允许验证成年用户在ChatGPT上访问包括情色在内的更多内容,这一决定引发广泛争议。
CEO萨姆·奥特曼在社交平台上回应称,公司“并非经选举产生的世界道德警察”,强调将尊重成年用户自主权,但会禁止对他人造成伤害的内容。此举与美国全国反性剥削中心的强烈反对形成鲜明对比,该机构警告性化AI可能带来心理健康风险。而奥特曼此番表态与其8月声称“为抵制性爱机器人功能感到自豪”的立场相矛盾。(凤凰网)
苹果AI搜索负责人跳槽Meta,加剧人才危机
苹果公司AI搜索业务负责人Ke Yang已离职并加入Meta。这是苹果AI团队近期一系列高管离职中的最新一例,此前苹果AI模型负责人Ruoming Pang已于今年早些时候转投Meta,另有约十余名AI团队成员加入Meta新成立的超级智能实验室。
Ke Yang此前负责领导Answers、Knowledge and Information团队,该团队正致力于提升Siri的网页搜索功能,使其能从网络获取信息并处理更复杂的个人数据任务,这是苹果与OpenAI、Perplexity和谷歌竞争的关键。此次离职正值苹果准备于明年3月推出新一代Siri的重要时期。据彭博社报道,苹果内部预计未来数月将有更多AI团队成员离职,这使公司在AI竞赛关键阶段陷入人才困境。(TechCrunch)
微软重构Windows操作系统,全面转向AI驱动
微软正将其Windows操作系统全面重构为围绕AI的新生态。在Windows 10停止支持并迎来操作系统40周年之际,公司宣布为所有Win11 PC注入AI能力,而不仅限于专用Copilot+设备。微软消费者首席营销官Yusuf Mehdi表示,公司愿景是“围绕AI重写整个操作系统”,打造真正的AI PC。
此次更新核心是语音交互与视觉理解。全新“Hey, Copilot”唤醒词将语音提升为键盘、鼠标之外的第三大输入方式。同时推出的Copilot Vision功能可实时分析屏幕内容,提供应用指导、故障排查甚至游戏攻略。更进一步的Copilot Actions已开始测试,允许AI代理在本地执行如照片编辑等任务。(The Verge)
谷歌DeepMind与CFS合作开发AI控制系统,挑战人造太阳高温
谷歌DeepMind与Commonwealth Fusion Systems(CFS)公司宣布合作,利用AI技术加速实现清洁、安全的无限核聚变能源。双方将运用深度强化学习和开源等离子体模拟器TORAX,在波士顿郊区建造的SPARC装置中测试并优化运行方案。合作将探索海量潜在操作场景,开发AI驾驶员实时控制SPARC,确保设备在高功率下安全运行。SPARC装置有望成为首个实现“能量净增益”的磁约束聚变设备,预计2026年竣工。(IT之家)

甲骨文披露AI基建项目毛利率可达35%订单已超5000亿美元
甲骨文在拉斯维加斯年度投资者大会上举例说明,一个为期六年、总收入600亿美元的AI基础设施项目,毛利率可达35%。此外甲骨文指出现在剩余履约义务(RPO)超过5000亿美元,并预计到2030财年营收将达到2250亿美元。市场对AI基础设施业务盈利能力的信心增强,甲骨文股价收涨超3%,盘中一度上涨超5%。(华尔街见闻)
谷歌将在印度投资150亿美元建立AI基础设施中心
谷歌宣布将在印度安得拉邦的港口城市维沙卡帕特南投资150亿美元,建立一座1吉瓦的数据中心和AI中心。该投资将在未来五年内完成,标志着谷歌在印度的最大投资,也是继2020年宣布100亿美元承诺后的进一步扩大。
谷歌云CEO托马斯·库里亚恩表示,该中心将成为公司全球网络中最大的AI中心之一,并计划将其扩展到多个吉瓦。此外,谷歌还计划将海底电缆基础设施带到维沙卡帕特南,并与印度电信提供商Bharti Airtel合作建设数据中心和电缆登陆站。谷歌的AI中心将提供包括定制TPU在内的全栈解决方案,支持当地AI处理,并提供访问其AI模型和平台的机会。印度IT部长阿什维尼·瓦伊什瑙表示,该AI中心将成为印度AI使命目标的重要贡献。(TechCrunch)

AGI量化标准确立,Bengio主导定义,当前进度达58%
图灵奖得主Yoshua Bengio联合多机构提出AGI新定义,将其定义为能匹配或超越受过良好教育成年人的认知广度和熟练度的人工智能。该定义包含两个关键维度,即确定参照系和强调全面性。
研究团队设计了一套基于心理学CHC理论的量化评估方法,涵盖10个核心认知领域,通过500余道题目评估AI能力。评估显示,2023年GPT-4得27分,2025年GPT-5提升至58分,但距离100分的AGI标准仍有较大差距,尤其在视觉、听觉和长时记忆存储领域存在显著短板。(量子位)
前瑞银宏观分析师:AI泡沫规模是互联网的17倍、“次贷危机”的4倍
独立研究机构MacroStrategy Partnership在最新报告中警告称,当前的人工智能投资热潮已远超历史上多次著名泡沫。报告称,过去十余年美联储的量化宽松政策和低利率环境,导致资本被大规模误配至AI、房地产、NFT及风险投资等领域。随着利率环境回归正常,市场风险逐渐显现。
Garran还直言,大型语言模型已触及“规模极限”。例如,GPT-3的训练成本约为5000万美元,GPT-4升至5亿美元,而GPT-5则耗资50亿美元,但性能提升并不显著。他认为,这种「投入指数级增加、回报边际递减」的趋势,意味着AI行业缺乏长期护城河。此外,报告指出,AI在企业中的采用率已出现下滑,部分测试案例显示模型在复杂任务上的完成率不足34%。在Garran看来,随着数据中心投资和财富效应的见顶并反转,美国经济可能重演2001年互联网泡沫破裂后的衰退。
他警告,这可能导致“zone 4衰退/通缩性崩盘(deflationary bust)”的出现,即使美联储或政府尝试通过刺激政策也难以轻易扭转趋势。在这种情况下,整体市场估值可能大幅下跌,技术/AI公司首当其冲。(APPSO)


