腾讯研究院AI速递 20260210

生成式AI

一、实测神秘模型Pony Alpha，Opus级智能，架构师思维

1. Pony Alpha在OpenRouter走红，无发布会无论文，却凭超强编程能力引发开发者圈热议，有人连续编程3小时做出可玩的Pokemon Ruby；

2. 实测表现惊艳，能从零复刻《星露谷物语》，自主完成需求分析、架构设计到功能实现全流程，展现出系统级工程理解与长时间推理能力；

3. 模型身世成谜，有人猜测是Anthropic Sonnet 5、DeepSeek-V4或智谱GLM-5，若为国内厂商作品，意味着国产模型在高阶编程领域已进入新阶段。

二、小红书内测AI视频剪辑应用OpenStoryline，对话驱动

1. 小红书正在研发AI视频剪辑应用OpenStoryline，采用"非线性编辑+对话驱动"模式，用户上传图片通过自然语言即可完成视频剪辑；

2. 技术上采用DeepSeek和Qwen 3开源模型，结合小红书自有的dots.lm文本大模型和FireRedASR音频模型实现生态适配；

3. 小红书近期成立Red&Live独立部门聚焦短视频与直播，试图以"视频化+AI"双引擎向3亿DAU目标冲刺，从图文社区向综合平台转型。

三、可灵3.0实战评测：电影"未拍先见"，影视筹备新工具

1. 北京电影学院导演用可灵3.0 Omni进行影视前期制作测试，生成的动态预览让摄影、美术、灯光部门在开机前就能统一视觉认知；

2. 模型展现出电影级影调控制能力，能精准还原阴天散射光质感、雨滴折射光斑，并通过运镜节奏传达心理状态；

3. 在多人物车内对话场景测试中，角色一致性、音画同步、视线匹配均表现出色，可直接作为排练素材和灯光方案参考。

四、Xmax AI发布X1，全球首个虚实融合实时交互视频模型

1. 前华为"天才少年"创立的Xmax AI发布全球首个虚实融合实时交互视频生成模型X1，实现毫秒级实时生成和手势交互；

2. 核心玩法包括次元互动、世界滤镜、触控动图和表情捕手，用户上传角色图即可让其"脱屏而出"与现实互动；

3. 团队通过端到端流式重渲染架构将扩散采样速度提升百倍，自主搭建虚实融合数据合成管线解决行业数据稀缺难题。

五、5亿买下AI.com域名，60秒创建你的AI贾维斯智能体

1. Crypto.com创始人Kris Marszalek以7000万美元（约5亿人民币）购入AI.com域名，创下人类域名交易新纪录；

2. AI.com定位Personal AI Agent平台，承诺60秒内让普通人创建能帮忙发消息、操作App、交易股票的个人AI智能体；

3. 此举呼应Andrej Karpathy提出的"智能体工程"趋势，人类正从直接编写代码转向协调和监督执行任务的AI智能体。

前沿科技

六、英伟达发布140亿参数世界模型，单模型驱动所有机器人

1. 英伟达GEAR实验室发布140亿参数世界动作模型DreamZero，机器人仅通过文本提示即可完成从未见过的任务，被称为机器人"GPT-2时刻"；

2. 模型通过联合预测视频与动作学习物理动力学，在新任务与新环境泛化上比最先进VLA提升超过2倍，实现7Hz实时闭环控制；

3. 仅需30分钟"玩耍数据"即可适配全新机器人并保持零样本泛化能力，代码已在GitHub开源。

七、全球首届机器人「春晚」，稚晖君带队200台机器人登场

1. 智元机器人举办全球首个机器人晚会《机器人奇妙夜》，200多台机器人表演唱歌、跳舞、太极、小品、魔术等12个节目；

2. 灵犀X2完成飞踢空翻、古典舞、醉拳等高难度动作，远征A2担任主持人，黄晓明携启元Q1亮相，稀晖君带来《武林大会》；

3. 晚会本质是智元机器人产品展示，但节目编排用心，从音乐搭配到舞台设计完成度较高，展现了人形机器人的娱乐应用潜力。

报告观点

八、美国四巨头AI基建支出超4万亿，苹果逆势收缩合作求变

1. 2026年Meta、亚马逊、微软、谷歌四家科技巨头AI基建支出预计超6000亿美元（约4.16万亿人民币），同比暴涨70%以上；

2. 这一支出规模相当于瑞典或以色列全年GDP，占美国GDP约2.1%，仅次于1803年购买路易斯安那州；

3. 苹果成为唯一"逆势而行"者，资本支出同比下降19%，选择与谷歌Gemini合作以低成本获取世界一流AI模型。

👇加入AGI数据库，AI智能问答