生成式AI
一、实测神秘模型Pony Alpha,Opus级智能,架构师思维
1. Pony Alpha在OpenRouter走红,无发布会无论文,却凭超强编程能力引发开发者圈热议,有人连续编程3小时做出可玩的Pokemon Ruby;
2. 实测表现惊艳,能从零复刻《星露谷物语》,自主完成需求分析、架构设计到功能实现全流程,展现出系统级工程理解与长时间推理能力;
3. 模型身世成谜,有人猜测是Anthropic Sonnet 5、DeepSeek-V4或智谱GLM-5,若为国内厂商作品,意味着国产模型在高阶编程领域已进入新阶段。
二、小红书内测AI视频剪辑应用OpenStoryline,对话驱动
1. 小红书正在研发AI视频剪辑应用OpenStoryline,采用"非线性编辑+对话驱动"模式,用户上传图片通过自然语言即可完成视频剪辑;
2. 技术上采用DeepSeek和Qwen 3开源模型,结合小红书自有的dots.lm文本大模型和FireRedASR音频模型实现生态适配;
3. 小红书近期成立Red&Live独立部门聚焦短视频与直播,试图以"视频化+AI"双引擎向3亿DAU目标冲刺,从图文社区向综合平台转型。
三、可灵3.0实战评测:电影"未拍先见",影视筹备新工具
1. 北京电影学院导演用可灵3.0 Omni进行影视前期制作测试,生成的动态预览让摄影、美术、灯光部门在开机前就能统一视觉认知;
2. 模型展现出电影级影调控制能力,能精准还原阴天散射光质感、雨滴折射光斑,并通过运镜节奏传达心理状态;
3. 在多人物车内对话场景测试中,角色一致性、音画同步、视线匹配均表现出色,可直接作为排练素材和灯光方案参考。
四、Xmax AI发布X1,全球首个虚实融合实时交互视频模型
1. 前华为"天才少年"创立的Xmax AI发布全球首个虚实融合实时交互视频生成模型X1,实现毫秒级实时生成和手势交互;
2. 核心玩法包括次元互动、世界滤镜、触控动图和表情捕手,用户上传角色图即可让其"脱屏而出"与现实互动;
3. 团队通过端到端流式重渲染架构将扩散采样速度提升百倍,自主搭建虚实融合数据合成管线解决行业数据稀缺难题。
五、5亿买下AI.com域名,60秒创建你的AI贾维斯智能体
1. Crypto.com创始人Kris Marszalek以7000万美元(约5亿人民币)购入AI.com域名,创下人类域名交易新纪录;
2. AI.com定位Personal AI Agent平台,承诺60秒内让普通人创建能帮忙发消息、操作App、交易股票的个人AI智能体;
3. 此举呼应Andrej Karpathy提出的"智能体工程"趋势,人类正从直接编写代码转向协调和监督执行任务的AI智能体。
前沿科技
六、英伟达发布140亿参数世界模型,单模型驱动所有机器人
1. 英伟达GEAR实验室发布140亿参数世界动作模型DreamZero,机器人仅通过文本提示即可完成从未见过的任务,被称为机器人"GPT-2时刻";
2. 模型通过联合预测视频与动作学习物理动力学,在新任务与新环境泛化上比最先进VLA提升超过2倍,实现7Hz实时闭环控制;
3. 仅需30分钟"玩耍数据"即可适配全新机器人并保持零样本泛化能力,代码已在GitHub开源。
七、全球首届机器人「春晚」,稚晖君带队200台机器人登场
1. 智元机器人举办全球首个机器人晚会《机器人奇妙夜》,200多台机器人表演唱歌、跳舞、太极、小品、魔术等12个节目;
2. 灵犀X2完成飞踢空翻、古典舞、醉拳等高难度动作,远征A2担任主持人,黄晓明携启元Q1亮相,稀晖君带来《武林大会》;
3. 晚会本质是智元机器人产品展示,但节目编排用心,从音乐搭配到舞台设计完成度较高,展现了人形机器人的娱乐应用潜力。
报告观点
八、美国四巨头AI基建支出超4万亿,苹果逆势收缩合作求变
1. 2026年Meta、亚马逊、微软、谷歌四家科技巨头AI基建支出预计超6000亿美元(约4.16万亿人民币),同比暴涨70%以上;
2. 这一支出规模相当于瑞典或以色列全年GDP,占美国GDP约2.1%,仅次于1803年购买路易斯安那州;
3. 苹果成为唯一"逆势而行"者,资本支出同比下降19%,选择与谷歌Gemini合作以低成本获取世界一流AI模型。
👇加入AGI数据库,AI智能问答
