【科技纵览】当OpenAI在四月悄然关停Sora,并宣布其API将于9月24日终止服务时,这不仅标志着一个技术周期的终结,更像是一记警钟,敲醒了沉浸在参数竞赛中的国产AI视频赛道。与此同时,国内战场却呈现出一种诡异的繁荣:阿里、字节、快手三巨头在榜单与声量上激烈缠斗,而第二梯队的创业公司则在融资与上市的边缘试探。然而,剥开热闹的表象,视频模型行业正面临一个残酷的现实——技术惊艳易得,商业闭环难寻。
四月的AI视频圈堪称拥挤。月初,阿里的HappyHorse-1.0以1368的Elo分登顶Artificial Analysis无音频文生视频榜单,力压Seedance 2.0和可灵3.0。几乎同一时间,美国fal.AI上线了该模型的官方API,进一步拓展其开发者生态。资本层面,生数科技和爱诗科技在接连斩获融资后,相继传出赴港上市的消息。随着阿里正式入场,巨头间的博弈愈发白热化。快手的可灵作为商业化先行者,2025年12月单月收入已突破2000万美元;字节则凭借Seedance 2.0的出圈效应不断放大声量。据统计,今年以来中国AI视频赛道已发布约10个新模型,但Sora的退场提醒业界:视频模型最容易制造惊艳,也最容易消耗惊艳。
目前,国产视频模型的头部格局由快手可灵、字节Seedance和阿里HappyHorse构成,但三者面临的考题截然不同。可灵的关键词是“真金白银”。公开数据显示,截至2026年1月,可灵AI年化收入运行率(ARR)超3亿美元,服务超过6000万创作者,累计生成视频超6亿条。尽管在最新榜单中,Kling 3.0 1080p Pro位列第三,落后于阿里和字节的新模型,但其清晰的营收账单使其在商业化上处于绝对领跑地位。值得注意的是,主导HappyHorse的核心人物张迪,此前正是可灵的技术负责人,这种人才流动也折射出竞争的微妙。
相比之下,字节Seedance 2.0更擅长制造“声量”。爱尔兰导演Ruairi Robinson用该模型生成的“汤姆·克鲁斯与布拉德·皮特”视频在社交平台疯传,马斯克甚至在X上感叹“这一切发生得太快了”。在国内,“雪山救狐狸”短片全网传播量破50亿,背后亦有即梦(集成Seedance系列)的身影。此外,贾樟柯监制的春节贺岁短片《贾科长Dance》及央视春晚视觉制作,均展示了字节在B端的影响力。依托抖音、剪映和火山引擎的全链路资源,字节在收割C端心智上具备天然优势。然而,声量并未直接转化为透明的财务数据,且Seedance因好莱坞版权争议暂停全球发布,暴露了其合规短板。
阿里HappyHorse-1.0则以技术冲击力见长。在无音频文生视频榜单中夺魁,但在图生视频有音频榜单中屈居第二。腾讯云开发者社区的横评显示,HappyHorse在多镜头连续性和音画同步(延迟控制在80毫秒内)上表现优异,优于可灵3.0的120毫秒。然而,其在物理拟真测试中暴露出短板,如水杯碎裂模拟出现穿模和逻辑错误。价格方面,HappyHorse 720P折后价约0.44元/秒,低于Seedance 2.0的1元/秒和可灵3.0的0.48—0.96元/秒。由于阿里缺乏原生内容社区,HappyHorse更可能嵌入阿里云百炼、电商营销等企业级场景,而非直接与即梦、可灵在C端厮杀。至于百度和腾讯,今年尚未更新视频模型品类,第一梯队暂呈三强鼎立之势。
视线转向第二梯队,分化日益明显。生数科技完成20亿元B轮融资,由阿里云领投,其核心产品Vidu主打Reference-to-Video能力,并探索“世界模型”路线,试图通过海量视频学习因果规律,延展至机器人动作模型。爱诗科技PixVerse则完成3亿美元C轮融资,估值超10亿美元,ARR约4000万美元,更侧重全球化创作者平台。两者虽各有侧重,但共同面临盈利难题。MiniMax旗下的海螺AI存在感减弱,且因迪士尼等公司的版权诉讼陷入困境。昆仑万维的SkyReels V4虽冲进榜单前列,但主要服务于自家短剧和游戏业务,商业化路径尚不清晰。对于腰部厂商而言,缺乏平台优势使得单纯讲基座模型故事难以支撑高估值,ROI困境成为IPO路上的最大拦路虎。
Sora的退场深刻揭示了视频模型的“推理墙”困境。据报道,Sora关闭前每日推理成本高达1500万美元,而生命周期收入仅约210万美元。这一巨大的成本倒挂同样困扰着国产模型。以Seedance为例,字节在一个月内多次上调即梦价格,高级版年费从2599元涨至3099元,月度额度大幅削减,导致一段2分钟AI漫剧素材生成成本从7元飙升至约80元。算力账算下来,一段15秒视频成本约15元。即便付费用户,排队时间仍常超3小时,只有签订高额企业协议的大客户才能免排队使用完整功能。
版权问题则是另一重枷锁。爱奇艺近期因“纳逗Pro艺人库”引发争议,多位艺人否认签署AI授权文件。法律界人士担忧,平台协议叠加可能导致艺人失去对AI形象的控制权。人脸既是生物识别信息也是商业素材,其在短剧、直播等领域的二次创作、收益分配及撤回机制均存在法律模糊地带。麦肯锡2026年报告指出,AI可能重塑影视价值链,但德勤TMT预测提醒,真正的规模化依赖后台运营能力的改善。
综上所述,2026年的视频模型竞争已不再是单纯的参数比拼,而是深入到了成本控制、合规处理和生产链路整合的深水区。最会做演示的模型未必活得最好,最会冲榜的也不一定能赚钱。穿越周期的关键,在于能否将生成能力转化为客户可计算的持续营收,而非仅仅停留在技术炫技的层面。
Sora退场警示录:国产视频模型从“跑分狂欢”跌入“ROI深水区”
科技区角
2026-05-09 13:30
声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。