【报告】Sora专题一:一文读懂Sora2核心点:每日烧掉1400万美元!揭秘惊人算力成本的背后逻辑(附PDF下载)

人工智能产业链union 2025-10-14 20:20
【报告】Sora专题一:一文读懂Sora2核心点:每日烧掉1400万美元!揭秘惊人算力成本的背后逻辑(附PDF下载)图1

中信建投证券

《一文读懂Sora2核心点
(完整版.pdf )
以下仅展示部分内容
下载方式见文末

中信建投证券发布的《一文读懂 Sora 2 核心点》报告,围绕 OpenAI 推出的 Sora 2 展开深度分析,涵盖其爆火原因、使用方式、生成效果、市场空间、成本测算及投资建议,同时梳理 AI 视频生成行业技术演进与竞争格局,为行业参与者与投资者提供全面参考。

一、Sora 2 爆火的核心逻辑

(一)技术演进:从范式探索到 DiT 架构主导

AI 视频生成技术历经多阶段发展,逐步实现质量、时长与可控性的突破。早期以生成对抗网络(GAN)和变分自编码器(VAE)为主,受限于稳定性与扩展性,仅能生成分辨率低、时长短的片段,且 GAN 存在模式崩溃问题,VAE 生成图像模糊。2017 年后,行业分化为自回归与扩散模型两条路径:自回归路径采用 Transformer 等序列模型,一定程度维系时序连贯性,但存在推理慢、误差累积问题;扩散模型通过 “去噪” 范式提升生成质量,催生 Runway Gen2 等产品,却面临扩展性瓶颈。2022 年 12 月,Diffusion Transformer(DiT)架构出现,以 Transformer 替换扩散模型中的 U-Net 骨干网络,具备卓越扩展性。2024 年 2 月 OpenAI 发布 Sora,其惊艳效果验证 DiT 可行性,推动行业进入 DiT 架构主导新阶段,后续生数科技 Vidu、Google Veo 等产品均采用或对标该架构。

(二)产品工程化:社交裂变与极致用户体验

Sora 2 上线后表现亮眼,当地时间 10 月 3 日(周五)上线,三日登顶美国苹果 App Store 免费应用榜,超越 ChatGPT、Gemini 等,上线两天下载量达 16.4 万次。其成功并非依赖技术突破,而是在产品层面优化:一是大规模数据训练,掌握大规模视频数据预训练与后训练方法,神经网络更贴近现实,同时优化指令遵循与音画同步,能执行多镜头复杂指令,生成高真实感背景音,让普通用户生成视频具备可消费性,突破 C 端普及临界点;二是提示词重写 / 增强,用户提示可能经 LLM 重写,提升生图对齐精度与复杂场景准确率;三是社交化设计,采用邀请制传播,受邀用户获 4 个新邀请码,激发熟人圈分享,营造 “一码难求” 热度,同时绑定 ChatGPT 账户,将 7 亿周活用户转化为潜在客群,初期仅上线移动端,强调社交娱乐属性,契合短视频用户习惯。此外,简化创作流程,摒弃专业参数,保留图生视频与 Cameo 功能,新增 X 轴滑动浏览 “二创” 版本的 Remix 功能,构建 “拉新 - 留存 - 促活” 闭环,引爆大众市场病毒式传播。

二、Sora 2 的使用机制与核心功能

(一)准入与创作:邀请制构建生态,流程极致简化

Sora 2 发布初期仅开放美国和加拿大地区 iOS 端下载,后续逐步适配日本、韩国等地区安卓端及网页版。用户需通过 OpenAI 账户登录并填写邀请码进入产品,邀请码裂变机制保证初期用户质量,控制算力成本,还营造社交热度。创作界面贯彻 “做减法” 原则,无复杂参数,仅设自然语言输入框,用户 “一句话即可生成视频”,同时关联 ChatGPT Pro 账户,为付费订阅导流,体现 OpenAI 对 C 端 AI + 社交的重视。

(二)社交功能:打造内容生态闭环

Sora 2 产品设计对标 TikTok,主页为单列推荐信息流,支持点赞、评论、转发、搜索,用户可通过自然语言描述优化推荐内容。核心功能围绕社交链路打造:Remix 功能允许用户以现有视频为 “模板” 二次创作,保留构图、风格等,修改部分提示词改变剧情,降低原创门槛,丰富 UGC 生态,助力 Meme 梗传播;Cameo 功能支持用户制作保留面部微表情与声纹特征的数字分身,嵌入他人视频,强化熟人社交互动,结合邀请制形成 “拉新 - 留存 - 促活” 闭环,将 AI 工具转化为社交娱乐平台,提升用户粘性与传播力。

三、Sora 2 视频生成效果测评

(一)测评方法与行业对比

报告采用久谦科技咨询的测评场景,以相同提示词要求 Sora 2 与其他主流 AI 视频生成产品(如字节 Seedance 1.0、Google Veo 3、阿里万相 Wan2.2 等)生成对应视频,每次模型取首次测试结果,从指令遵循、物理规律符合度、画面质感等维度评估。当前主流 AI 视频生成产品多可生成 5 - 10 秒 1080p 视频,商业化采用 C 端会员订阅赠积分、B 端 API 调用付费模式,如字节 Vidu Q1 B 端调用 API 为 0.015 元 / 千 Token,生成 5 秒 1080p 视频约消耗 42 帧。

(二)细分场景表现

  1. 文生视频(武侠)
    :提示词要求生成月光竹林下侠客交锋场景,Sora 2 整体指令遵循较好,符合物理规律,仅 “两指夹剑尖” 细节改为 “用手撑住”,与表现最佳的 MiniMax Hailuo 02 水平相当;其他产品如字节 Seedance 1.0 人物僵硬、剑身异常,Runway Gen4 动作特写缺失关键动作。
  2. 文生视频(悬疑)
    :需呈现雨夜图书馆情报员与追踪者的剧情,Sora 2 较好执行 “抽出书籍”“将书籍按回原处” 等动作,符合物理规律,仅表现力稍弱,与快手可灵 2.1、阿里万相 Wan2.2 同属第一梯队;生数科技 Vidu Q1 存在人物瞬移、形态混乱问题,违反物理规律。
  3. 图生视频(喜剧、卡通)
    :要求生成踩香蕉皮摔倒的夸张场景,Sora 2 整体指令遵循较好,成功生成 “手机飞出” 场景,仅旋转动作与人物腿部细节有瑕疵,表现超过其他模型;快手可灵 2.1 对 “违反物理定律旋转” 理解偏差,爱诗科技 PixVerse V5 未生成关键动作。
  4. 图生视频(科幻)
    :需让静态海报角色 “活过来” 并模拟无人机后退拉升镜头,Sora 2 表现相对较弱,未生成 “衣角与远处烟雾飘动” 场景,镜头仅水平移动,仅优于违反物理规律的生数科技 Vidu Q1;Google Veo 3、爱诗科技 PixVerse V5 虽运镜方向有误,但元素囊括全面。

整体而言,Sora 2 虽牺牲部分视频控制参数,但在文生视频(武侠、悬疑)、图生视频(喜剧、卡通)三大场景达第一梯队水平,仅图生视频(科幻)因运镜与元素生成不足表现较弱。

四、AI 视频生成市场空间测算

报告从 P 端(专业创作者)、B 端(企业级应用)、C 端(大众消费)三个维度,分中期(3 - 5 年)与长期(5 年以上)测算市场空间,综合得出 AI 视频生成中期市场总空间 763 亿元,长期达 1554 亿元。

(一)P 端:专业创作者经济,付费意愿强

全球 P 端市场核心是对专业创作者的工具付费,采用 “创作者人数 ×AI 产品渗透率 ×ARPU” 公式测算。海外方面,中期创作者人数 2 亿,AI 产品渗透率 5%,ARPU 3 美元 / 月,市场规模 36 亿美元;长期创作者人数 5 亿,渗透率 20%,ARPU 1 美元 / 月,规模 120 亿美元。国内中期创作者人数 0.8 亿,渗透率 1%,ARPU 100 元 / 月,规模 9.6 亿元;长期创作者人数 2 亿,渗透率 5%,ARPU 40 元 / 月,规模 48 亿元。综合全球 P 端中期市场空间 262 亿元,长期 888 亿元(美元兑人民币按 1:7 计算)。

(二)B 端:成本替代驱动,场景广泛

B 端市场核心是对传统视频制作流程的成本替代,应用场景包括专业影视(电影、游戏 CG)、视频广告、短剧、培训(在线教育、企业培训)等,按 “传统制造成本 ×AI 渗透率 ×AI 工具成本 / 原始成本” 测算。专业影视领域,中期 AI 渗透率 5% - 40%,成本优化至传统方式的 20% - 70%,市场规模 98 亿元;长期渗透率 15% - 70%,成本优化至 5% - 30%,规模 140 亿元。视频广告、短剧、培训领域类似,综合 B 端中期市场空间 501 亿元,长期 666 亿元。

(三)C 端:流量经济入口,广告变现为主

基于 Sora APP 当前定位,C 端市场不直接收费,将效仿 TikTok 通过 AI 原生内容社区汇聚流量,最终广告变现,当前测算未单独计取增量,但其作为流量入口,将助力整体 AI 视频生成市场规模扩张,与 P 端、B 端共同构成千亿级市场。

五、Sora 2 的 Token 成本与算力需求

(一)Token 拆分与成本测算

参考 DiT 论文,视频在 latent 空间被切成三维 m×n×t(RGB 像素空间)阵列,映射为一维 token 序列,1 个 token 等价于 LLM 中的 latent 元素。假设 1080p 高清图像下采样为 256×256 大小,对应 2048 个 8×8 像素块(patch),1 秒 30 - 60 帧高清视频经压缩后,1 分钟视频对应 480 帧、83040 个 patch,即 1 分钟高清视频约 1M tokens。结合 2025 年 10 月 OpenAI 开发者大会公布的 Sora 2 API 价格,Sora 2/Sora 2 Pro 生成 720p 视频每秒成本 13.73 - 41.20 美元 / 百万 tokens,1024p 每秒 34.49 美元 / 百万 tokens,保守估计 Sora APP 每天推理成本 1400 万美元,年化超 51.2 亿美元。

(二)推理算力需求

根据 OpenAI《Scaling Laws for Neural Language Models》,Transformer 模型推理总算力公式为 C≈30ND(N 为模型参数量,D 为 token 长度),结合 Sora 2(20B 参数量)与 Sora 2 Pro(30B 参数量)参数,及不同分辨率视频的 token 长度,测算得:Sora 2 推理 10 秒 360p 视频需 221 H100 - 秒算力,10 秒 720p 需 883 H100 - 秒;Sora 2 Pro 推理 10 秒 1024p 视频需 2637 H100 - 秒。按 H100 单卡算力 1979 TFLOP/s(FP16)、GPU 利用率 50%,及 H100 每小时 2 美元租赁价格,结合 ChatGPT 8 亿周活用户(假定每周使用 Sora 生成 10 秒 360p 视频 1 次),保守估计 Sora APP 每天带来 1400 万美元推理成本,年化超 51.2 亿美元,且未计入用户生成更高质量、更长视频的额外算力需求,凸显算力在 AI 竞争格局中的决定性地位。当前 OpenAI 已与 NVIDIA、AMD 达成合作,计划部署高达 10GW NVIDIA Vera Rubin 系统与 6GW AMD Instinct GPU 设备,匹配庞大推理需求。

六、投资建议与风险提示

(一)投资建议

  1. AI 应用端
    :Sora 2 三日登顶美国 iOS 应用榜,验证 “为产品定义功能” 思路的重要性,关注以阿里为代表的国内互联网大厂的 AI 投资与生态圈建设,包括国产芯片链企业、ISV 厂商;AI - Pre 环节作为企业数据集成入口直接受益,推荐泛微网络、金蝶国际等 OA + ERP 厂商;垂直场景中,医疗、教育、市场营销等领域 AI 收入落地更快,推荐拓尔思、万兴科技(多模态生成)、金山办公(AI + 办公)等,降本方向关注税友股份、视源股份等。
  2. 算力端
    :Sora 2 庞大推理算力需求凸显算力重要性,本地推理起量利好服务与云厂商,推荐浪潮信息、中科曙光、海光信息、深信服等;端侧 AI 潜力大,推荐虹软科技、中科创达等;同时关注 NVIDIA、AMD 产业链相关企业,如神州数码、工业富联等。

(二)风险提示

  1. 产业商业化落地不及预期
    :当前 AI 各环节产品商业化模式仍处探索阶段,若推进节奏放缓,将对相关企业业绩产生不利影响。
  2. 市场竞争风险
    :海外 AI 厂商凭借先发优势与技术积累占据优势,国内众多企业入局 AI 视频生成,可能出现同质化竞争,影响企业收入。
  3. 政策风险
    :AI 技术发展受政策监管影响大,若企业未能及时适应相关监管政策,可能面临处罚或业务调整。
  4. 地缘政治风险
    :美国对中国算力芯片出口限制可能影响国内企业芯片获取,阻碍产品研发与市场竞争力,同时可能影响 AI 产品海外市场开拓。


【报告】Sora专题一:一文读懂Sora2核心点:每日烧掉1400万美元!揭秘惊人算力成本的背后逻辑(附PDF下载)图2
【报告】Sora专题一:一文读懂Sora2核心点:每日烧掉1400万美元!揭秘惊人算力成本的背后逻辑(附PDF下载)图3
【报告】Sora专题一:一文读懂Sora2核心点:每日烧掉1400万美元!揭秘惊人算力成本的背后逻辑(附PDF下载)图4
【报告】Sora专题一:一文读懂Sora2核心点:每日烧掉1400万美元!揭秘惊人算力成本的背后逻辑(附PDF下载)图5

☟☟☟


精选报告推荐:

11份清华大学的DeepSeek教程,全都给你打包好了,直接领取:




 10份北京大学的DeepSeek教程

8份浙江大学的DeepSeek专题系列教程

4份51CTO的《DeepSeek入门宝典》

5份厦门大学的DeepSeek教程

10份浙江大学的DeepSeek公开课第二季专题系列教程

6份浙江大学的DeepSeek公开课第三季专题系列教程


篇幅有限,部分展示
加入会员,任意下载

资料下载方式


Download method of report materials

关注公众号回复:HX1013
即可领取完整版资料
【报告】Sora专题一:一文读懂Sora2核心点:每日烧掉1400万美元!揭秘惊人算力成本的背后逻辑(附PDF下载)图6

【报告】Sora专题一:一文读懂Sora2核心点:每日烧掉1400万美元!揭秘惊人算力成本的背后逻辑(附PDF下载)图7

如需获取更多报告

扫码加入
“人工智能产业链联盟”
知识星球,任意下载相关报告!


报告部分截图


【报告】Sora专题一:一文读懂Sora2核心点:每日烧掉1400万美元!揭秘惊人算力成本的背后逻辑(附PDF下载)图10
声明

来源:中信建投证券,人工智能产业链union(ID:aiyuexingqiu)推荐阅读,不代表人工智能产业链union立场,转载请注明,如涉及作品版权问题,请联系我们删除或做相关处理

编辑:Zero

【报告】Sora专题一:一文读懂Sora2核心点:每日烧掉1400万美元!揭秘惊人算力成本的背后逻辑(附PDF下载)图11


文末福利


1.赠送800G人工智能资源。

获取方式:关注本公众号,回复“人工智能”。


2.「超级公开课NVIDIA专场」免费下载

获取方式:关注本公众号,回复“公开课”。


3.免费微信交流群:

人工智能行业研究报告分享群、

人工智能知识分享群、

智能机器人交流论坛、

人工智能厂家交流群、

AI产业链服务交流群、

STEAM创客教育交流群、

人工智能技术论坛、

人工智能未来发展论坛、

AI企业家交流俱乐部

雄安企业家交流俱乐部


细分领域交流群:

【智能家居系统论坛】【智慧城市系统论坛】【智能医疗养老论坛】【自动驾驶产业论坛】【智慧金融交流论坛】【智慧农业交流论坛】【无人飞行器产业论坛】【人工智能大数据论坛】【人工智能※区块链论坛】【人工智能&物联网论坛】【青少年教育机器人论坛】【人工智能智能制造论坛】【AI/AR/VR/MR畅享畅聊】【机械自动化交流论坛】【工业互联网交流论坛】


入群方式:关注本公众号,回复“入群”

【报告】Sora专题一:一文读懂Sora2核心点:每日烧掉1400万美元!揭秘惊人算力成本的背后逻辑(附PDF下载)图12
【报告】Sora专题一:一文读懂Sora2核心点:每日烧掉1400万美元!揭秘惊人算力成本的背后逻辑(附PDF下载)图13“阅读原文”下载报告。

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号