
中邮证券:
《从工具到社交生态,Sora 2引领AI多模态转型》
(完整版.pdf ) 以下仅展示部分内容
下载方式见文末
中邮证券:
中邮证券发布的《从工具到社交生态,Sora 2 引领 AI 多模态转型》报告,聚焦 OpenAI 推出的 Sora 2 及配套 App,深入分析其技术升级、社交功能创新、商业价值与算力需求,同时给出投资建议与风险提示,全面展现 AI 多模态领域的发展态势与投资机会。
一、Sora 2 与配套 App:技术突破与社交生态创新
(一)Sora 2:三大技术升级,开启创意领域 “ChatGPT 时刻”
2025 年 9 月 30 日,OpenAI 发布 Sora 2,被 CEO 奥特曼称为 “创意领域的 ChatGPT 时刻”,相较 2024 年 2 月发布的早期 Sora,实现三大关键升级:
- 音画同步
:可生成与画面高度匹配的音轨、配音及对话,解决早期模型音频与画面不同步的问题,让生成视频更具沉浸感,满足用户对完整视听体验的需求。 - 物理准确性提升
:对流体、重力运动等复杂物理现象的模拟更真实,例如奥运会体操动作中的肢体运动轨迹、物体坠落的重力效果等,贴近现实世界物理规律,提升视频可信度。 - 一致性与可控性优化
:在多镜头或不同场景间,能保持人物形象、风格的连续性,且更精准响应用户提示词,无论是延续角色设定还是统一视频风格,均表现更稳定,为用户创作连贯叙事内容提供支撑。
这些升级使 Sora 2 能精准遵循指令,创作兼具想象力与真实动态的视频,既拓展叙事与创意表达工具库,也向精准模拟物理世界复杂性的模型迈进。
(二)Sora App:社交功能破局,打造 AI 时代 “新物种”
OpenAI 同步推出的 “Sora by OpenAI” iPhone 应用,表现亮眼:上线第四天登顶美国 App Store 免费应用榜,超越 ChatGPT 与谷歌 Gemini;尽管处于邀请制测试阶段,仅开放美国和加拿大 iOS 设备,上线头两天仍获 16.4 万次下载,首日下载量与 xAI 的 Grok 持平,凸显巨大市场潜力。其核心竞争力在于两大革命性社交功能:
- 客串(Cameos)
:用户通过一次性简短音视频录制完成身份验证与形象捕捉后,Sora 2 模型可高保真复刻用户形象,用户授权后,能将个人虚拟形象置入任意 AI 场景,生成 “客串视频”。该功能打破 AI 社交中 “虚拟与现实脱节” 的壁垒,依托熟人关系链降低创作与分享门槛,激发用户参与热情。 - 混剪(Remix)
:内置剪辑工具支持用户仅通过输入提示词,对平台任意视频进行 “二创”,生成个性化版本。此功能降低二次创作技术门槛,促进 UGC(用户生成内容)生态繁荣,形成内容裂变传播效应,使 Sora App 从单纯视频生成工具向社交平台转型,有望成为 AI 时代的 “TikTok”。
此外,Sora App 的成功标志着大模型厂商竞争从 “模型技术比拼” 升级至 “产品落地与商业变现” 维度,将加速 Google、Meta 等大厂跟进迭代 AI + 社交产品,推动 AI 多模态新蓝海市场形成。
(三)商业战略转型:从对话工具到社交生态,激活 8 亿用户价值
OpenAI 推出 Sora App,本质是从 “单一对话工具(ChatGPT)” 向 “生态化社交平台” 的核心战略转型。截至 2025 年 10 月,OpenAI 已有 400 万名开发者使用其模型构建产品,超 8 亿人每周使用 ChatGPT,API 每分钟处理 60 亿 tokens,较 2023 年(200 万每周活跃开发者、1 亿每周活跃用户)实现指数级增长。
Sora App 通过串联 “模型能力→用户场景→商业变现” 完整链路,构建 “数据飞轮 + 社交网络” 双重护城河:一方面,社交互动产生的海量用户数据反哺模型优化,提升生成效果;另一方面,社交网络增强用户粘性,避免单一工具属性导致的增长乏力,助力 OpenAI 从 “AI 工具提供商” 转变为 “AI 生态构建者”,盘活 8 亿周活用户(WAU)资源,为后续价值变现奠定基础。
二、AI 视频生成:广阔商业空间与创新商业模式
(一)市场规模:2032 年有望达 25.63 亿美元,社交媒体领域增速领先
当前 AI 视频生成商业化路径逐步清晰,分为 To C 与 To B 两端:To C 端以付费订阅为主,如快手可灵、字节即梦等提供免费版、标准版、高级版等不同等级服务,月费从数元到数百元不等;To B 端通过 API 接口与解决方案服务,覆盖影视、互联网、营销广告等领域,月费从数十元到数万元不等。
据 Fortune business insights 测算,2024 年全球 AI 视频生成市场规模为 6.15 亿美元,预计 2025 年达 7.17 亿美元(同比增长 17%),2032 年将增至 25.63 亿美元,2025-2032 年复合增速达 20%。分领域看:
- 营销和广告
:2024 年占比最大,因 AI 视频生成能优化广告内容质量与成本效益,满足目标受众特定需求、增强品牌知名度,是当前核心应用场景。 - 社交媒体
:预测期内增速最高,得益于深层图像处理、自然语言处理等多媒体技术普及,可生成更丰富的视频内容、提升用户参与度,成为驱动市场增长的关键力量。
(二)商业模式创新:“IP + 创作者” 收入分成,重塑视频产业生态
OpenAI 正构建围绕视频生成、由 IP 驱动的新生态,核心聚焦 “精细化控制” 与 “收入分成”,推动 Sora 从工具升级为连接 IP 方与创作者的经济平台:
- 精细化控制
:为版权方提供更细粒度的角色生成控制权,类似 “肖像同意” 模型,版权方可灵活管理自身 IP 角色的生成范围与使用场景,保障 IP 权益。 - 收入分成
:计划将部分收入分享给授权用户生成其角色的版权方,同时让创作者合法、低成本使用知名 IP(如蝙蝠侠、皮卡丘、《三体》角色等)创作视频,爆款内容可获得平台分成。
这一模式对产业链各方意义重大:对 IP 方(好莱坞、游戏大厂、日漫出版社),沉睡的 IP 资产库转化为持续收益来源,还能通过创作者内容维持 IP 热度,数据反馈(如角色受欢迎程度)可指导后续创作;对创作者,创作核心从 “技术操作” 转向 “提示词工程与审美”,降低创作门槛的同时,实现商业价值变现,重塑视频产业商业机会。
三、算力需求:Sora 引领 AI “军备竞赛”,OpenAI 加码万亿级扩张
(一)Sora 2 推高算力需求,推理阶段消耗显著
AI 多模态训推阶段对算力需求大幅提升,Sora 系列模型的算力消耗呈指数级增长:
- 训练阶段
:据 Factorial Funds 预测,训练 Sora 模型一个月需 4200-10500 片英伟达 H100 AI 加速卡;若用单张 H100 生成 1 分钟视频,需渲染 12 分钟。 - 推理阶段
:Sora 的计算消耗远超文本与图像生成模型 —— 每输出 1 分钟视频的推理成本,比 GPT-4、LLama 2 输出 1000 个文本 Token,以及 DiT 输出一张 512x512px 图像,高出数个数量级;峰值期部署 Sora 文本转视频模型,需 72 万片英伟达 H100 AI 加速卡。
Sora App 通过收入分成提升用户创作意愿,将进一步增加推理算力需求,推动 AI 算力 “军备竞赛” 升级。
(二)OpenAI 万亿级算力扩张,8 年能源需求拟增 125 倍
为支撑算力需求,OpenAI 启动超大规模算力扩张计划,2025 年以来已签署多份重磅合作协议,总投资预计高达 1 万亿美元:
与甲骨文签订 3000 亿美元算力购买订单,2027 年生效,为期 5 年; 与英伟达达成合作,计划通过数千兆瓦(GW)数据中心扩展算力,英伟达拟逐步投资最高 1000 亿美元,金额随每千兆瓦部署进度落实; 与 AMD 签订四年协议,AMD 将提供数十万块 AI 芯片,部署 6 吉瓦(GW)GPU 算力,OpenAI 获最多 10% 持股选择权,首批 1 吉瓦 AMD Instinct MI450 GPU 于 2026 年下半年启动部署; 在美国得克萨斯州阿比林市建设占地堪比纽约中央公园的计算中心,标志 AI 产业进入基础设施建设竞争新阶段。
能源需求方面,OpenAI 2025 年初算力基础设施耗电约 230 兆瓦,预计 2025 年底超 2 吉瓦,长期目标为 2033 年保障 250 吉瓦电力供应,8 年内能源需求拟提升 125 倍,规模将超过当前印度的能源产能。
四、投资建议与风险提示
(一)投资建议:聚焦五大核心方向
- AI 多模态
:推荐万兴科技、虹软科技、当虹科技、中科创达等,这类企业在视频生成、图像处理等多模态技术领域布局深入,有望受益于 Sora 2 带动的行业红利。 - AI+IP
:关注阜博集团、国投智能、视觉中国、中文在线等,IP 与 AI 视频生成结合的商业模式创新,将激活 IP 资产价值,相关 IP 运营与版权保护企业将直接受益。 - AI Agent
:建议布局鼎捷数智、视源股份、泛微网络、金蝶国际等,AI Agent 在企业办公、工业场景的应用逐步落地,这类企业在自动化、数字化领域积累深厚,能快速适配 AI Agent 技术。 - 国产算力
:重点关注寒武纪、云天励飞、浪潮信息、曙光数创等,国内算力需求激增,国产芯片与算力基础设施企业将迎来发展机遇,逐步填补算力供给缺口。 - 海外算力
:推荐新易盛、中际旭创、天孚通信、工业富联等,OpenAI 等海外企业算力扩张计划,将带动全球算力产业链需求,光模块、数据中心等相关企业有望持续受益。
(二)风险提示
- 地缘政治与贸易风险
:地缘政治冲突可能加剧跨境贸易壁垒,如核心芯片出口管制,将影响上游零部件供应,冲击 AI 算力与多模态技术研发进程。 - 技术迭代不及预期
:若 AI 大模型或 AI Agent 技术迭代放缓,将直接影响 AI 商业化落地节奏,降低客户付费意愿,拖累行业增长。 - 算力供应不及预期
:国内算力基础设施建设若未能及时匹配需求,会延缓大模型训练与推理进度,制约 AI 多模态应用场景拓展。 - 行业竞争加剧风险
:AI 多模态作为新兴领域,企业纷纷入局,竞争加剧可能导致企业盈利空间压缩,影响行业整体盈利水平。






☟☟☟
☝
精选报告推荐:
11份清华大学的DeepSeek教程,全都给你打包好了,直接领取:
10份北京大学的DeepSeek教程
8份浙江大学的DeepSeek专题系列教程
4份51CTO的《DeepSeek入门宝典》
5份厦门大学的DeepSeek教程
10份浙江大学的DeepSeek公开课第二季专题系列教程
6份浙江大学的DeepSeek公开课第三季专题系列教程
资料下载方式
Download method of report materials


如需获取更多报告
报告部分截图

编辑:Zero

文末福利
1.赠送800G人工智能资源。
获取方式:关注本公众号,回复“人工智能”。
2.「超级公开课NVIDIA专场」免费下载
获取方式:关注本公众号,回复“公开课”。
3.免费微信交流群:
人工智能行业研究报告分享群、
人工智能知识分享群、
智能机器人交流论坛、
人工智能厂家交流群、
AI产业链服务交流群、
STEAM创客教育交流群、
人工智能技术论坛、
人工智能未来发展论坛、
AI企业家交流俱乐部
雄安企业家交流俱乐部
细分领域交流群:
【智能家居系统论坛】【智慧城市系统论坛】【智能医疗养老论坛】【自动驾驶产业论坛】【智慧金融交流论坛】【智慧农业交流论坛】【无人飞行器产业论坛】【人工智能大数据论坛】【人工智能※区块链论坛】【人工智能&物联网论坛】【青少年教育机器人论坛】【人工智能智能制造论坛】【AI/AR/VR/MR畅享畅聊】【机械自动化交流论坛】【工业互联网交流论坛】
入群方式:关注本公众号,回复“入群”

