Seko AI 想要重新定义短片创作这件事

极客公园 2025-09-29 19:06
Seko AI 想要重新定义短片创作这件事图1
AI 视频生成产品开始走向「可控」。

作者|甘德

编辑|郑玄

在今年 3 月 DeepSeek 和豆包占领国内产品月活用户增速前两名的时候,以第三姿态紧随其后的,是红果短剧。两者之间这个巧合的「偶遇」,意外也不意外。反映的正是我们当下经历的最重要的技术与文化浪潮。

人们的生活被分割的愈发碎片化,内容消费比以往任何时候都更坚定的向短影像走去。这其中,或许短剧的发展是最有说服力的注脚。

微短剧用户在 2024 年底已经达到 6.62 亿,微短剧独立 APP 的人均单日使用时长也涨到了接近 2 小时。在第三方数据平台 QuestMobile 发布的数据里显示,红果短剧在 2024 年 12 月的月活用户规模达 1.58 亿,月活直逼优酷 APP。这 3000 万不到的用户规模差距,在 2025 年上半年被轻松磨平。今年 6 月,红果短剧月活用户已达 2.1 亿,力压月活刚过 2 亿的优酷 APP。这也是短剧 app 用户月活首次超过主流的长剧 app。

而新的技术向生产力工具的转变,也总是发生在当下最热闹的场景里。

从去年到今年,AI 视频生成逐渐变成这股大模型浪潮中最具活力的方向之一。而视频生成产品的迭代方向,也慢慢从 AI 爱好者手中的新玩具,向专业内容创作者和短剧、漫剧等剧集制作工业靠近。

但即使如此,AI 能力对短片制作的能力加持,很多时候仍然被孤立地安放在各个不同的环节上。从策划、剧本创作、选角到拍摄、后期制作、配音等,即便最轻松的短剧,这套流程的效率和成本压力仍然巨大。

这也是商汤科技推出 Seko 的原因——如果有办法把 AI 能力在这一整套流程里流通起来,为什么不呢?

Seko 是行业首发的创编一体的 AI 视频创作 Agent,基于自然语言交互实现全流程视频创作。它不是单一的"视频生成器",而是一个将视频创作全流程都纳入进来的生产线。综合用户的实际反馈,Seko 已经带来了巨大的效率提升,过去需要 5 人一周完成的工作量,现在 1 人一天即可完成;"万元级每分钟"的动画视频,成本现在可以降至千元级别。

目前,上线一个多月的 Seko 已迅速积累超 10 万专业用户,累计生成视频超过 50 万条,越来越多在短剧工作室、广告公司、MCN 机构,以及普通创作者和非专业用户都开始使用 Seko。


01

5 分钟走完全流程,

看AI如何拆解一部短片?


带着「制作短片」的目标打开 Seko,你一定会对这个过于简洁的页面感到意外——几乎就是一个对话框。Seko 的起手式也很简单,你可以选择用自然语言描述故事大纲,或者上传自己已有的角色,也可以选择你喜欢的美术风格。

然后,Seko 将会复刻人类创意团队的全部工作流程,从「策划摘要」、「美术风格」、「角色主体」、「场景概念」、「音乐风格」、「分镜剧本」的策划逐个展开——这也是剧本影视化的一个几乎完整的流程。你还可以通过自然语言指令,完成对任意环节的实时干预和修改。

以上所有策划完成后,Seko 正式进入分镜设计——而这也是 Seko 最让人惊喜的地方之一。传统流程中,分镜的成型和视频化是短片制作工作量最大的一个环节。一个上紧发条的职业分镜师,用 storyboard pro 一天也就只能画出不超过 5 分钟的分镜镜头。

如果说之前所展现的 Seko 是一个拥有复杂剧本拆分分镜能力的剧本策划,那从画分镜之后,它开始变成一个天才般的分镜画师和掌控全局的 AI 导演。

在从策划文档转入分镜生成的流程后,Seko 也转入了分镜编辑器的界面。在这里,你不但可以调整图像的尺寸、比例、横屏或竖屏。更关键的,每一个分镜都实现了可自由编辑,让创作者可以充分发挥自主性,实现心目中的理想效果。

比如 Seko 在配音部分提供了「画外音」和「对口型」两种模型,并且有多种音色可选。尤其可以实现了人物、动物角色,以及单人或多角色同时对口型、先后对口型等高难度需求。

Seko 的分镜编辑器还提供了首尾帧交互功能。只需简单地选取下一个分镜做尾帧,就可以孵化出中国风一镜到底的效果,轻松创造出在小红书、抖音以及短剧中传播的爆款内容。

从一个故事到一个精致短片,整个制作过程不到 5 分钟。走完 Seko 的整个短片制作流程,整体感觉就是非常丝滑。而最终的成片,也反映出 Seko 背后专业的影视行业 knowhow 的积累。

在个人用户 @ 王祉君 用 Seko 制作的创作大赛获奖短片《飞天计划》中,我们可以很清晰地看到同一场景中远景、中景和特写之间的递进变化。凭借优秀的镜头语言优化能力,Seko 可以很丝滑的用镜头环绕拍摄、人物正反打、光线变化等效果来表现画面切换之间的情绪变化。

也正是因为大量影视行业 knowhow 的积累,Seko 才能把视频创作的诸多痛点转化成产品中的亮点。

02

把行业 knowhow 变成产品


事实上,不止于镜头语言上的优化,Seko 更把这一套与影视团队一起打磨出来的专家经验,内化在了各类视频创作的痛点解决中。

如何在多分镜中,实现主体角色、场景、风格、光线等连续的一致性,是目前视频生成领域最大的痛点

在制作工业中,分镜是整个制作流程中的通用语言,连接着导演、编剧、摄影、美术、剪辑等所有部门。单一的视频生成更像是一个动态的、精美的插图。它展示的是 AI 理解 prompt 和生成连贯画面的能力,分镜则是影视工业语境下的一个承上启下的环节,它关乎节奏、视角、连贯性和情绪流,最终要为连贯的视频作品服务。

而分镜「可用」却有一个前提,那就是角色、场景等在多分镜中的一致性。只有一致性能够保证的前提下,这些分镜画面才真正意义上地嵌入了真实的生产流程。在一致性的表现上,Seko 的表现称得上惊艳。

除了在一致性上的表现,Seko 全流程的可编辑能力也让它能够在众多视频生成产品中,是最靠近真实影视制作工业场景的那一个。

短剧和视频创作团队,经常需要对作品进行细节修改和优化,确保作品的所有镜头呈现都完美符合预期。而 Seko 的整个创作流程都可以被反复编辑,无论剧本策划、角色,还是每一个分镜画面都可以在不影响其他因素的情况下,独立进行编辑,提高了创作效率,同时确保创作内容的可控性。

如果把对于可编辑性的定义再拓展一些,多种模型的自由选择,或许是 AI视频生成产品中潜力最大的一种可编辑性。

Seko 在模型调用上为创作者聚拢了市面上最强的生成模型阵容,了 Seko 自研模型,还有比如可灵、即梦、海螺、Wan、Veo 等支持着从创建角色到分镜图生成,再到视频生成这整个创意流程的,并不是单一的模型能力,从这一点上,Seko 比所有同类型产品都更像是一个影视创作的成熟解决方案。

这样在最终生成视频时,我们可以在不同分镜,分别选择擅长打斗效果的模型、擅长人物运动物理效果的模型、擅长首尾帧的模型、擅长动漫风格的模型。通过灵活调用,满足导演的风格和审美需求偏好。同时,由于不同模型消耗的积分不同,创作者也可以更灵活地控制制作成本。

现在一些深度合作的影视工作室已经在用 Seko 量产短剧和漫剧。Seko 也通过融合大量专家经验以及和工作室共同打磨,构建出了一套符合影视行业视听语言的剧本生成策略,在机位、镜别、构图、运镜方式等方面优化,有效传达故事逻辑、表现情绪张力。比如在短剧中高频的对话场景中的,不需要用户输入专业要求,就可以直接产出过肩正反打镜头。再如在武打场面中,可以通过大远景交代环境、追逐跟随镜头、人物表情特写、多机位展现打斗过程等方式,营造一个完整专业的叙事场景,帮助实现高效创作,符合专业的影视语言。

或许从 Seko 开始,我们应该摆脱 AI 视频生成作为一个「玩具」的印象,而更严肃的看待这种技术与创作者的关系了。


03

「工作流整合」带来的生产力


Seko 身上最鲜明的特质,是一种对「分工」和「可控」的强调。

亚当·斯密在《国富论》里用制针工厂举过一个经典的例子:一个工人如果独立完成所有工序,一天可能连一根针都造不出来。而将制针过程分为 18 道工序,由不同的工人专门负责,平均每人每天可以生产成千上万根针。这就是分工带来的效率奇迹。

每一次工业革命本质都是一场由生猛的技术革新发起,最终在精细的分工中真正改变世界的效率革命。大模型的技术演进也不例外。

AI 短片制作由多个复杂环节组成,每个单一环节都像是一个独立的工作流。创作者需要在一个语言模型产品中打磨剧本和人物关系,然后再用文生图的多模态模型形成分镜,最后用视频生成模型来形成短镜头片段最终组成短片,而在视觉画面之外,配音和配乐则需要另外调用语音模型。任意一点想法上的变化都意味着整个制作流程需要重来一遍,而创作者只能在这些散落的创作工具中疲于奔命。

这也是为什么 AI 短片这个眼下十分火热的内容方向,虽然市场上每天都有大量新作品层出不穷,但鲜有在剧情和制作上具备一定复杂度和深度的作品出现——虽然各个模态下的 AI 生成能力都已经有相当的水准,创作者也不缺好的故事和创意,但两方却被短片创作极度复杂而又紧密联系的内容生产链路所牵制。

在这种尴尬的现状下,在产品设计逻辑上贴近短片制作分工逻辑,在技术底色上与单一的模型能力解耦的 Seko,第一次跳出了 AI 生成能力作为一种制作工具的孤立角色,而更像整合了短片创作中所有工作流的一个 AI 原生解决方案。

同时这个解决方案又是精准可控的。创作者在创作过程中可以清晰的观察到自己需求是否被精准的实现,也可以在任何时候自由的回到短片创作的任何一个环节去对生成内容做进一步的修改。

对于专业的视频内容创作者或者有剧本的制作方来说,Seko 的角色是一个动态的、可协作的「视觉预演」沙盘。创作者能借此快速验证镜头语言、光影氛围甚至表演节奏的可行性,将抽象的剧本文字转化为具象的视觉共识;而对于当下这个影像时代的非专业视频创作者来说,Seko 带来了一种技术上的平权,让长于创意或者文字叙事的人能够越过繁琐的技术壁垒,精准可控的将其转化为视觉表达。这不只是创作门槛的降低,更是创作主体和美学可能性上的极大拓宽。

这 AI 视频生成领域的重要一步,或许已经由 Seko 跨出来了。

*头图来源:Seko
本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

极客一问
如何看待 AI 视频创作 Agent Seko


Seko AI 想要重新定义短片创作这件事图2
Seko AI 想要重新定义短片创作这件事图3

Seko AI 想要重新定义短片创作这件事图4

热点视频

新机曝光!苹果明年上半年或推出  iPhone 17e。

点赞关注极客公园视频号
观看更多精彩视频


Seko AI 想要重新定义短片创作这件事图5

更多阅读



Seko AI 想要重新定义短片创作这件事图8
Seko AI 想要重新定义短片创作这件事图9

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI
more
十亿级参数,千亿级性能,上海AI Lab发布新一代文档解析大模型,复杂场景解析精度媲美人类专家
千里科技AI战略布局完成第一步
OpenAI「降配门」发酵,偷换模型遭全网实锤;小米 SU7 在日本首秀;苹果内部测试类 ChatGPT 应用|极客早知道
【AI】Qwen开源版Banana来了!原生支持ControlNet
E周视界:存储巨头掀涨价潮!汇川联合动力深交所上市;阿里3800亿AI基建...
中国造不出AI芯片?黄仁勋澄清三大谣言!
OpenAI:人类只剩最后5年
【报告】2025年软件技术年报STAR-十大AI关键技术与趋势(附PDF下载)
埃斯顿携全新机器人新品、行业解决方案、AI+数字化技术闪耀工博会!
「越狱神器」91助手停止服务/雷军:小米汽车定制服务推动科技平权/黄仁勋:应该把钱都给OpenAI
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号