上周我们发布了的文章,和一起AI Coding的小伙伴交流后发现,最常被问题到的两类问题——一个是“我想开发某个类型的应用,用哪个模型效果更好?”;再就是“我需要调用不同种类的多个模型,每个模型都要适配和管理API,有没有效率高一点的方法?”。
今天我们就用最近做的AI小应用为例,和大家分享下0代码开发AI应用的过程,做到一个API搞定所有模型(All Model in ONE API)。

正好最近“高雅人士”表情包火了,咱来开发一个“热梗表情包生成器”,做个个人专属“高雅人士”。效果如下(表情包在文末评论区自取
):

准备工作
1、需求梳理
这次要做的是一个“热梗表情包生成器”。主要利用文生图或者图生图大模型能力,快速将热梗做成meme表情包,或者仿制爆火的表情包。
2、开发工具
因为上次评测后,我个人和同事的后续反馈很好,这次依然延续Claude Code和MiniMax M2作为开发工具(其实是懒得写新工具的使用测评~),采用Vibe Coding的方式,具体怎么实现参考《》。
3、模型准备
一、方案选择
为了方便模型选型和模型的测试调试,采用的是MaaS API方案调用应用会使用到的各类模型。
MaaS(Model as a Service,模型即服务):指通过云端 API 提供模型能力的服务模式。
这次开发的MaaS平台选用的是 GMI Cloud[1] ,之前的项目用过他们的推理引擎(GMI Cloud Inference Engine),开发和后期运行的感觉都还不错。他们最近上线了MiniMax家的全套模型,正好满足这个AI应用的需求。

GMI Cloud现在支持的LLM,包含MinMax、GLM、Deepseek、Qwen、Kimi、LAMA系列各款模型
二、API 准备
GMI Cloud的使用流程很简单,注册后点击右上角 “Redeem Voucher”,在弹出窗口中输入兑换码就可以看到充值到账了。
然后右上角点击“API Keys”进入API的管理界面:
我的习惯是一个AI应用一个专属的API Key,方便我管理和统计用量。这里看到我有两个Key,“Code”是我使用GLM4.6、K2、Qwen3来Coding的,用一个Key避免了在几个模型官网和多个Key之间来回切换的麻烦。
“Video”这个Key就是这回“热梗表情包生成器”要用到的API Key了。记录下来,准备工作就完成了。
GMI Cloud最近上新模型,划到最后进群有优惠券可以领!
(无聊的)开发
开发过程真的很无聊……。
1、需求确认
还是先使用CC的Plan模式,提示词如下:
我想要制作一个网页应用“热梗表情包生成器”,能够根据输入的网络热梗(可带参考图),利用视频生成模型生成可下载的gif表情包,需求如下:
1. 输入支持文字,或文字+图片两种模式
2. 利用LLM对输入的文字提示词进行拓展
3. 先对视频生成模型生成的视频进行预览,用户满意后,点击进行gif生成再生成后下载
LLM选用MiniMax M2,API参考文档 xxxxx
视频生成模型选用Minimax-Hailuo-2.3,API使用文档参考 xxxx
这里我选用的MiniMax M2作为扩词模型。值得一提的是,GMI Cloud目前和MiniMax官方有联动活动,现在有不少免费用量😉。
选用海螺2.3生视频则是因为,在GMI Cloud中每一个模型都有广场可以快速的测试模型效果和调整参数,在用相同的提示词比较了n多个模型后,海螺2.3是现有视频模型中性价比最高的。
这里说一下,前面提示词中XXX的部分就是把GMI Cloud模型的使用文档复制粘贴进去,因为是同一平台提供的服务,多数MaaS平台会统一API接口(GMI Cloud现在支持的是OpenAI格式的接口),一个文档就可以搞定众多模型的调用!
在CC Plan模式下经过几轮对话后,确定了应用的功能和开发计划:
2、第一阶段开发
开始执行计划后我就去吃饭了……CC+MiniMax M2根据Todos自己开始了开发工作。
吃完饭回来后测试遇到了几个bug,继续对话粘贴错误代码和我需要的改进,完成第一阶段后的反馈如下:
把准备工作中准备好的API Key复制到环境文件中,就可以开始使用测试了。提示词:
热梗“高贵的优雅”,一只且手拿红酒杯独自慢舞。
手动测试结果,前端显示操作,APIN能够正常调用模型,各项设计功能也符合预期。可能是GMI Cloud底层搭载的是H100/H200,视频的生成速度也比预期的要快的多。
2、第二阶段开发
然后进入第二阶段开发。我个人的习惯通常在每个AI应用开发中用二阶开发模式,第一阶段是实现基础的设计功能,后端能运行,前端能看得过眼,就是达到“能用”的标准。
第二阶段是根据第一阶段的表现和暴露的问题,进行流程的改进和必要功能的的添加。
注意!阶段≠对话轮数。很多功能和bug是需要多轮对话才能修复和实现的。
这是第二轮的调试后的结果,增加了直接视频生成gif的功能,同时完善了提示词扩展的多模型选择功能。
最终生成视频和gif的效果预览:

结语
在实际的使用中,三个场景需要频繁调用/切换不同模型:
-
产品验证过程:通常需要开发人员或者客户针对同一功能和流程用不同的模型测试哪个效果更贴近真实需求。 -
需要多种类大模型的应用:和这次的热梗生成meme一样,真实的落地场景通常需要不同大模型(文本LLM、语音生成、图像生成、视频生成)之间形成完善的工作流。 -
用户要求:要求支持不同厂家不同型号的模型,原因未知😓~
传统的做法是,每使用一个模型,就到它的官网去拿一个API,查看一遍使用文档,然后针对不同模型开发接口,分别配置API……
GMI Cloud 作为 MaaS 平台解决了模型选择和 API 调用复杂繁琐的问题,同时配合它简洁明了的操作文档和良好的配置体验(上周刚更新了UI),让我可以轻松实现 All Model in ONE API 。
我可以在平台提供的模型广场测试不同的模型的效果,完成产品和概念验证;然后使用一个API、一套接口调用多个模型,不仅是单纯的的文本LLM,还可以方便的在语音生成、图像生成、视频生成等多种类大模型间切换。
除了模型本身的选型和调用更方便快捷之外,通过单一平台调用模型还能保证性能和传输的稳定性,避免不同厂家规格不一致和网络问题,也更容实现根据用量和功能后端切换模型的功能,节省开支。
最后说一下这个应用的真实落地拓展——加入语音和图片生成能力,制作一个海外电商商品自动推广视频和广告制作神器,有兴趣的同学自己尝试一下。