清华系大模型创企,又融几个亿!作者 | ZeR0编辑 | 漠影智东西9月19日报道,北京多模态大模型创企生数科技今日宣布完成新一轮数亿元A轮融资。该轮融资由博华资本领投,百度战投、北京市人工智能产业投资基金、启明创投、达泰资本、BV百度风投等老股东持续跟投,建发新兴投资等产业合作方加码跟投。新一轮融资将用于模型研发和技术创新,探索多模态大模型的智能上限和应用广度,同时将持续加强产品拓展、用户服务、产业合作和全球商业布局。生数科技由清华大学计算机系师生创办,于2023年3月由瑞莱智慧RealAI、蚂蚁和BV百度风投联合孵化成立。瑞莱智慧、百度、蚂蚁集团、华为哈勃、智谱等均是生数科技的投资方。▲生数科技历史融资历程(来源:企查查)其核心团队由来自清华大学、北京大学、帝国理工学院、卡耐基梅隆大学等顶尖高校的技术人才和来自产业界的产品研发、产业服务人才组成。该公司专注于多模态大模型及应用的自主研发。其核心产品Vidu具备AI图像生成、视频生成、音频生成等能力,广泛应用于互联网、广告、电商、动漫、文旅、广电、教育、游戏及影视等行业领域。2024年7月,Vidu在全球上线,全球首创「参考生」图片/视频概念。其在AI视频生成和AI生图领域已覆盖全球200多个国家和地区的超3000万用户和6000家开发者及企业。通过Vidu累计生成视频数量超过4亿,其核心功能参考生视频和参考生图的数量已超过1亿,其中商业内容素材生成量占比超过50%。今年9月9日,生数科技正式将其视频大模型Vidu的Q1参考生图功能向大众用户开放。其参考生图功能同时支持7张参考图输入,可在多人、多场景、多次生成下保持人物/主体的面貌与特征不跑偏,并支持“一张图 + 一句提示词”自由换装、换背景、合成。例如,上传人物、道具、服饰、配饰等多张参考图,让小李子坐在霍格沃茨学院的教室里练习魔法。Vidu Q1参考生图能把它们自然得拼到一张图里。由Vidu Q1参考生图功能生成的图像,能够保持人物发型、五官、书本插图等与原图一致,每个物品位置摆放正确,且比例合理。该功能可以被用来快速制作时尚杂志封面:也可以用它来设计中秋礼品营销样稿:让林黛玉代言川贝枇杷膏,看起来同样有模有样:Vidu Q1参考生图还能实现“合影自由”,上传场景照片、多个单人照,即可生成合影。换背景更是不在话下:动漫人物分分钟就能加上特效:把照片中的特定素材替换成其他东西,也变得高效:还可以让图中的南瓜变大1倍、1.5倍:AI虚拟换装、换场景都更加便利。比如把裙子换上时髦的碎花花纹:再比如上传人物照、裙子照、场景照,让AI生成霉霉的结婚现场图:或者让模特在银白色现代化的室内房间中,分别换上西服、晚礼服、紧身装、休闲运动装:Vidu Q1参考生图还可以用于一些有趣的P图玩法。比如把真人变手办:或是把线稿转3D:给指定建筑换成木头材质,然后上色:把平面照片变成冰箱贴:生数科技CEO骆怡航博士认为,多模态生成技术在数字内容产业中的商业化进程正在加速,但目前仍处于早期阶段。他预计在未来三年内,多模态生成将重塑全球数字内容的生产方式,全面渗透到各行各业的内容生产与消费环节,展现出巨大的市场空间与全球性增长潜力。