NVIDIA 开源 Audio2Face 模型及 SDK

NVIDIA英伟达 2025-10-15 18:00

NVIDIA 现已开源 Audio2Face 模型与 SDK,让所有游戏和 3D 应用开发者都可以构建并部署带有先进动画的高精度角色。NVIDIA 开源 Audio2Face 的训练框架,任何人都可以针对特定用例对现有模型进行微调与定制。


NVIDIA Audio2Face 通过生成式 AI 驱动的实时面部动画与嘴形同步,加速写实数字角色的创作流程。Audio2Face 利用 AI 根据音频输入生成逼真的面部动画。这项技术通过分析音素、语调等声学特征,创建动画数据流,并映射至角色的面部表情。这些动画数据既可用于离线渲染预设的资产,也可实时传输到动态的、由 AI 驱动的角色,实现准确的嘴形同步与情感表达。


Audio2Face 模型已广泛应用于游戏、媒体娱乐以及客户服务等行业。众多独立软件厂商 ISV 与游戏开发商都在其应用中采用了 Audio2Face。游戏开发者包括 Codemasters、GSC Game World、网易和完美世界。ISV 包括 Convai、Inworld AI、Reallusion、Streamlabs 和 UneeQ。


以下是开源工具的完整列表。


NVIDIA 开源 Audio2Face 模型及 SDK图1


以上为摘要内容,点击“阅读原文"或扫描下方二维码阅读完整内容:


NVIDIA 开源 Audio2Face 模型及 SDK图2

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
开源
more
NeurlPS'25开源 | 无与伦比的深度估计!Jasmine开启一切自监督CV任务的新大门!
北大开源TrackVLA++:赋予机器人推理与记忆,跟踪成功率飙升12%
Qwen3-VL再开源30B-A3B,附实测!
干掉同声传译?阿里又开源一模型,精通18种语言,离线可用
开源RL框架Verlog来了,专为LLM智能体打造,400回合不成问题
承认自己开源不行?转型“美国DeepSeek”后,两个谷歌研究员的AI初创公司融到20亿美元,估值暴涨15倍!
NeurIPS 25 | 中大&UC Merced等开源RAPID Hand,重新定义多指灵巧手数据采集
万亿级思考模型,蚂蚁首次开源!20万亿token搅局开源AI
国产游戏理解模型刷新SOTA,对话逗逗AI CEO:开源模型+行业数据是突破关键
可能是目前效果最好的开源生图模型,混元生图3.0来了
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号