在以后的直播间里,AI 不仅会说话,还会「演」。WAIC 首日,百度慧播星带来了一位熟悉却又全新的「主播」——以罗永浩为蓝本打造的数字人。在这背后,是百度新一代数字人技术 NOVA,这个系统曾撑起罗永浩数字人直播间创下的 5500 万 GMV。现在,它准备向更多人开放。百度给这套系统的定位是「平台化」的数字人解决方案。它不仅是一个拟真人物的生成工具,而是一个由 AI 驱动、可以独立完成脚本创作、语音演绎、动作生成和直播互动的完整系统。官方的表述更为直接:数字人可以超越真人,「每个人都可以比专业主播更会播」。数字人真正「演起来」这次 NOVA 在多个层面都做了结构性的升级。最核心的,是从传统的「脚本」进化为「剧本」系统。在直播过程中,数字人可以根据剧本信息,动态调整语调、表情甚至动作,使语音、神态与动作之间保持高度一致性。这种高度匹配,意味着数字人主播已经不再只是一个朗读机器,而更像一个具备表演能力的 AI 角色。 APPSO 现场体验生成效果动作生成也是关键部分。除了支持商品展示等常规动作,NOVA 首次实现了「数字人双人互动」——两位数字人可以在直播中进行自然的对话与配合,动作之间的衔接顺畅,甚至支持打断、接话等复杂场景。这种「默契感」此前在 AI 系统中很难实现。在声音方面,NOVA 通过语音克隆技术还原主播的声线、语气、讲话节奏,甚至包括某些口头禅。这一技术也支持双人协同带货场景,避免 AI 主播之间「抢话」或逻辑混乱的问题。 目前,NOVA 已在教育、健康等十余个行业的商家和达人中开启邀测。像知识博主艾弥儿,通过数字人接入万亿级知识库,让用户平均停留时长提升了 101%;蒙牛悠瑞的品牌数字人,则通过全天候服务和动态内容策略,让转化率提升了 33%。内容创作和直播间调度,由 AI 接管NOVA 的背后,是一个更为强大的 AI 大脑。在脚本生成上,它不仅能完成产品讲解文案的生成,还能匹配不同的人设风格,确保语言风格、情绪状态与品牌调性统一。百度称,这一模块的目标是「向顶级主播水平进阶」,并强调了风格化输出与情绪引导能力。问答系统则进一步提升了响应效率与交互密度。NOVA 可以在直播过程中同时处理多个用户提问,精准识别意图并即时回复,甚至引入当下热梗,增加直播间氛围。 更具想象力的部分,是直播间的实时调度能力。NOVA 可以在毫秒级时间内,根据用户行为与直播节奏,调度视频、PPT、镜头切换等素材,同时还能基于实时数据引入不同类型的「AI 角色」——例如助播、运营、场控等。这些角色可以协作完成发放福袋、调整价格、控制库存等任务,让整个直播空间更像一个高度自动化的内容工厂。4 月时,Create 百度 AI 开发者大会上,百度创始人李彦宏宣布了一项不算抢眼,但对整个电商行业可能意义深远的技术更新:百度优选正式开放 MCP Server。它的目标并不在于做一个新的电商平台,而是要把买东西这件事,变成AI可以自主完成的一项技能。简单来说,开发者可以通过 MCP 协议,快速接入百度优选的电商能力,而不必重复搭建商品查询、推荐、交易等系统。对电商行业而言,它或许代表了一种新的「用户接口」——服务的,不再只是人,还有 AI。未来,AI 智能体或许会成为电商链路中最重要的购买决策者,而 MCP 的价值,也才刚刚开始显现。数字人的边界正在被重新定义尽管数字人并不是新鲜概念,但 NOVA 的更新让人重新思考它在直播场景中的定位:不再是单一任务的执行者,而是具备创作、表达与协同能力的「数字劳动力」。以罗永浩的数字人为原型或许只是一个开始。百度所描绘的,是一个人人都能拥有「自己的主播分身」的平台。这套系统正在将「真人上镜」的门槛降到几乎为零,同时保留了人设表达、内容感染力等原本依赖经验积累的部分。 小红书博主@李格Greg 现场体验生成效果当一个数字人不仅能把商品讲清楚,还能用恰当的情绪演绎剧情、调度素材、回应观众、主动提问,它所扮演的角色,可能就不只是「像人一样」,而是「比人还熟练」。AI 主播是否会彻底改变内容创作与消费的节奏,还需要时间去验证。但百度的 NOVA 技术,确实向外界展示了一个更清晰的方向:直播,不用只靠「真人」完成。WAIC 2025 APPSO 在现场,欢迎加入社群一起畅聊 AI 产品,获取#AI有用功,解锁更多 AI 新知👇