字节跳动发布行业首个规模化落地的全双工语音大模型Seeduplex

科技区角 2026-04-09 14:00

【区角快讯】2026年4月9日,字节跳动正式对外发布其自主研发的原生全双工语音大模型Seeduplex。该模型采用“边听边说”的创新架构,突破了传统AI语音交互中“一问一答”的半双工限制,首次在真实产品环境中实现同步听与说的自然对话体验。



目前,Seeduplex已在豆包App完成全量上线,成为业内首个实现亿级用户规模部署的全双工语音大模型。其技术核心在于摒弃了过往“听完再说”的串行处理逻辑,转而支持语音输入与输出的并行流式处理。

该模型在两项关键能力上取得显著进展:一是精准抗干扰能力,通过持续监听机制有效识别并过滤背景噪声及无关人声,在复杂声学环境下将误回复率与误打断率降低50%;二是动态判停机制,融合语音信号与语义理解,智能判断用户是否结束发言——面对犹豫停顿可保持沉默倾听,确认发言完毕则迅速响应,抢话比例较半双工方案下降40%。

多维度评估数据显示,Seeduplex在对话流畅度与节奏控制方面全面超越传统半双工系统及主流应用的语音通话功能。其判停准确率提升8%,对话流畅度MOS评分提高12%,整体通话满意度上升8.34%。尤为突出的是,其打断响应表现已略微优于人类日常对话的平均水平。

在工程实现层面,该模型基于字节跳动自研大语言模型底座,结合架构革新、大规模语音预训练、推理加速与高可用保障体系,成功应对高并发场景下的性能挑战,确保亿级用户稳定流畅使用。即日起,用户只需将豆包App升级至最新版本,在“打电话”语音界面即可直接体验此项功能。

全双工语音交互正从实验室走向大众应用,Seeduplex的规模化落地标志着人机对话向真正自然交流迈出关键一步。

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
大模型 字节
more
Coding拷问一切,独立大模型赛道的两年生死
【智合·政策速览】四川省经信厅征集工业垂直大模型和工业智能体重点培育项目
多媒体创作Agent:大模型能力跃迁下的创作新范式|智象未来(HiDream.ai)CTO姚霆主讲
大模型告别“免费午餐”:算力成本高企倒逼行业进入价值验真下半场
别怪 Anthropic 不开放新模型 Mythos,它实在太危险了
翁荔创业大模型首秀!告别“120亿美元估值0模型”
斯坦福年度结论:中美大模型已没差距
两家具身大模型公司拿下近50亿元融资;越疆完成A股上市辅导验收,拟新募资12亿元 | 一周资本大事件
从 RLHF 到 DPO:大模型偏好对齐的原理与实战
宠物健康大模型公司连融两轮,软硬一体化布局,已服务超200家宠物医院|早起看早期
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号