字节跳动发布行业首个规模化落地的全双工语音大模型Seeduplex

【区角快讯】2026年4月9日，字节跳动正式对外发布其自主研发的原生全双工语音大模型Seeduplex。该模型采用“边听边说”的创新架构，突破了传统AI语音交互中“一问一答”的半双工限制，首次在真实产品环境中实现同步听与说的自然对话体验。

目前，Seeduplex已在豆包App完成全量上线，成为业内首个实现亿级用户规模部署的全双工语音大模型。其技术核心在于摒弃了过往“听完再说”的串行处理逻辑，转而支持语音输入与输出的并行流式处理。

该模型在两项关键能力上取得显著进展：一是精准抗干扰能力，通过持续监听机制有效识别并过滤背景噪声及无关人声，在复杂声学环境下将误回复率与误打断率降低50%；二是动态判停机制，融合语音信号与语义理解，智能判断用户是否结束发言——面对犹豫停顿可保持沉默倾听，确认发言完毕则迅速响应，抢话比例较半双工方案下降40%。

多维度评估数据显示，Seeduplex在对话流畅度与节奏控制方面全面超越传统半双工系统及主流应用的语音通话功能。其判停准确率提升8%，对话流畅度MOS评分提高12%，整体通话满意度上升8.34%。尤为突出的是，其打断响应表现已略微优于人类日常对话的平均水平。

在工程实现层面，该模型基于字节跳动自研大语言模型底座，结合架构革新、大规模语音预训练、推理加速与高可用保障体系，成功应对高并发场景下的性能挑战，确保亿级用户稳定流畅使用。即日起，用户只需将豆包App升级至最新版本，在“打电话”语音界面即可直接体验此项功能。

全双工语音交互正从实验室走向大众应用，Seeduplex的规模化落地标志着人机对话向真正自然交流迈出关键一步。