一句录音,现场让余承东“说阿拉伯语”!科大讯飞掏出AI落地最新成果

智东西 2025-11-06 14:29

一句录音,现场让余承东“说阿拉伯语”!科大讯飞掏出AI落地最新成果图1一句录音,现场让余承东“说阿拉伯语”!科大讯飞掏出AI落地最新成果图2

讯飞最强深度推理模型亮相,靠国产算力效率翻倍。
作者 |  程茜
编辑 |  李水青

智东西11月6日报道,今天,科大讯飞发布基于全国产算力的讯飞星火X1.5深度推理大模型,在全国产算力平台上攻克MoE模型全链路训练效率,端到端性能达到国际竞品效率的93%以上

科大讯飞董事长刘庆峰透露,该模型的语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力等可对标国际主流大模型。同时,星火多语言能力升级后支持130+种语言,整体性能达到GPT-5的95%以上。

一句录音,现场让余承东“说阿拉伯语”!科大讯飞掏出AI落地最新成果图3

刘庆峰谈道,当下AI红利兑现的四大关键核心是自主可控、软硬一体、行业纵深、个性化自主可控方面,目前在国内主流大模型中,讯飞星火是唯一基于全国产算力训练的通用大模型

科大讯飞还集中展示了在教育、医疗等诸多领域的落地进展。
科大讯飞正式发布AI软硬一体解决方案,搭载这一方案的讯飞智能办公本X5、讯飞AI翻译耳机、讯飞双屏翻译机2.0降噪能力升级;具备高度多模态交互能力的数字人导览“小飞”亮相上岗,能够实现多人自由对话、多语种交流,并具备个性化记忆能力;医疗方面,科大讯飞发布智医助理医院版1.0,支持辅助诊疗、辅助会诊、病历生成、病历质控;其发布原生AI陪伴App AI星朋友,支持160种人设定制;面向开发者,科大讯飞打造了首个支持RPA的智能体平台Astron。
此外,科大讯飞还首发百变声音复刻技术,用户仅需一句录音即可高保真复刻任意音色,再通过一条指令便可创造任意风格音频。
现场,科大讯飞副总裁、研究院执行院长刘聪基于一段音频创建了华为常务董事、终端BG董事长余承东说霸气将军、神奇法师风格的声音。
同时,百变声音复刻技术还支持英语、阿拉伯语、德语等多语音生成,其还基于余承东音色演示了说英语和阿拉伯语的声音。
 
01.
星火X1.5推理效率翻倍
1台昇腾标配服务器可部署

 

刘庆峰首先展示了科大讯飞在自主可控和底座模型上的进展。

科大讯飞此次发布的基于全国产算力的讯飞星火X1.5深度推理大模型,总参数量293B,激活参数量30B,1台昇腾标配服务器可部署,推理效率相比X1提升100%

星火X1.5在数学、综合答题、代码、知识问答、智能体等大模型测试任务中效果领先。高考数学测评结果中,星火X1.5得分145分,GPT-5得分141,DeepSeek V3.2-Exp得分140。

一句录音,现场让余承东“说阿拉伯语”!科大讯飞掏出AI落地最新成果图4

在国际数学奥林匹克竞赛IMO 2025第三题中,星火X1.5给出了正确答案。

一句录音,现场让余承东“说阿拉伯语”!科大讯飞掏出AI落地最新成果图5

还有教育和医疗方面,讯飞星火教育大模型、医疗大模型在辅助教学、辅助学习、辅助考试以及医疗知识问答、语言理解、诊疗推荐等方面,测评效果表现都超过GPT-5和DeepSeek V3.2-Exp。刘庆峰称,教育方面大模型能力平均得分超85分是一个门槛,过线的大模型寥寥无几。

一句录音,现场让余承东“说阿拉伯语”!科大讯飞掏出AI落地最新成果图6

此外,科大讯飞的多语言大模型能力持续升级,星火X1.5支持130多种语言,星火语音同传大模型2.0在知名行研机构IDC的评估报告中,8项评测拿下行业第一。

一句录音,现场让余承东“说阿拉伯语”!科大讯飞掏出AI落地最新成果图7

一周前,科大讯飞发布非自回归语音大模型架构,相比同尺寸的自回归语音大模型,效果相对提升16%,推理成本下降520%,该模型已经在讯飞输入法上线。

一句录音,现场让余承东“说阿拉伯语”!科大讯飞掏出AI落地最新成果图8
 
02.
麦克风、扬声器、摄像头、显示技术升级
加速AI在真实世界落地

 

软硬一体是AI在真实世界应用落地的关键,刘庆峰谈道,AI+麦克风阵列、AI+扬声器阵列、AI+摄像头阵列、AI+视觉呈现目前是支撑AI软硬一体落地的关键技术。

科大讯飞基于AI+麦克风阵列技术,实现了远场高噪场景语音识别和声源定位,支持语音属性解耦、信号时空分离等。

30、60、80分贝的高噪音转写场景下,科大讯飞X5 Pro办公本的准确率都达到95%以上,超过iPhone 17 Pro,以及在不同距离下进行转写实测,X5 Pro的转写准确率均超过iPhone 17 Pro。

一句录音,现场让余承东“说阿拉伯语”!科大讯飞掏出AI落地最新成果图9

讯飞AI翻译耳机采用骨传导、气导双拾音降噪,在80分贝的食堂、地铁等高噪环境下,该耳机识别准确率为97.1%,AirPods 3为77.7%。

讯飞翻译机采用5麦克风阵列,可以隔离1米以外的人声和噪声。强降噪模式下,距离1米左右,翻译机就会自动屏蔽人声,走近才会继续正常收音。

 

一句录音,现场让余承东“说阿拉伯语”!科大讯飞掏出AI落地最新成果图10

基于科大讯飞的独家AI+扬声器阵列技术,其自研扬声器硬件设计技术,实现立体空间声场重构和均衡。iFLYSOUND的立体声场效果,已经在19家车企量产落地,出货超100万台,奇瑞等车厂的盲测结果显示,其效果超越宝马740i。

一句录音,现场让余承东“说阿拉伯语”!科大讯飞掏出AI落地最新成果图11

在教育场景下,讯飞AI黑板支持24通道AI扬声器阵列,使得前后排声压差≤3dB,辅音清晰度损失低于4%。

在显示方面,为了让教室内的学生都能看清黑板,其AI黑板还重构了光路,科大讯飞AI学习机采用了微纳米类纸屏等,搭载坐姿AI算法进行坐姿提醒。
一句录音,现场让余承东“说阿拉伯语”!科大讯飞掏出AI落地最新成果图12

刘庆峰谈道,软硬一体支撑的多模态交互是AI融入真实世界的物理基础

他认为,真正的多模态交互需要具备没有麦克风的远场识别、3D视觉感知、视听觉融合理解、超拟人数字人、多人主动交互、类人举止反馈、个性化记忆、情感语义。具备高度多模态交互能力的数字人导览小飞展示了AI不再是简单的APP,而是能走进真实物理空间、提供有情感、有深度服务的类人伙伴,标志着人机交互正变得更自然、高效和稳健。

小飞突破了简单问答的局限,能够实现多人自由对话、多语种交流,并具备个性化记忆能力,能记住访客历史信息并进行提醒。此外,她还能秒变“林黛玉”等多种虚拟形象。
一句录音,现场让余承东“说阿拉伯语”!科大讯飞掏出AI落地最新成果图13

此外,星火X1.5还搭载了个性化记忆能力,基于多源记忆库信息检索和应用实现个性化记忆识别、提取、更新。

 
03.
教育、医疗、办公场景能力升级
首发AI陪伴App

 

科大讯飞还展示了其在教育、医疗、汽车、办公方面的进展。

在教育方面,科大讯飞联手权威机构首创三级错因体系,通过3大类、3层级、4000多个错因标签,为学生制定科学的学习计划。

与此同时,其还将这一能力搭载到教师的讯飞星火智能批阅机中。这一设备可以实现对解答题的分步骤批改、错因订正,还会为学生生成历次学情报告,为老师生成班级学情报告。

一句录音,现场让余承东“说阿拉伯语”!科大讯飞掏出AI落地最新成果图14

星火教师助手会根据学情报告,建议教师在备课PPT中新增相应的典型错题、重难点讲解等。

这样一来,星火批阅机、星火教师助手、星火AI黑板这样的软硬结合系统,就能实现作业精细批改到课堂因材施教的小时级闭环。

一句录音,现场让余承东“说阿拉伯语”!科大讯飞掏出AI落地最新成果图15

在现场,讯飞AI学习机展示了作业辅导能力,其针对卷子上的第二题进行了讲解。

AI老师会先判断学生的整体思路,以及每个步骤是否正确,明确指出哪个步骤出现了什么问题,然后引导学生思考是否缺少关键思路,还会配合相应的演示图进行讲解。最后AI老师对学生订正好的答案进行批阅,然后进行方法总结。

一句录音,现场让余承东“说阿拉伯语”!科大讯飞掏出AI落地最新成果图16

医疗方面,科大讯飞的智医助理中,在推荐诊断界面,医生可以对应查看知识图谱、诊断推理路径。同时医生可以参考推荐内容进行问诊,再结合新增症状实时更新诊断情况,值得一提的是,智医助理还搭载了中医诊断能力。

一句录音,现场让余承东“说阿拉伯语”!科大讯飞掏出AI落地最新成果图17

刘庆峰提到,星火医疗大模型专科AI能力已经达到等级医院主任级医师水平。

一句录音,现场让余承东“说阿拉伯语”!科大讯飞掏出AI落地最新成果图18

此外,科大讯飞还发布智医助理医院版1.0,支持辅助诊疗、辅助会诊、病历生成、病历质控,面对患者,其升级了讯飞小医App,可以为用户提供问题解答、挂号辅助等诸多能力。

汽车领域,星火智慧座舱2.0融合13摄,基于场景识别功能可以实现服务匹配度≥95%。

如下面动图所示,晓医健康座舱检测到用户频繁眨眼,会结合用户的健康档案判断是否是干眼症,经用户确认后购买滴眼液送到目的地。
一句录音,现场让余承东“说阿拉伯语”!科大讯飞掏出AI落地最新成果图19

办公方面,讯飞智能办公本、讯飞听见等软硬件产品已经深入用户工作之中。

讯飞智能办公本生成的会议纪要会给出总结、重点关注等信息,同时基于用户手写记录的关注点给出重点提炼,结合用户的身份和偏好终点推送。会议中提到的任务待办也能同步加入日程,还能与用户协作处理待办任务。

一句录音,现场让余承东“说阿拉伯语”!科大讯飞掏出AI落地最新成果图20

科大讯飞还推出了原生AI陪伴App AI星朋友,可支持160种人设定制,10秒就能创建声音。

 

一句录音,现场让余承东“说阿拉伯语”!科大讯飞掏出AI落地最新成果图21

在开发者生态方面,星火开放平台生态开发者已经从2024年10月的767万增长到今年10月的968万,其中智能硬件开发者增长102%,大模型企业开发者增长125%,新型智能体开发者成为增长主力,近半数来自非技术领域。

面向开发者,科大讯飞打造了首个支持RPA的智能体平台Astron,大同企业内却收借口的IT系统和账号体系,实现8大行业智能体开箱即用。

一句录音,现场让余承东“说阿拉伯语”!科大讯飞掏出AI落地最新成果图22
 
04.
结语:全国产算力支撑
加速AI大模型落地提效

 

AI是硬科技、强技术竞争,AI应用落地至关重要。科大讯飞坚持在自主可控、软硬一体、行业纵深、个性化四大关键领域发力,此次发布了星火X1.5深度推理大模型及一系列软硬件产品,从技术底座到行业应用,全面展示了AI从可用到好用,再到深入工作、学习、生活等的进展。

当下,大模型正处于迈向应用落地的关键转型期。从长远和产业发展的宏观视角来看,如何让大模型深度嵌入千行百业,切实解决行业痛点、赋能业务流程,才是决定其真正价值与发展潜力的核心命题。科大讯飞此前的技术积累以及与产业客户的结合,或成为其率先兑现AI红利的关键。
一句录音,现场让余承东“说阿拉伯语”!科大讯飞掏出AI落地最新成果图23
(本文系网易新闻•网易号特色内容激励计划签约账号【智东西】原创内容,未经账号授权,禁止随意转载。)

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI
more
别争了,OpenAI才是云厂商的「最大甲方」
AI服务器需求,全面升温!
太尴尬!苹果自研AI遇挫,付费请“老对手”谷歌救场
小鹏开了场未来秀:AI自己开车+六座空中SUV,还有最拟人机器人,明年都成真?
黄仁勋警告:美国AI芯片禁令正让中国胜出!
让AI生成视频「又长又快」:Rolling Forcing实现分钟级实时生成
告别繁琐切换!昆仑万维SkyReels用“无限画布”改变AI创作,一站式搞定图文视频
AI算力产业链的重构(二):2026年能力拐点与供应链权力转移
可口可乐,你浓眉大眼的也用AI做广告了?
Omdia:82%企业正加速布局实时分析,AI与边缘计算重塑物联网未来
Copyright © 2025 成都区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号