当AI从“炫技”走向实用,“自主可控”才真正站得住脚

科工力量 2025-08-13 19:06
资讯配图

导语:当全球大模型浪潮汹涌而至,中国科技企业面临的不只是技术竞速,更是产业落地、用户体验与国际竞争的多重博弈。当大模型的叙事被逐渐拉回现实,一场关于技术主权、国产替代与真实需求的深层次较量悄然展开。

作为中国人工智能“国家队”的代表,科大讯飞正在用自己的路径给出另一种回答:坚持全国产算力,在翻译、数学、推理等核心领域构建大模型能力;将产品嵌入学习机、翻译机、智能办公本等具体场景,以“高频刚需”对抗空泛热潮;在韩国众筹平台成为销冠、日本市场试水硬件出海,跳出国内内卷的价格战,验证中国技术能否真正走出去。

从“看得见的技术突破”到“用得上的用户体验”,从“实验室模型”到“市场反馈”,讯飞试图把AI重新拉回生产一线和出海前沿。这不仅是一个企业的突围路线,更是中国AI在国际秩序重构中自我定位的一次投射。以下是在2025世界人工智能大会上与科大讯飞副总裁赵翔的对话实录:

Q:讯飞大模型的特色是什么?

赵翔:人工智能的发展潮起潮落,现在是第四次人工智能浪潮。科大讯飞是一家科技公司,从1999年至今,我们一直专注于此事,研究人工智能经过这些年的努力,我们已经积累了一定的经验和技术。

我们是认知性的全国重点实验室,同时也是语音和语言处理的国家工程中心,可以说,我们是带有国字号的国家队去年6月份,我们多语种智能语音关键技术及产业化项目获得2023年度国家科学技术进步奖一等奖,这是人工智能领域的唯一奖项,我认为它非常重要。这给我们带来了很大的信心。

2022年,OpenAI发布ChatGPT3.5之后全世界的科技公司和大模型公司都开始一路狂奔各项技术有所突破技术流派百花齐放。我们科大讯飞的大模型基于长思维链进行深度推理,本次升级后,不仅在文本,而且在翻译、数学、逻辑推理等重要方面表现非常优异。

资讯配图

目前我们的产品基于100%全国产算力。科大讯飞作为一家中国企业,有这样的使命。我们将与中国其他主要从事算力的公司,如华为公司合作,共同发展业务,而这关系到我国未来在关键领域的核心技术发展非常重要的目前,我们的大大模型全中国唯一基于全国产算力的大模型

讯飞目前的业务应用场景非常广阔,而仅凭技术是不够的。我认为,改变世界的不仅仅是技术本身,更重要的是能够落地应用到产品。只有将其落地到我们的产业中,才能让消费者体验到我们所发挥的价值,这样才能够正带动中国经济发展

在本次上海世界人工智能大会上,我们的翻译、企业办公以及各行各业的各方面,不仅是我自己。科大讯飞负责智能硬件,包括许多行业的解决方案,都运用到了AI的许多领域,这个能力能够应用于真实场景,解决社会上老百姓的高频刚需问题。

因此,我认为从三个方面来看,讯飞的特色首先是自主核心技术,其次是全国产化,第三个特点是丰富的应用场景

Q:目前终端产品听起来很棒,但用户体验并不好,有雷声大雨点小的感觉,您认为未来突破口在哪里?

赵翔:智能硬件产品,随着技术大模型的发展,入场的玩家会越来越多。我将智能硬件终端产品分为三类。

第一类是大家比较熟悉的基础设备。最典型的代表是我们的电脑和手机。第二类是可穿戴设备,目前最热门的可穿戴设备是智能眼镜。其他的,耳机、智能手环也都属于此列。第三类是一些是新的形态。其中包括家庭机器人、外骨骼机器人和具身智能机器人等。

我认为最核心的问题在于,这些设备没有基于我们的技术和软硬件结合来解决问题,许多产品尚不成熟。为了解决客户场景问题,我们得搞清楚,哪些产品是消费者不需要?这类客群的特点是什么?。对一个产品,用户只有发自内心的喜爱它,并且离不开它,那它才具有生命力和持续发展的能力。

我们目前从事技术和产品工作。讯飞已经开发了几项产品,当然,整体规模与大型手机厂商还无法相比,但我们仍处于不断进步的阶段。我们推出的几款产品非常受消费者喜爱,例如我们的学习机、翻译机和智能办公本等设备,是引领行业的。

资讯配图

Q:现如今科技企业内卷严重,大打价格战,如何解决这个问题?

赵翔:首先我们需要提高技术应用成效。技术并非挂在实验室里的空话,而是要真正地为用户带来体验、效果。

以我们的翻译为例,我们这次发布的端到端同传大模型的升级,优势主要体现在以下几个方面。首先,我们的语音翻译效果具体比1月份发布的版本有20%的提升,满分100分的测试,可以拿到90分,这其中包括翻译语句的完整性、翻译的准确性和语言质量等指标。这是我们与中国翻译协会合作的结果。

其次是翻译速度加快。我们希望能达到真人同传以及翻译员的速度,因此在中英翻译中,我们从开口说话到机器翻译开始播报,中间接延迟仅为两秒。如果用户有速度上的需要,我们可以立即开始翻译。

第三是翻译结果的播报不能有机器播报声音。我们是根据自然语言来理解的,理解被翻译对象在讲什么。根据对文字的理解,让得机器如同真人一样,在哪些地方停顿、延续,怎么让表达更加铿锵有力或者稍加婉转,然后自适应,通过调节语速和语气,让整个播报过程更像真人在讲话。

第四个是行业翻译,正常且简单的轻翻译在日常沟通是可行的,能解决用户的一部分问题。但我们很多用户是商务人士,有商务谈判的需求,那在使用我们的翻译机时,就会更看重行业术语翻译的严谨性。

举个例子,你在国外去到一家本地医院,非医疗行业的人未必能够熟练掌握行业专有名词。

但是我们不一样,我们是机器翻译,通过大量学习,在我们的大模型当中储备有8万个专业词汇,涵盖了各行各业,像医疗、金融和制造等领域。

资讯配图

Q:目前各大讯飞出海的情况如何?

赵翔:目前科大讯飞正全力出海。我认为出海业务对中国企业来说是非常好机会。

首先,我今天查看了今年一季度扫地机全球市场份额排名。前五名中有四个是中国品牌,位列第一到第四,第五名才是国外品牌。而且这四个中国品牌的所占市场份额超过50%,可以说是半壁江山,在全球范围内的影响非常大。

我们目前也在出海,最初我们尝试推广在中国市场已经取得成功的产品,例如现在的智能办公本,计划进入韩国市场。硬件产品本身与我们在中国销售的产品是相同的,同时我们进行了一些优化,首先是在语言上,基于大语言模型制作韩语版本。

其次,我们根据韩国用户的需求,在软件层面的交互上进行改进。但韩国人的使用方式与我们与预期不一样,仍需适应。起初我们还有点儿担心自己能力不足,因此没有选择大型电商平台、线下量贩店或者连锁店等渠道。为了能大规模铺开,我们决定利用韩国众筹平台进行试水,反馈回的效果非常好。

在韩国,第一大众筹平台是Wadiz,它占据韩国众筹市场的80%份额。我们在Wadiz平台上进行众筹后,竟成功成为单品销售额第一的冠军。我们的产品广受韩国消费者的好评。虽然仍有部分问题亟需改进,但这给我们带来很大启发,增强了讯飞出海的信心。

资讯配图

韩国第一大众筹平台是Wadiz

Q:在出海过程中,科大讯飞有遇到哪些需求,又解决了哪些问题?

赵翔:我们目前的出海情况是刚刚起步。中国企业都在做出海,我们需要赋能大家出海,不仅仅是自己出海,要反内卷。除了刚才提到的技术为了提高用户使用体验,我们需要采取一套方法,即走出去赚钱。开拓国际市场。

这是我的真实经历,有一次在用户调研时,结识了一位浙江的饮水机销售人员。他没有读过大学,0开始,将饮水机的年销售额做到2亿元。当然,卖的饮水机不是面向普通消费者的家庭饮水机,而是面向机构的商用饮水机。法国戴高乐机场,阿联酋迪拜国际机场。还有美国洛杉矶和纽约机场的饮水机都是从他那里买的。

哪怕是今天的大学生,英语也未必好特别是口语不行,没法准确表达我的这位用户,他根本没有读过大学,也不会说英语,但他不仅英文国家,而且在南美国家,尤其是西班牙语的国家都能做生意。他就说了因为他在用讯飞的翻译机,带着我们的翻译机一起走天下。

资讯配图

大阪世博会中国馆,日本主持人带着科大讯飞翻译机在街上对中国游客进行采访  图源:视频截图

我们的翻译机就是他依靠的依靠,他是浙江人,有那种敢打敢拼精神如果产品质量不好,那么国外不就用不上没法做好自己的目前在语言沟通上没遇到什么障碍不仅是英文,我们的翻译机支持80多个语种。许多一带一路国家的官方语言都不是英文。

还有一个例子,就是智能录音笔在日本的销售情况非常不错。不错到什么程度呢?在日本有一家专门从事办公品类的公司主动找到我们,说他们突然发现科大讯飞的翻译机在他的平台上已经排名第一,用户非常认可我们

在解释原因的时候,我们告诉他日本人对用户隐私特别关注,所以我们为日本提供了一款完全离线的产品,不需要联网使用。这款产品是完全离线且在无网络情况下将本地运算录音转换为文字的。款产品在日本销售得非常好,以前市面上并没有这种产品。科大讯飞日本这两年的表现非常好,就是因为我们能够满足本地用户实际的需要。

资讯配图

日本个人情报保护委员会  图源:pixabay

Q:在人工智能大会的开幕式上使用了科大讯飞的同声传译,科大讯飞刚刚发布了同传大模型,如何将赋能到现有翻译产品中,用户能感受到哪些最直接的变化又有哪些?

赵翔:讯飞在翻译领域是什么地位呢?首先,我们拥有全栈技术能力,也就是同传技术,其次,我们是实现全场景覆盖最多的公司。

广泛场景覆盖:我们致力于将核心技术赋能于多样化的设备和业务场景,是目前翻译场景和产品覆盖最广的公司之一。我们希望在拥有核心技术之后将其赋能到不同场景的设备中。

在近期世界人工智能大会上,我们成功提供了现场同传服务,实现了演讲者母语与目标语言文字及声音的同步呈现,对翻译效果和严谨性的要求极高。

资讯配图

在WAIC2025,双奖得主杰弗里·辛顿作为今年的重磅嘉宾在主论坛发表演讲,在这背后,科大讯飞为其同传提供实时翻译支持。

10人或者20人的中小型会议室中,我们的翻译机完全可以实现类似同传效果。演讲者在台上拿一个领夹麦通过蓝牙连接翻译机在上面进行讲解,其他听众便可以在屏幕上看到翻译文字。

我们现在开发了一个功能,看大屏文字可能会累,那就直接扫码,用手机或其他外部设备链接,直接看到演讲者的内容,体验就会很舒服。我也可以配备耳机将其形成翻译的声音播报给演讲者。

如果台下的人需要与台上的人互动怎么办?按我可以给大家再发一个领夹麦,谁发言谁就拿着。台下人与台上人进行互动时,翻译机就能对方也能理解我在讲什么,因此在中小型会议上表现很好。通过全向360度角的收音和翻译,即在一个会议室里,只要将翻译机在中间,整个会议室的人都会参与其中。

讯飞已经开发翻译APP,用于简单的轻翻译应用,目前尚未进行大规模宣传。上线时,我们会根据用户需求进行调整我们提供SAAS服务,用户可以通过线上开会解决问题。如果需要进行线上会议或者观看视频,我们在线上也能提供相应的同传服务,根据用户需求配备不同的产品和服务解决各种翻译问题。

Q:未来大模型与硬件结合的规划是什么?是否有新的爆发点?

赵翔:这是一个与时俱进并慢慢发生变化的过程,有些硬件产品的形态可能没太有改变,仍属于同类产品,但实现的功能与原来会有所不同。

一方面,我觉得,未来可穿戴设备可能是个非常大的发展方向,例如眼镜,这是业界最看好的项目。目前,眼镜的主要问题在于镜片它的生态等各方面存在问题。今年我注意到一些厂商在世界上发布了新的智能眼镜包括智能眼镜和耳机,我们讯飞也有一款名为科大讯飞的会议耳机,具备翻译和一些其他功能,总之这是一个非常大的方向。

另一个方面是智能硬件在工业领域的应用。工业领域替代人,辅助完成简单的重复性劳动,例如具身智能的外骨骼机器人,目前的发展就是这样。

声明:内容取材于网络,仅代表作者观点,如有内容违规问题,请联系处理。 
AI
more
研究者警告:强化学习暗藏「策略悬崖」危机,AI对齐的根本性挑战浮现
清华大学汪玉教授:当AI重塑产业,新时代的育人思考
马斯克删除xAI「研究员」职位引爆网络!LeCun怒批:如此暴力将扼杀创新
又被耍了,我们给 AI 喂屎,把互联网糟蹋成啥样了
比AirPods Max还轻?vivo首款MR头显来了,能干掉苹果Vision Pro?
AI Coding大佬聊透了:产品智能重要还是用户体验重要?答案让人意外
OpenAI拟投资脑机接口公司,挑战Neuralink
科技圈大地震!elexcon2025 AI+芯片狂欢,开发板白送,你敢来吗?
当AI从“炫技”走向实用,“自主可控”才真正站得住脚
SIGGRAPH 2025 | NVIDIA 研究中心推动物理 AI 的发展
Copyright © 2025 成都科技区角科技有限公司
蜀ICP备2025143415号-1
  
川公网安备51015602001305号