
【科技24时区】谷歌于本周一低调在iOS平台上线了一款名为“Google AI Edge Eloquent”的离线优先语音转写应用,正式进军由Wispr Flow、SuperWhisper、Willow等产品主导的专业语音转录赛道。该应用免费下载,用户只需预先下载基于Gemma模型的自动语音识别(ASR)引擎,即可在手机端进行本地语音转写,全程无需依赖网络连接。
应用支持实时转录功能,用户在讲话过程中可即时看到文字输出。当点击暂停后,系统会自动过滤“um”“ah”等填充词,并对文本进行润色处理。转录界面下方提供“要点提炼”“正式文体”“简短版”和“详细版”等选项,便于用户按需转换文本风格。此外,用户可关闭云端模式,完全依赖设备端处理;若开启云端模式,则会调用基于云的Gemini模型进行文本优化。
值得注意的是,Eloquent支持从用户的Gmail账户中导入特定关键词、人名及行业术语,以提升专业场景下的识别准确率。用户还可手动添加自定义词汇至识别词库。应用完整保留每次转录会话的历史记录,并支持全文搜索。同时,它还能展示上一次会话中的用词、每分钟字数(WPM)及累计发言总字数等数据指标。
据其App Store官方描述:“Google AI Edge Eloquent是一款先进的语音转写应用,旨在弥合自然口语与可直接用于专业场景的文本之间的鸿沟。与仅机械记录所有口误和填充词的传统转录软件不同,Eloquent利用人工智能精准捕捉用户的真实意图,自动剔除‘嗯’‘啊’及句中自我修正内容,输出清晰、准确的书面语。”
尽管目前该应用仅面向iOS用户开放,但其App Store页面已明确提及Android版本的存在。描述中指出,未来Android版将支持“无缝系统集成”,可设为默认键盘,在任意文本输入框中全局调用。此外,还将引入类似Wispr Flow在安卓端使用的悬浮按钮功能,实现随时随地一键启动转录。
随着语音识别模型性能持续提升,AI驱动的智能转录应用正日益受到用户青睐。谷歌此次以实验性姿态入局,不仅意在验证端侧大模型在语音处理场景的落地效果,更可能为后续在Android生态中全面升级原生转录能力铺路。若此次测试取得积极反馈,相关技术有望深度整合至谷歌移动操作系统的核心功能之中。