【科技24时区】估值达2.5亿美元的AI会议笔记应用Granola,已成为科技行业创始人与风投人士的热门选择。然而,一位开发者认为市场对更注重隐私、完全本地运行、且仅需一次性付费的替代方案存在强烈需求。由此,一款名为Talat的全新Mac应用应运而生。

该应用由英国约克郡的独立开发者Nick Payne打造。他自称“计算机极客”,并表示开发本地AI笔记工具的想法源于一系列“幸运的巧合”。在接受TechCrunch采访时,Payne坦言:“我认为Granola非常出色,它是用Electron框架(一种用于构建桌面应用的技术)精心打磨出的典范。”他特别提到,Granola能在不录制视频的情况下捕获Mac系统音频的能力令他着迷——这在当时属于突破性的实现方式,并促使他深入研究苹果一项较新但文档匮乏的API。
为简化对该API(即Core Audio Taps,允许开发者接入Mac音频流)的调用,Payne开发了一个开源音频库AudioTee。他表示,在此过程中虽逐步搭建起一套技术工具链,但始终未能形成一个可独立作为产品的完整方案。“当前主流的云端语音转写模型——Granola等产品所依赖的服务——确实令人惊叹,近乎实时地将语音转化为文字极具冲击力。但我也始终感到不安:这种便利是以交出我的数据、尤其是我的声音为代价的。”
转折点出现在他接触到FluidAudio——一个基于Swift语言的软件工具包,可在Apple设备上实现完全本地化、低延迟的音频AI处理。该框架支持直接在Mac的Neural Engine(苹果专用AI硬件)上运行轻量级、高速的语音转写模型。这一发现让Payne意识到,自己的研究可以转化为真正尊重用户隐私的产品:音频永不离开本地设备,转录文本也不会上传至第三方服务器。
Talat由Payne与其长期好友兼前同事Mike Franklin共同开发,最终成果是一款仅20MB大小的应用。用户只需一次性付费购买,无需注册账户,亦不向开发者回传任何分析数据,且无后续订阅费用。
尽管功能上不如部分竞品丰富,Talat聚焦核心体验:当用户使用Zoom、Teams、Meet等会议软件时,应用可实时捕获麦克风音频并进行转录。系统会尝试自动区分发言者,用户也可手动调整;同时支持添加笔记,并对转录片段进行编辑、删除或拆分。会议结束后,本地部署的大语言模型(LLM)将自动生成包含关键要点、决策事项与待办任务的摘要。所有笔记、转录稿与摘要均支持在Talat内全文检索。
除隐私优势外,Payne强调其核心目标是赋予用户更多控制权。“我们注重可配置性,让用户自主决定数据流向:可自选LLM模型、自动导出至笔记应用Obsidian、通过Webhook在会议结束后推送数据,甚至集成MCP服务器——这是一种标准化协议,允许AI工具按需拉取外部数据源。”
在技术架构上,Talat采用混合式AI方案,“主要通过FluidAudio进行整合与抽象”,Payne称后者承担了大量底层工作。默认情况下,摘要生成使用Qwen3-4B-4bit模型,该模型可在中低端硬件上流畅运行。用户亦可自由切换至任意云端LLM服务商,或选用Nvidia开发的Parakeet系列语音识别模型,亦可通过Ollama(本地AI模型运行工具)加载自定义模型,从而全面掌控使用体验。
未来,Talat计划增加更多内置模型选项,并集成Google Calendar、Notion等主流生产力工具。目前,搭载M系列芯片(从M1起)的Mac用户可免费下载试用,享有10小时录音额度后再决定是否购买。在当前预发布阶段,应用售价为49美元;待正式发布1.0版本后,价格将上调至99美元。Payne与Franklin选择自筹资金开发Talat,并明确表示将长期维持核心产品的一次性买断模式,拒绝转向订阅制。
此举不仅回应了近期关于AI插件过度收集用户隐私的广泛担忧(据Incogni报告,超半数Chrome AI插件存在数据采集行为),也契合了全球范围内对“AI原生企业”应兼顾效率与数据主权的深层趋势。在生成式AI日益嵌入工作流的当下,Talat提供了一条兼顾实用性与隐私保障的技术路径。