返回列表
Ghost Pepper 发布:专为 macOS 打造的 100% 本地化“按住即说”语音转文字工具
开源项目macOS语音识别人工智能

Ghost Pepper 发布:专为 macOS 打造的 100% 本地化“按住即说”语音转文字工具

Ghost Pepper 是一款专为 macOS 用户设计的本地语音转文字工具,支持“按住 Control 键说话,松开即翻译并粘贴”的便捷操作。该应用完全在本地运行,无需云端 API,确保数据隐私。它集成了 WhisperKit 和本地 LLM 技术,不仅能实现高效听写,还能自动清理语气词并修正文本,是追求隐私与效率的 macOS 用户的理想选择。

Hacker News

核心要点

  • 全本地运行:所有语音识别和文本处理均在 Mac 本地完成,无需连接云端 API,确保数据不离开设备。
  • 按住即说操作:通过全局快捷键(Control 键)实现录音、转录及自动粘贴至当前文本框的无缝衔接。
  • 智能文本清理:内置本地大语言模型(LLM),可自动去除语气助词并处理自我纠正,提升文本质量。
  • 硬件优化:针对 Apple Silicon(M1 及更高版本)进行优化,支持 macOS 14.0+ 系统。
  • 隐私保护:不记录日志到磁盘,转录内容仅存在于内存中,随应用关闭而消失。

详细分析

极致的隐私与本地化体验

Ghost Pepper 的核心竞争力在于其对隐私的极致追求。在 AI 工具普遍依赖云端处理的背景下,该应用坚持 100% 本地化运行。它利用 Apple Silicon 的强大算力,通过 WhisperKit 驱动语音模型,并通过 LLM.swift 驱动清理模型。所有模型在首次运行时自动从 Hugging Face 下载并缓存。这种架构不仅消除了数据泄露的风险,还让用户在无网络环境下也能流畅使用语音输入。

简化工作流的交互设计

该应用采用了极简的交互逻辑:用户只需按住 Control 键即可开始录音,松开按键后,系统会自动完成转录并将结果直接粘贴到当前的活动文本字段中。作为一款菜单栏应用,它没有 Dock 图标,支持开机自启,最大程度减少了对用户界面的干扰。此外,用户可以根据需求自定义清理提示词(Cleanup Prompt)、选择麦克风以及切换各项功能开关。

多样化的模型支持

Ghost Pepper 提供了灵活的模型配置以平衡速度与准确度。在语音识别方面,支持从约 75MB 的 Whisper tiny.en(最快)到 1.4GB 的 Parakeet v3(支持 25 种语言)等多种模型。在文本清理方面,默认使用 Qwen 3.5 0.8B 模型,处理速度仅需 1-2 秒;若追求更高质量,用户也可选择参数量更大的 Qwen 3.5 2B 或 4B 版本。

行业影响

Ghost Pepper 的出现展示了端侧 AI(On-device AI)在生产力工具领域的巨大潜力。通过将 Whisper 语音识别与轻量化 LLM 结合,它证明了即使不需要昂贵的云端算力,也能在个人电脑上实现高质量的自然语言处理任务。这对于注重数据合规性的企业用户和对隐私敏感的个人用户具有重要的参考意义,预示着未来 macOS 生态下本地 AI 应用将更加普及。

常见问题

问题 1:Ghost Pepper 对硬件和系统有什么要求?

答:该应用要求 macOS 14.0 或更高版本系统,并且必须运行在搭载 Apple Silicon(M1 芯片及以上)的 Mac 设备上。

问题 2:它支持中文转录吗?

答:根据官方说明,Ghost Pepper 支持多种模型。虽然默认的 Whisper small.en 仅限英文,但用户可以选择 Whisper small(多语言版)或 Parakeet v3(支持 25 种语言)来实现多语言支持。

问题 3:我的语音数据会被存储吗?

答:不会。Ghost Pepper 不会将转录内容写入磁盘文件,调试日志仅保存在内存中,一旦应用程序退出,相关数据就会消失。

相关新闻