最近发现一个 Mac 工具,有点像把 Raycast、语音输入法、截图和录屏塞到了一起

最近试了一个开源 Mac 工具,叫 VoxFlow。

一开始以为它只是个语音输入法。用了一圈之后发现,它其实更像一个输入工作台。

语音输入、文件转写、划词翻译、截图、录屏、配音、Agent 任务下发,这些东西都在一个软件里。

以前这些事通常要分开装:

Raycast 管快速启动,语音输入法管听写,MacShot 管截图,录屏再装一个,翻译再装一个。工具越装越多,最后 Dock 和菜单栏都快变成工具超市。

VoxFlow 的思路比较直接:把这些高频动作收进一个工作台里。

最明显的感觉:语音输入很快

我试过几款语音输入工具,VoxFlow 给我的第一感觉是响应很快。

它不是单纯把音频丢到云端等结果。它支持本地模型和云端模型配置,也能用 Mac 芯片做加速。Apple Silicon 这几年性能确实够用,语音识别这种场景放到本地跑,体验会不一样。

按住快捷键说话,松开后文字很快回到当前输入框。

这个体验和普通"录完等一会儿"的语音输入法差别挺大。尤其是写代码说明、回消息、写 prompt 的时候,速度一慢就会断思路。

不是只有语音输入

我觉得它比较有意思的地方,是没有停在"语音转文字"。

它还把几个日常很碎的动作也放进来了。

比如文件纪要转写。

会议录音、访谈音频、临时录下来的素材,可以直接转成文字。这个比开一个单独转写网站方便,尤其是本地文件多的时候。

比如划词翻译。

选中一段文字,直接处理,不用复制到另一个翻译工具里来回切。

比如截图和录屏。

看到屏幕上的内容,可以截图识别;需要记录流程,也能录屏。对经常写教程、反馈 bug、整理资料的人来说,这两个功能其实很高频。

还有配音和 Agent 下发。

这个就更偏工作流了。不是所有人每天都用,但如果你平时经常让 AI 工具帮忙处理任务,这种入口放在一起会顺很多。

它更像一个"少装几个工具"的工具

我现在越来越不喜欢为了一个小功能装一个软件。

装的时候没感觉,用久了就会发现:权限一堆,菜单栏一排,快捷键互相打架,真正用的时候还要想"这个功能在哪个工具里"。

VoxFlow 不是说每个功能都要替代专业软件。

它更适合解决另一类问题:日常高频但不值得单独开一个重型工具的输入和记录动作。

语音输入、截图 OCR、文件转写、划词翻译、快速启动、录屏记录,这些事情单独看都不大,但每天会碰到很多次。

如果一个软件能把这些串起来,确实能少折腾不少。

适合什么人

如果你平时用 Mac,而且经常有这些场景,可以试试:

  • 经常写长消息、文档、prompt
  • 想用语音输入,但不想只依赖云端识别
  • 有录音、会议、文件转写需求
  • 经常截图 OCR 或录屏反馈问题
  • 想少装几个菜单栏工具
  • 平时会用 Agent 或 AI 工具处理任务

我觉得它不是那种"看一眼就很炫"的工具。

它更像是用了几天之后,发现自己少开了几个软件,少复制粘贴了几次,也少在输入框前卡住一会儿。

项目地址

VoxFlow 是开源的。

GitHub: github.com/xingbofeng/...

官网: xingbofeng.github.io/VoxFlow/

如果你本来就在找 Mac 上的语音输入、截图 OCR、录屏、转写工具,可以一起试试这个。

一个软件搞定这些事,确实省心。

相关推荐
aqi007 小时前
15天学会AI应用开发(十)把文本嵌入模型换成国产模型
人工智能·python·ai编程
唐老板8 小时前
A2A协议实战:两个Agent怎么聊
ai编程
刘棕霆9 小时前
22—AI Skill 测评中断后怎么续跑:active-pipeline.json 断点恢复设计
aigc·ai编程·测试
leeyi9 小时前
Batch 处理:并发控制与可中断批处理
aigc·agent·ai编程
kfaino17 小时前
码农的AI翻身(三)你好,我叫 Embedding
后端·ai编程
_山海19 小时前
OpenSpec-基于SDD规格驱动开发
ai编程·vibecoding
唐老板1 天前
MCP协议实战:从零写个Agent工具
ai编程·mcp
薛定喵的谔1 天前
Term Proxy — 用 Tauri 2 打造跨平台终端配置管理工具
electron·ai编程·全栈