
最近试了一个开源 Mac 工具,叫 VoxFlow。
一开始以为它只是个语音输入法。用了一圈之后发现,它其实更像一个输入工作台。
语音输入、文件转写、划词翻译、截图、录屏、配音、Agent 任务下发,这些东西都在一个软件里。
以前这些事通常要分开装:
Raycast 管快速启动,语音输入法管听写,MacShot 管截图,录屏再装一个,翻译再装一个。工具越装越多,最后 Dock 和菜单栏都快变成工具超市。
VoxFlow 的思路比较直接:把这些高频动作收进一个工作台里。
最明显的感觉:语音输入很快
我试过几款语音输入工具,VoxFlow 给我的第一感觉是响应很快。
它不是单纯把音频丢到云端等结果。它支持本地模型和云端模型配置,也能用 Mac 芯片做加速。Apple Silicon 这几年性能确实够用,语音识别这种场景放到本地跑,体验会不一样。
按住快捷键说话,松开后文字很快回到当前输入框。
这个体验和普通"录完等一会儿"的语音输入法差别挺大。尤其是写代码说明、回消息、写 prompt 的时候,速度一慢就会断思路。
不是只有语音输入

我觉得它比较有意思的地方,是没有停在"语音转文字"。
它还把几个日常很碎的动作也放进来了。
比如文件纪要转写。
会议录音、访谈音频、临时录下来的素材,可以直接转成文字。这个比开一个单独转写网站方便,尤其是本地文件多的时候。
比如划词翻译。
选中一段文字,直接处理,不用复制到另一个翻译工具里来回切。
比如截图和录屏。
看到屏幕上的内容,可以截图识别;需要记录流程,也能录屏。对经常写教程、反馈 bug、整理资料的人来说,这两个功能其实很高频。
还有配音和 Agent 下发。
这个就更偏工作流了。不是所有人每天都用,但如果你平时经常让 AI 工具帮忙处理任务,这种入口放在一起会顺很多。
它更像一个"少装几个工具"的工具
我现在越来越不喜欢为了一个小功能装一个软件。
装的时候没感觉,用久了就会发现:权限一堆,菜单栏一排,快捷键互相打架,真正用的时候还要想"这个功能在哪个工具里"。
VoxFlow 不是说每个功能都要替代专业软件。
它更适合解决另一类问题:日常高频但不值得单独开一个重型工具的输入和记录动作。
语音输入、截图 OCR、文件转写、划词翻译、快速启动、录屏记录,这些事情单独看都不大,但每天会碰到很多次。
如果一个软件能把这些串起来,确实能少折腾不少。
适合什么人
如果你平时用 Mac,而且经常有这些场景,可以试试:
- 经常写长消息、文档、prompt
- 想用语音输入,但不想只依赖云端识别
- 有录音、会议、文件转写需求
- 经常截图 OCR 或录屏反馈问题
- 想少装几个菜单栏工具
- 平时会用 Agent 或 AI 工具处理任务
我觉得它不是那种"看一眼就很炫"的工具。
它更像是用了几天之后,发现自己少开了几个软件,少复制粘贴了几次,也少在输入框前卡住一会儿。
项目地址
VoxFlow 是开源的。
GitHub: github.com/xingbofeng/...
官网: xingbofeng.github.io/VoxFlow/
如果你本来就在找 Mac 上的语音输入、截图 OCR、录屏、转写工具,可以一起试试这个。
一个软件搞定这些事,确实省心。