如何实现长时间录音的自动分段与文本生成？

sinat_333518872025-08-02 10:19

会议记录太麻烦？录音转文字耗时又费力？高端语音笔价格离谱，自己动手效率又低。

它是一款基于 Whisper 技术的开源本地语音识别工具，无需联网，纯靠本地运行，实现离线语音转文字，速度快，准确率高，关键是完全免费。

安装过程会自动加载大模型，建议提前指定存储路径，避免模型文件占满系统盘。

添加音频只需点击"+"号，按推荐参数设置，输出格式可自定义，我选的是 TXT，方便后续整理。

识别过程全自动，全程在本地完成，不上传任何数据，隐私安全无忧。

转写完成后，文本会自动保存在原音频所在文件夹，内容清晰规整。

连字幕格式也支持导入导出，剪辑视频时特别实用。

更棒的是，点击麦克风图标即可开启实时听写，边说边出文字，设置简单，体验流畅。