浏览器里跑 AI 语音转写?Whisper Web + cpolar让本地服务跑遍全网

文章目录

    • 前言
    • [1.本地部署Whisper Web](#1.本地部署Whisper Web)
      • [1.1 安装git](#1.1 安装git)
      • [1.2 安装Node.js](#1.2 安装Node.js)
      • [1.3 运行项目](#1.3 运行项目)
    • [2. Whisper Web使用介绍](#2. Whisper Web使用介绍)
    • [3. 安装Cpolar内网穿透](#3. 安装Cpolar内网穿透)
    • [4. 配置公网地址](#4. 配置公网地址)
    • [5. 公网访问测试](#5. 公网访问测试)
    • [6. 配置固定公网地址](#6. 配置固定公网地址)

前言

Whisper Web 是一款能直接在浏览器中运行的语音转文字工具,依托 OpenAI 的 Whisper 模型和 WebGPU 加速,支持音频文件上传、语音实时录入等多种转写方式,输出文本还能导出为 TXT 或 JSON 格式。无论是需要整理会议录音的职场人、记录采访素材的媒体工作者,还是日常需要语音转文字的普通用户,都能快速上手。它的优点很突出:无需搭建后端服务器,模型在本地运行,数据处理更安全,且对硬件要求不高,普通电脑也能流畅使用。

使用时发现,Whisper Web 的模型切换很灵活,可根据音频长度和精度需求选择不同尺寸模型,转写准确率在日常场景中表现稳定。不过首次使用会下载模型文件,建议在网络良好时操作;另外,过长的音频可能需要耐心等待转写过程,但整体体验流畅不卡顿。

但受限于本地部署,Whisper Web 默认只能在同一局域网内使用。比如在公司电脑部署后,回家想用手机继续处理音频就没法直接访问,外出时更无法调用本地服务,这对于需要跨设备、跨地点工作的用户来说,便利性大打折扣。

而结合 cpolar 内网穿透后,这个问题迎刃而解。无需公网 IP 和云服务器,就能给本地的 Whisper Web 生成一个公网访问地址,手机、平板甚至异地电脑都能随时打开使用,且数据通过加密隧道传输,既保证了远程访问的便捷性,又兼顾了信息安全,让本地化服务真正突破网络限制。

1.本地部署Whisper Web

接下来教大家如何在Windows系统本地安装Whisper Web

项目地址:https://github.com/xenova/whisper-web

1.1 安装git

首先需要从github上克隆Whisper Web(如果没有安装git的话,进入git官网进行下载windows版本 https://git-scm.com/downloads)

打开终端,从github下载项目到本地,执行下面的命令:

shell 复制代码
git clone https://github.com/xenova/whisper-web.git

进入项目目录

shell 复制代码
cd whisper-web

1.2 安装Node.js

然后在项目的根目录下,执行下面的命令:

复制代码
npm install

如果安装报错,可以检查是否安装Node.js,如未安装可以点击链接下载:

https://nodejs.org/en/download/prebuilt-installer

本例中使用的是下载安装包进行安装,安装后重启终端执行上边npm安装命令即可。

1.3 运行项目

在项目的根目录下,运行Whisper Web,可以看到运行成功,出现http://localhost:5173

复制代码
npm run dev

此时,我们在浏览器中输入上边的地址,即可打开Whisper Web页面:

2. Whisper Web使用介绍

在Whisper Web界面,我们可以使用粘贴音频地址,上传音频文件,和使用手机录入语音等方式进行语音转文本的操作。

这里以上传音频文件为例,在上传了一段音频文件后,点击音频进度条下方的设置按钮,进行模型切换和输出为其他语言的选择。

设置完毕后,点击下方的transcribe Audio按钮即可自动进行音频转文本:

转换结束后,我们可以将文本导出为TXT或者JSON格式到指定文件夹。

3. 安装Cpolar内网穿透

目前我们在本机部署了Whisper Web,但如果没有公网IP的话,只能在本地局域网环境使用,有一定局限性。如果想在异地通过其他设备使用的话,可以结合Cpolar内网穿透实现远程访问,免去了本地重新部署过程,只需要cpolar生成的公网地址直接就可以链接到Whisper Web中。

下面是安装cpolar步骤:

Cpolar官网地址: https://www.cpolar.com

点击进入cpolar官网,点击免费使用注册一个账号,并下载最新版本的Cpolar

登录成功后,点击下载Cpolar到本地并安装(一路默认安装即可)本教程选择下载Windows版本。

Cpolar安装成功后,在浏览器上访问http://localhost:9200,使用cpolar账号登录,登录后即可看到Cpolar web 配置界面,结下来在web 管理界面配置即可。

4. 配置公网地址

接下来配置一下本地 Whisper Web 的公网地址,

登录后,点击左侧仪表盘的隧道管理------创建隧道,

创建一个 Whisper Web 的公网http地址隧道:

  • 隧道名称:可自定义命名,注意不要与已有的隧道名称重复
  • 协议:选择http
  • 本地地址:5173
  • 域名类型:免费选择随机域名
  • 地区:选择China Top

点击创建

隧道创建成功后,点击左侧的状态------在线隧道列表,查看所生成的公网访问地址,有两种访问方式,分别是http和https。

使用任意一个上面Cpolar生成的公网地址,在电脑或任意设备在浏览器进行登录访问,即可成功看到 Whisper Web 界面,这样一个可以远程访问的公网地址就创建好了,使用了Cpolar的公网域名,无需自己购买云服务器,即可在公网访问本地部署的服务了!

5. 公网访问测试

我们用刚才cpolar生成的公网地址,打开一个新的浏览器复制粘贴,可以看到进入到了Whisper Web项目的管理界面。

小结

由于刚才创建的是随机的地址,24小时会发生变化。另外它的网址是由随机字符生成,不容易记忆。如果你有长期远程访问本地部署服务的需求,或者想把域名变成固定,好记的二级子域名,并且不想每次都重新创建隧道来访问你在本地部署的服务,我们可以选择创建一个固定的http地址来解决这个问题。

6. 配置固定公网地址

我们接下来为其配置固定的HTTP端口地址,该地址不会变化,方便分享给别人长期查看你的博客,而无需每天重复修改服务器地址。

配置固定http端口地址需要将cpolar升级到专业版套餐或以上。

登录cpolar官网,点击左侧的预留,选择保留二级子域名,设置一个二级子域名名称,点击保留,保留成功后复制保留的二级子域名名称。

保留成功后复制保留成功的二级子域名的名称:Whisper123(大家可以自定义)

返回登录Cpolar web UI管理界面,点击左侧仪表盘的隧道管理------隧道列表,找到所要配置的隧道 Whisper,点击右侧的编辑:

修改隧道信息,将保留成功的二级子域名配置到隧道中

  • 域名类型:选择二级子域名
  • Sub Domain:填写保留成功的二级子域名

点击更新(注意,点击一次更新即可,不需要重复提交)

更新完成后,打开在线隧道列表,此时可以看到公网地址已经发生变化,地址名称也变成了固定的二级子域名名称的域名:

最后,我们使用固定的公网地址在任何浏览器打开访问,可以看到成功访问 Whisper Web,这样一个固定且永久不变的公网地址就设置好了。

以上就是如何在Windows系统电脑本地部署语音转文本服务Whisper Web,并结合cpolar内网穿透工具实现远程访问使用的全部流程,另外由于该服务无需账号即可在浏览器直接访问,出于安全考虑,建议大家远程访问时不要轻易与他人分享地址。

总之,Whisper Web 凭借本地化运行的优势降低了语音转写的技术门槛,而 cpolar 则通过内网穿透打破了网络边界,两者结合让语音转文字服务既能安心跑在本地,又能灵活应对远程使用需求,为日常办公和个人使用提供了实用且经济的解决方案。

cpolar官网-安全的内网穿透工具 | 无需公网ip | 远程访问 | 搭建网站

相关推荐
袁庭新1 小时前
2025年11月总结
人工智能·aigc
代码输入中...1 小时前
大模型项目实战:多领域智能应用开发
人工智能·机器学习·ai编程
科普瑞传感仪器1 小时前
告别“盲打磨”:六维力传感器如何通过选型实现真正的机器人恒力控制?
人工智能·科技·ai·机器人·无人机
Lovely Ruby1 小时前
前端er Go-Frame 的学习笔记:实现 to-do 功能(三),用 docker 封装成镜像,并且同时启动前后端数据库服务
前端·学习·golang
深红2 小时前
玩转小程序AR-实战篇
前端·微信小程序·webvr
银空飞羽2 小时前
让Trae SOLO全自主学习开发近期爆出的React RCE漏洞靶场并自主利用验证(CVE-2025-55182)
前端·人工智能·安全
图欧学习资源库2 小时前
人工智能领域、图欧科技、IMYAI智能助手2025年10月更新月报
人工智能·科技
TextIn智能文档云平台2 小时前
怎么批量将扫描件变成文档?
人工智能·机器学习
钮钴禄·爱因斯晨2 小时前
DevUI 组件生态与 MateChat 智能应用:企业级前端智能化实战
前端