技术栈

语言转文字

积淀 ytu2024-07-27 19:25

因为工作原因需要将语音转化为文字,经常搜索终于找到一个免费的好用工具,记录下使用方法

安装Whisper


搜索Colaboratory




右上方链接服务

执行

复制代码
!pip install git+https://github.com/openai/whisper.git
!sudo apt update && sudo apt install ffmpeg

将语音转化为文字

上传文本

点击代码执行

复制代码
!whisper "文件名(需要替换).mp3" --model medium
上一篇:libevent入门篇
下一篇:Linux-Centos-改密码(单用户登陆)
相关推荐
master-dragon
5 小时前
spring-ai 工作流
人工智能·spring·ai
ZNineSun
7 小时前
MCP+Cursor入门
ai·cursor·mcp
音视频牛哥
8 小时前
计算机视觉的新浪潮:扩散模型(Diffusion Models)技术剖析与应用前景
人工智能·计算机视觉·ai·音视频·实时音视频·扩散模型
大卫小东(Sheldon)
11 小时前
GIM 1.5发布了! 支持Windows系统了
git·ai·rust
探索云原生
12 小时前
开源 vGPU 方案 HAMi: core&memory 隔离测试
ai·vgpu
Deepoch
19 小时前
Deepoc 大模型在无人机行业应用效果的方法
人工智能·科技·ai·语言模型·无人机
Deepoch
19 小时前
Deepoc 大模型:无人机行业的智能变革引擎
人工智能·科技·算法·ai·动态规划·无人机
Sally璐璐
10 天前
数据标注工具详解
大数据·ai
热门推荐
01手机电脑之间快速传输图片视频文件,不压缩画质、不限制大小的方法!02如何将markdown生成pdf03Coze扣子平台完整体验和实践(附国内和国际版对比)04Coze实战第13讲:飞书多维表格读取+豆包生图模型,轻松批量生成短剧封面05鸽了六年的某大厂面试题:你会手写一个模板引擎吗?06扣子(coze)实战|我用扣子搭建了一个自动分析小红薯笔记内容的AI应用|详细步骤拆解07华为昇腾 910B 部署 DeepSeek-R1 蒸馏系列模型详细指南08《C#图解教程 第5版》深度推荐09DeepSeek各版本说明与优缺点分析10C#调用WechatOCR.exe实现本地OCR文字识别