whisper-v3模型部署环境执行

1. 安装whisperV3

  1. github git clone https://github.com/openai/whisper.git
  2. pip install -U openai-whisper
  3. pip install setuptools-rust
    这些都没有安装 但是github下载的版本是能执行成功的
  4. pip install accelerate
  5. pip install soundfile
  6. pip install librosa
  7. pip install torchaudio

requirements.txt

复制代码
numba
numpy
torch
tqdm
more-itertools
tiktoken
triton>=2.0.0,<3;platform_machine=="x86_64" and sys_platform=="linux" or sys_platform=="linux2"

github官方版本

要进到whisper目录里面, 执行脚本要和whisper/whisper目录同级。这样就执行成功了。

py 复制代码
import whisper

model = whisper.load_model("base")
result = model.transcribe("audio.mp3")
print(result["text"])

遇到的名词解释

1. 大模型的弱标签

在大模型中,弱标签(Weak Labels)通常指的是相对于强标签(Strong Labels)而言的标签类型。强标签是指对每个样本都有明确、准确的标签,可以直接用于训练模型的监督学习任务。而弱标签则指的是对样本的标签信息不够准确或完整,可能存在噪声、不确定性或模糊性。

弱标签可以是多种形式,常见的包括但不限于:

  1. 部分标签(Partial Labels):只对样本的部分特征或属性进行标记,而不是对整个样本进行标记。
  2. 噪声标签(Noisy Labels):由于标注过程中的错误或不确定性而产生的标签。
  3. 不确定标签(Uncertain Labels):对于某些样本标签的确定性不高,存在一定程度的不确定性。
  4. 模糊标签(Ambiguous Labels):标签含义不明确或模糊,可能存在多种解释或理解。

在使用弱标签进行训练时,通常需要采取一些特殊的处理方法来处理标签的不确定性和噪声,以提高模型的鲁棒性和泛化能力。这包括使用弱标签推理(Weak Label Inference)、噪声过滤(Noise Filtering)、半监督学习(Semi-Supervised Learning)等技术来充分利用弱标签信息进行模型训练。

参考文档

论文: https://cdn.openai.com/papers/whisper.pdf

whisper-v3 model-card https://huggingface.co/openai/whisper-large-v3

知乎胡儿 v3介绍 https://zhuanlan.zhihu.com/p/662906303

安装参考 https://zhuanlan.zhihu.com/p/666969310

github https://github.com/openai/whisper/blob/main/model-card.md

根据官方文档安装就可以了 https://github.com/openai/whisper/blob/main/README.md

官网 https://openai.com/research/whisper

相关推荐
Dream of maid几秒前
Python基础 6 (面向对象)
开发语言·python
郝学胜-神的一滴3 分钟前
「栈与缩点的艺术」二叉树前序序列化合法性判定:从脑筋急转弯到工程实现
java·开发语言·数据结构·c++·python·算法
无心水13 分钟前
22、Java开发避坑指南:日期时间、Spring核心与接口设计的最佳实践
java·开发语言·后端·python·spring·java.time·java时间处理
Hello.Reader18 分钟前
双卡 A100 + Ollama 最终落地手册一键部署脚本、配置文件、预热脚本与 Python 客户端完整打包
开发语言·网络·python
vx_biyesheji000118 分钟前
计算机毕业设计:Python网约车订单数据可视化系统 Django框架 可视化 数据大屏 数据分析 大数据 机器学习 深度学习(建议收藏)✅
大数据·python·机器学习·信息可视化·django·汽车·课程设计
AC赳赳老秦23 分钟前
OpenClaw实战案例:用1个主控+3个Agent,实现SEO文章日更3篇
服务器·数据库·python·mysql·.net·deepseek·openclaw
智算菩萨27 分钟前
PyCharm版本发展史:从诞生到AI时代的Python IDE演进历程
ide·人工智能·python·pycharm·ai编程
Khsc434ka29 分钟前
LeetCode-001:Python 实现哈希表求两数之和:初识哈希表
python·leetcode·散列表
冬至喵喵1 小时前
构建 CLI 的 Python 框架:Typer技术介绍
开发语言·chrome·python
nimadan121 小时前
豆包写小说软件2025推荐,专业写作助力灵感迸发
大数据·人工智能·python