技术栈
大数据模型
胡伯来了
20 天前
音视频
·
transformer
·
transformers
·
大数据模型
17 Transformers - 音频领域的任务类
在音频领域的任务中,包括实现音频分类的 AudioClassificationPipeline 任务类,能够自动识别语音的 AutomaticSpeechRecognitionPipeline 任务类, 能够经文本转化为语音即语音合成的 TextToAudioPipeline 任务类和在没有任何鉴见的样本、训练模型下也能够对给定的语音进行推理分类的 ZeroShotAudioClassificationPipeline 零样本音频分类任务类。
胡伯来了
21 天前
人工智能
·
计算机视觉
·
transformer
·
transformers
·
大数据模型
12 Transformers - 使用Pipeline处理计算机视觉
计算机视觉任务中最早成功之一是使用卷积神经网络(Convolutional Neural Networks,CNN)识别图像中的邮政编码。图像由像素组成,每个像素都有一个数值,使得将图像用像素值矩阵表示变得容易。每个像素值组合描述了图像的颜色。
胡伯来了
21 天前
人工智能
·
pipeline
·
transformer
·
transformers
·
大数据模型
10 Transformers - 任务容器类 Pipeline
管道(pipelines) 是使用模型进行推理的一种强大易用的方法;是从 Transformers库中抽取出大多数复杂代码构造而成的,用于提供完成特定功能的任务类集合,包括命名实体识别、掩码语言建模、情感分析、特征提取和问答等。
胡伯来了
21 天前
人工智能
·
transformer
·
transformers
·
音频处理
·
大数据模型
11 Transformers - 使用Pipeline处理音频
音频和语音处理任务与其他模态略有不同,主要是因为音频作为输入是连续信号。与文本不同,原始音频波形不能像将句子分成单词那样整齐地分成离散的块。为了解决这个问题,原始音频信号通常以固定的间隔采样。如果在一个间隔内采样次数越多,采样率就越高,音频就越接近原始音频源。
我是有底线的