transform学习资料

一、NLP:自然语言处理

NLP 是机器学习在语言学领域的研究,专注于理解与人类语言相关的一切。NLP 的目标不仅是要理解每个单独的单词,而且能理解这些单词与之相关联的上下文之间的意思。

常见的NLP 任务列表:

  • 对整句的分类:如获取评论的好坏、垃圾邮件的分类,如判断两个句子的逻辑相关性;
  • 对句中单词的分类:如单词的语法构成(名词、动词、形容词)、单词的实体命名(人、地点、时间)
  • 文本内容的生成:如文章续写、屏蔽词填充;
  • 语义提取:给定问题,根据上下文信息提前答案;
  • 从提示文本生成新句子:如文本翻译、文本总结;

NLP 并不局限于书面文本,它也能解决语音识别、计算机视觉方方面的问题,如生成音频样本的转录、图像的描述等;

二、Transformer

Hugging Face Hub 社区是最大的Transformer 开发者的交流地,里面分享了数千个预训练模型,任何人都可以下载和使用。而Transformers 库提供了创建和使用这些共享模型的功能。

python 复制代码
# # 安装
pip install transformers

# # 导入
import transformers

2.1、pipeline() 管道函数

Transformers 库最基本的对象是pipeline ()管道函数,它将必要的预处理后处理连接起来,使我们能直接输入文本并获取对应需求的答案。将文本传递到管道时主要涉及三个步骤:

  1. 人类可理解的文本被预处理为模型可理解的数据格式;
  2. 将可理解的数据传递给模型,模型做出预测;
  3. 模型的预测再经过后处理,输出人类可理解的文本。

情感分析

python 复制代码
from transformers import pipeline

classifier = pipeline("sentiment-analysis")
classifier("I've been waiting for a HuggingFace course my whole life.")
# # [{'label': 'POSITIVE', 'score': 0.9598047137260437}]

classifier(["I've been waiting for a HuggingFace course my whole life.", "I hate this so much!"])

##  [{'label': 'POSITIVE', 'score': 0.9598047137260437},
##   {'label': 'NEGATIVE', 'score': 0.9994558095932007}]

零样本分类

python 复制代码
from transformers import pipeline

classifier = pipeline("zero-shot-classification")
classifier("This is a course about the Transformers library",
    candidate_labels=["education", "politics", "business"])

2.1、

2.1、

相关推荐
机器学习之心2 小时前
TCN-Transformer-GRU时间卷积神经网络结合编码器组合门控循环单元多特征分类预测Matlab实现
cnn·gru·transformer
Baihai_IDP2 小时前
怎样为你的 RAG 应用选择合适的嵌入模型?
人工智能·llm·aigc
视觉&物联智能3 小时前
【杂谈】-制造业变革:机器人与自动化引领新时代
人工智能·ai·机器人·自动化·aigc·agi·deepseek
Mintopia3 小时前
🧬 医疗Web场景下,AIGC的辅助诊断技术边界与伦理
前端·javascript·aigc
高洁014 小时前
大模型-详解 Vision Transformer (ViT)
人工智能·python·深度学习·算法·transformer
m0_6501082410 小时前
【论文精读】MotionEditor:基于内容感知扩散模型的视频运动编辑
aigc·论文精读·视频运动编辑·潜在扩散模型(ldm)·注意力注入·时空一致性
xier_ran14 小时前
Transformer:Decoder 中,Cross-Attention 所用的 K(Key)和 V(Value)矩阵,是如何从 Encoder 得到的
深度学习·矩阵·transformer
2401_8414956415 小时前
【自然语言处理】轻量版生成式语言模型GPT
人工智能·python·gpt·深度学习·语言模型·自然语言处理·transformer
墨风如雪15 小时前
OAK:打破壁垒,共绘智能体生态新蓝图
aigc
算家计算18 小时前
一张白纸,无限画布:SkyReels刚刚重新定义了AI视频创作
人工智能·aigc·资讯