利用大模型MoritzLaurer/mDeBERTa-v3-base-xnli-multilingual-nli-2mil7实现零样本分类

概念

1、零样本分类:在没有样本标签的情况下对文本进行分类。

2、nli:(Natural Language Inference),自然语言推理

3、xnli:(Cross-Lingual Natural Language Inference) ,是一种数据集,支持15种语言,数据集包含10个领域,每个领域包含750条样本,10个领域共计7500条人工标注的英文测试样本,组成了112500对英文--其他语种的标注对。每条数据样本,由两个句子组成,分别是前提和假设,前提和假设之间的关系,有entailment(蕴含)、contradiction(矛盾)、neutral(中立)三类。

模型

1、手动下载MoritzLaurer/mDeBERTa-v3-base-xnli-multilingual-nli-2mil7到本地,url:MoritzLaurer/mDeBERTa-v3-base-xnli-multilingual-nli-2mil7 at main

2、Git下载:

bash 复制代码
git lfs install
git clone https://huggingface.co/MoritzLaurer/mDeBERTa-v3-base-xnli-multilingual-nli-2mil7

代码:

保存为m.py文件

python 复制代码
import torch
import torch.nn.functional as F
from transformers import AutoTokenizer, AutoModelForSequenceClassification
from transformers import pipeline
model_name = "mDeBERTa-v3-base-xnli-multilingual-nli-2mil7"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)
classifier = pipeline("text-classification", model=model, tokenizer=tokenizer)
for aspect in ['camera', 'phone']:
   print(aspect, classifier('The camera quality of this phone is amazing.',  text_pair=aspect))

输出:

bash 复制代码
[ipa@comm-agi-p]$ python m.py
camera [{'label': 'entailment', 'score': 0.9938687682151794}]
phone [{'label': 'entailment', 'score': 0.9425390362739563}]
相关推荐
cici1587410 分钟前
模式识别,非监督聚类分析分类方法
人工智能·机器学习·分类
QZ1665609515919 分钟前
政务数据智能治理一体化解决方案:合规对标、易掌握、自适应分类的全面实现
分类·数据挖掘·政务
程序员鱼皮1 小时前
女友怒骂国内不能用Claude Code,于是我给她做了一个
计算机·ai·程序员·大模型·互联网·编程
七夜zippoe1 小时前
轻量级多模态模型实战:从Qwen3-VL-4B到企业级应用
架构·大模型·多模态·轻量·qwen3
喜欢吃豆2 小时前
深度解析DeepSeek大语言模型架构演进——从多头注意力机制到 DeepSeek 核心技术体系 (DeepSeek-MoE, MTP, MLA)
人工智能·语言模型·架构·大模型·deepseek
Elwin Wong2 小时前
关于熵的一些概念及其计算
人工智能·大模型·llm
南太湖小蚂蚁3 小时前
基于LangChain1.0的人机交互式大模型调用方法
人工智能·大模型·人机交互
模型启动机3 小时前
对话奥特曼:OpenAI的真实未来蓝图
人工智能·ai·chatgpt·大模型
我很哇塞耶4 小时前
2025年加倍投入AI的九大品牌
大数据·人工智能·ai·大模型
lxmyzzs4 小时前
【硬核部署】在 RK3588上部署毫秒级音频分类算法
人工智能·分类·音视频