模型能力赋能搜索——零样本分类(Zero-Shot Classification)在搜索意图识别上的探索

什么是Zero-Shot Classification

https://huggingface.co/tasks/zero-shot-classification

hugging face上的零样本分类模型

facebook/bart-large-mnli

https://huggingface.co/facebook/bart-large-mnli

当然这是一个英文模型,我们要去用一些多语言的模型。

可以在这里找更多适合自己的

https://huggingface.co/models

零样本分类能力测试效果

当然这是一个英文模型,我们要去用一些多语言的模型。

可以先看看中文效果,也还行

问:请帮我润色一下这句话

分类结果:

用英文测试

问答

问答

问答

总结

摘要

总结

这个案例还是很经典的。它表面上是在问答,实际上是要做总结。

测试结论

从上述的测试用例来看,分类效果还是很不错的。这样实际上我是可以使用该模型,进行问题意图识别的。因为搜索框,对话框,被传进来的内容类型是未知的。但是不同类型的问题,去到不同的分支上,效果一定是最好的。就像上边的测试案例。通过模型,可以推测出来,输入框的内容到底是什么意图,是总结任务?还是摘要任务?还是问答任务?

在模型中,我们只需要去定义已知的和能够处理的分支即可。轻松利用模型的能力,来做意图识别。

当然这是一个初步的探索。想要获得更好的效果,还会要进行模型调优的。

相关推荐
_codemonster2 分钟前
深度学习实战(基于pytroch)系列(四十)长短期记忆(LSTM)从零开始实现
人工智能·深度学习·lstm
问知AI16 分钟前
InsightMatrix:问知AI的核心基座大模型
人工智能·科技·ai写作·内容运营
深圳佛手25 分钟前
实例说明大模型参数到底是什么
人工智能
OpenCSG28 分钟前
智源Emu3.5发布:34B参数的世界模型基座,以“下一状态预测”重塑多模态Scaling范式
人工智能·开源
leo_23229 分钟前
SMP(软件制作平台)到底是什么?--小视频番外篇之一
人工智能·科技创新·smp(软件制作平台)·中国语言
youcans_30 分钟前
【DeepSeek 论文精读】15. DeepSeek-V3.2:开拓开源大型语言模型新前沿
论文阅读·人工智能·语言模型·智能体·deepseek
_Twink1e31 分钟前
【HCIA-AIV4.0】2025题库+解析(二)
人工智能·深度学习·机器学习
新知图书32 分钟前
FastGPT的特点与优势
人工智能·ai agent·智能体·大模型应用开发·大模型应用
serve the people1 小时前
PQ+IVF组合解决海量向量内存占用高和检索慢的问题
人工智能·python
on_pluto_1 小时前
【debug】解决 5070ti 与 pytorch 版本不兼容的问题
人工智能·pytorch·python