模型能力赋能搜索——零样本分类(Zero-Shot Classification)在搜索意图识别上的探索

什么是Zero-Shot Classification

https://huggingface.co/tasks/zero-shot-classification

hugging face上的零样本分类模型

facebook/bart-large-mnli

https://huggingface.co/facebook/bart-large-mnli

当然这是一个英文模型,我们要去用一些多语言的模型。

可以在这里找更多适合自己的

https://huggingface.co/models

零样本分类能力测试效果

当然这是一个英文模型,我们要去用一些多语言的模型。

可以先看看中文效果,也还行

问:请帮我润色一下这句话

分类结果:

用英文测试

问答

问答

问答

总结

摘要

总结

这个案例还是很经典的。它表面上是在问答,实际上是要做总结。

测试结论

从上述的测试用例来看,分类效果还是很不错的。这样实际上我是可以使用该模型,进行问题意图识别的。因为搜索框,对话框,被传进来的内容类型是未知的。但是不同类型的问题,去到不同的分支上,效果一定是最好的。就像上边的测试案例。通过模型,可以推测出来,输入框的内容到底是什么意图,是总结任务?还是摘要任务?还是问答任务?

在模型中,我们只需要去定义已知的和能够处理的分支即可。轻松利用模型的能力,来做意图识别。

当然这是一个初步的探索。想要获得更好的效果,还会要进行模型调优的。

相关推荐
大千AI助手1 小时前
SWE-bench:真实世界软件工程任务的“试金石”
人工智能·深度学习·大模型·llm·软件工程·代码生成·swe-bench
天上的光2 小时前
17.迁移学习
人工智能·机器学习·迁移学习
后台开发者Ethan2 小时前
Python需要了解的一些知识
开发语言·人工智能·python
猫头虎3 小时前
猫头虎AI分享|一款Coze、Dify类开源AI应用超级智能体快速构建工具:FastbuildAI
人工智能·开源·prompt·github·aigc·ai编程·ai-native
重启的码农3 小时前
ggml 介绍 (6) 后端 (ggml_backend)
c++·人工智能·神经网络
重启的码农3 小时前
ggml介绍 (7)后端缓冲区 (ggml_backend_buffer)
c++·人工智能·神经网络
数据智能老司机3 小时前
面向企业的图学习扩展——图简介
人工智能·机器学习·ai编程
mit6.8244 小时前
[AI React Web] 包与依赖管理 | `axios`库 | `framer-motion`库
前端·人工智能·react.js
小阿鑫4 小时前
不要太信任Cursor,这位网友被删库了。。。
人工智能·aigc·cursor·部署mcp