NLP Bi-Encoder和Re-ranker

Retrieve & Re-Rank

https://www.sbert.net/examples/applications/retrieve_rerank/README.html

Bi-Encoder vs. Cross-Encoder

https://www.sbert.net/examples/applications/cross-encoder/README.html

Bi-Encoder会用BERT对输入文本编码,再根据cosine相似度分数筛选文本。Cross-Encoder会直接计算两个句子的相关性分数。

如何将BI和Cross Encoder配合使用?可以先用BI-Encoder选出top 100个候选项,再用Cross-Encoder挑选最佳选项。

Combining Bi- and Cross-Encoders

Cross-Encoder achieve higher performance than Bi-Encoders, however, they do not scale well for large datasets.

Here, it can make sense to combine Cross- and Bi-Encoders, for example in Information Retrieval / Semantic Search scenarios:

First, you use an efficient Bi-Encoder to retrieve e.g. the top-100 most similar sentences for a query.

Then, you use a Cross-Encoder to re-rank these 100 hits by computing the score for every (query, hit) combination.

相关推荐
江汉似年6 分钟前
强化学习中的 On-policy 与 Off-policy 全面解析
人工智能·深度学习·算法·rl
sunneo10 分钟前
03-从Chat到Act-Agent行动闭环的产品心理学拆解
人工智能·产品运营·aigc·产品经理·ai-native
Marvel__Dead12 分钟前
基于 AI 大模型的百度旋转验证识别(通用能力极强)
人工智能·爬虫·python·验证码识别·ai 大模型
小船跨境14 分钟前
ChatGPT助力高效网页数据抓取实战
人工智能·网络协议
Juicedata16 分钟前
AI 战略下架构演进:小米基于 JuiceFS 的统一存储实践
人工智能·架构
速易达网络19 分钟前
ChatGPT Images 2.0视觉的突破
人工智能
TENSORTEC腾视科技24 分钟前
腾视科技TS-SG-SM7系列AI算力模组:32TOPS算力引擎,开启边缘智能新纪元
人工智能·ai·算力·ai算力模组·超低功耗·超强算力·灵活扩展
Deepoch30 分钟前
Deepoc 具身模型开发板:让农业除草机器人实现更稳定的自主作业
人工智能·机器人·开发板·具身模型·deepoc·除草
云栖梦泽在30 分钟前
AI安全入门:AI系统被攻击的常见场景与应对思路
大数据·人工智能·安全
zh路西法32 分钟前
【Qwen2.5本地部署】超简单pytorch-gpu部署教程
人工智能·pytorch·python