NLP Bi-Encoder和Re-ranker

Retrieve & Re-Rank

https://www.sbert.net/examples/applications/retrieve_rerank/README.html

Bi-Encoder vs. Cross-Encoder

https://www.sbert.net/examples/applications/cross-encoder/README.html

Bi-Encoder会用BERT对输入文本编码,再根据cosine相似度分数筛选文本。Cross-Encoder会直接计算两个句子的相关性分数。

如何将BI和Cross Encoder配合使用?可以先用BI-Encoder选出top 100个候选项,再用Cross-Encoder挑选最佳选项。

Combining Bi- and Cross-Encoders

Cross-Encoder achieve higher performance than Bi-Encoders, however, they do not scale well for large datasets.

Here, it can make sense to combine Cross- and Bi-Encoders, for example in Information Retrieval / Semantic Search scenarios:

First, you use an efficient Bi-Encoder to retrieve e.g. the top-100 most similar sentences for a query.

Then, you use a Cross-Encoder to re-rank these 100 hits by computing the score for every (query, hit) combination.

相关推荐
权泽谦9 分钟前
病灶变化预测 vs 分类:医学影像 AI 中更有价值的问题是什么?
人工智能·机器学习·ai·分类·数据挖掘
Sui_Network12 分钟前
Walrus 2025 年度回顾
大数据·前端·人工智能·深度学习·区块链
hk112413 分钟前
【NLP/PatternRec】2026年度语义鸿沟分析与模糊模式识别基准索引 (Benchmark Index)
算法·自然语言处理·数据集·知识图谱·模式识别
说私域19 分钟前
开源悬赏活动报名AI智能名片链动2+1模式商城小程序的应用与价值
人工智能·微信·小程序·开源
yuniko-n20 分钟前
【AI】基于 LLaMa-Factory 和 LoRA 算法的大模型微调
人工智能
张彦峰ZYF22 分钟前
大模型是如何工作的?从原理到通义生态的落地实践
人工智能·大模型是如何工作的?·从原理到通义生态的落地实践·大模型价值是与真实业务深度融合
jimmyleeee22 分钟前
人工智能基础知识笔记三十一:Langfuse
人工智能·笔记
桂花饼23 分钟前
小镜AI开放平台:Sora 2 API 低价高并发解决方案评测整理
人工智能·qwen3-next·sora2·nano banana 2·gemini-3-pro·gpt-5.2·glm-4.7
skywalk816325 分钟前
小米大模型mimo-v2-flash简单接触
人工智能·小米
争不过朝夕,又念着往昔25 分钟前
C++AI
开发语言·c++·人工智能