技术栈

rerank

liliangcsdn
7 小时前
人工智能·数据分析·embedding·llama·rerank
基于llama.cpp的量化版reranker模型调用示例CPU平台transformers版reranker响应速度慢,这里尝试量化版模型,期望提高响应速度。