检索

CS_木成河12 天前
论文阅读·人工智能·embedding·检索·文本嵌入·bge
【论文阅读】BGE M3-Embedding:通过自知识蒸馏实现多语言、多功能、多粒度的文本嵌入在本文中,作者介绍了一种称为 M3-Embedding 的新嵌入模型,该模型因其在多语言、多功能 和 多粒度上的通用性而与众不同。它为 100 多种工作语言的语义检索提供统一支持。它可以同时完成三种常见的检索功能:密集检索、多向量检索和稀疏检索。此外,它还能够处理不同粒度的输入,从短句子到最多 8192 个token的长文档。 M3-Embedding 的有效训练呈现出一系列技术贡献。尤其,作者提出了一种新的自知识蒸馏方法,其中来自不同检索功能的相关性分数可以整合为teacher信号,以提升训练质量。作者
键盘会跳舞2 个月前
专利·检索·专利检索
【专利检索】:强大的正规军专利检索超级方便,路径: https://pss-system.cponline.cnipa.gov.cn/conventionalSearch
scl、2 个月前
搜索·检索·bm25·topk
ElasticSearch学习篇15_《检索技术核心20讲》进阶篇之TopK检索学习极客实践课程《检索技术核心20讲》https://time.geekbang.org/column/article/215243,文档形式记录笔记。 相关问题:
沐沐森的故事4 个月前
开发语言·python·xpath·查看·检索·bible·shengjing
python之Bible快速检索器内容将会持续更新,有错误的地方欢迎指正,谢谢!最近在看shengjing的时候突发奇想,能不能开发一款可以快速查询shengjing的软件,通过输入书名章:节这样的方式来快速查询,于是就开发了这款能够可以快速查询的软件。
余俊晖4 个月前
人工智能·llm·聚类·向量·rag·检索
【RAG】RAG性能提升之路-RAPTOR:一种构建递归文档树的增强检索方法检索增强型语言模型(RALMs)在处理需要不断更新的知识和大量信息的文档时确实展现出了优势。然而,现有的方法在处理长篇文档时存在局限性,主要是因为它们通常只能检索较短的文本片段,这限制了对整体文档上下文的全面理解。在NLP中,长篇文档的检索和理解一直是一个挑战,因为传统检索方法往往难以有效处理长文档中的复杂结构和信息,可能导致检索结果不准确或遗漏关键信息。
三杯五岳9 个月前
uni-app·列表·通讯录·检索·原生插件·字母索引
uniapp 字母索引列表插件(组件版) Ba-SortListBa-SortList 是一款字母索引列表组件版插件,可自定义样式,支持首字母字母检索、首字检索、搜索等等;支持点击事件。
Python算法实战9 个月前
人工智能·语言模型·langchain·大模型·垂直大模型·检索
垂直领域大模型落地思考相比能做很多事,但每件事都马马虎虎的通用大模型;只能做一两件事,但这一两件事都能做好,可被信赖的垂直大模型会更有价值。这样的垂直大模型能帮助我们真正解决问题,提高生产效率。
周全全1 年前
elasticsearch·全文检索·es·1024程序员节·检索·mapping
Elasticsearch基础篇(六):es映射和常用的字段类型官方地址:Mapping在 Elasticsearch 中,映射是索引的关键组成部分,它定义了文档的结构和字段。每个文档都包含一个或多个字段,而映射定义了这些字段的数据类型、如何分析文本、字段是否可搜索等信息。