bge

仙人掌_lz7 天前
人工智能·ai·自然语言处理·embedding·强化学习·rl·bge
为特定领域微调嵌入模型:打造专属的自然语言处理利器“学习不是装满一桶水,而是点燃一把火。” —— 叶芝我的博客主页: https://lizheng.blog.csdn.net
(ง •_•)ง up8 天前
chromadb·bge
ChromaDB调用BGE模型的两种实践方式在语义搜索、知识库构建等场景中,文本向量化(Embedding)是核心技术环节。作为一款开源的向量数据库,ChromaDB允许开发者通过自定义嵌入函数灵活对接各类模型。本文将详细介绍两种基于BGE模型的实现方案:远程API调用与本地模型部署,并解析它们的应用场景与实现细节。
CS_木成河8 个月前
论文阅读·人工智能·embedding·检索·文本嵌入·bge
【论文阅读】BGE M3-Embedding:通过自知识蒸馏实现多语言、多功能、多粒度的文本嵌入在本文中,作者介绍了一种称为 M3-Embedding 的新嵌入模型,该模型因其在多语言、多功能 和 多粒度上的通用性而与众不同。它为 100 多种工作语言的语义检索提供统一支持。它可以同时完成三种常见的检索功能:密集检索、多向量检索和稀疏检索。此外,它还能够处理不同粒度的输入,从短句子到最多 8192 个token的长文档。 M3-Embedding 的有效训练呈现出一系列技术贡献。尤其,作者提出了一种新的自知识蒸馏方法,其中来自不同检索功能的相关性分数可以整合为teacher信号,以提升训练质量。作者