langchain 的向量存储

langchain 的向量存储

langchain内提供向量存储的功能,可以基于

  1. InMemoryVectorStore 完成内存向量存储
  2. chroma,外部数据库存储

向量存储类均提供三个通用接口:

  1. add_document,添加文档到向量存储
  2. delete,从向量存储中删除文档
  3. similarity_search,相似度搜索
python 复制代码
from langchain_core.vectorstores import InMemoryVectorStore
from langchain_chroma import Chroma
from langchain_community.embeddings import DashScopeEmbeddings
from langchain_community.document_loaders import CSVLoader


# vector_store = InMemoryVectorStore(    #内存向量存储
#   embedding=DashScopeEmbeddings()
# )

vector_store = Chroma(   #文件持久化存储向量数据库存储
  collection_name="test",   #当前向量存储名称
  embedding_function=DashScopeEmbeddings(),  #嵌入模型
  persist_directory="./data/chroma_langchain_db"   # 指定数据存放的文件夹 
)

loader = CSVLoader(
  file_path="/Users/apple/Desktop/agent_student/qianwen/data/info.csv",
  encoding="utf-8",
  source_column="source"   #指定本条数据来源哪里
)
document = loader.load()

new_document = vector_store.add_documents(   #添加数据
  documents = document,
  ids=["id" + str(i) for i in range(1,len(document)+1)]
)

vector_store.delete(["id1","id2"])   #删除索引

result = vector_store.similarity_search(
  "python 是什么",
  10,
  filter={"source":"黑马程序员"}
)


print(result)
相关推荐
赢乐19 分钟前
大模型学习笔记:LangChain核心组件-记忆(memory)
数据库·langchain·长短时记忆网络·长期记忆·短期记忆·智能体agent·记忆(memory)
最贪吃的虎3 小时前
给 Agent 接入新模型的推理模式:从配置开关到协议适配
人工智能·python·langchain
ftpeak6 小时前
LangGraph Agent 开发指南(10~子图 Subgraphs)
python·ai·langchain·ai编程·langgraph
lbb 小魔仙6 小时前
工业数据困局的破局者:DolphinDB 如何让海量时序数据真正“跑“出价值
开发语言·人工智能·python·langchain
秦歌66615 小时前
DeepAgents框架详解和文件后端
人工智能·langchain
一起逃去看海吧20 小时前
LangChain-01
langchain
打小就很皮...1 天前
基于 Python + LangChain + SQL 生成自动查询数据实战
数据库·sql·langchain
新知图书1 天前
带搜索工具的对话 Agent示例与解析
人工智能·langchain·agent·智能体·langgraph