Agent实践三:基于Chroma的RAG检索

embeding.py

python 复制代码
import function
import chromadb
from google import genai

google_client = genai.Client()
EMBEDDING_MODEL = "gemini-embedding-exp-03-07"
LLM_MODEL = "gemini-2.5-flash-preview-05-20"

chromadb_client = chromadb.PersistentClient("./chroma.db")
chromadb_collection = chromadb_client.get_or_create_collection("question")

def embed(text: str, store: bool) -> list[float]:
    result = google_client.models.embed_content(
        model=EMBEDDING_MODEL,
        contents=text,
        config={
            "task_type": "RETRIEVAL_DOCUMENT" if store else "RETRIEVAL_QUERY"
        }
    )

    assert result.embeddings
    assert result.embeddings[0].values
    return result.embeddings[0].values

def create_db() -> None:
    for idx, c in enumerate(function.get_chunks()):
        print(f"Process: {c}")
        embedding = embed(c, store=True)
        chromadb_collection.upsert(
            ids=str(idx),
            documents=c,
            embeddings=embedding
        )

def query_db(question: str) -> list[str]:
    question_embedding = embed(question, store=False)
    result = chromadb_collection.query(
        query_embeddings=question_embedding,
        n_results=5
    )
    assert result["documents"]
    return result["documents"][0]


if __name__ == '__main__':
    question = "question"
    # create_db()
    chunks = query_db(question)
    prompt = "Please answer user's question according to context\n"
    prompt += f"Question: {question}\n"
    prompt += "Context:\n"
    for c in chunks:
        prompt += f"{c}\n"
        prompt += "-------------\n"
    
    result = google_client.models.generate_content(
        model=LLM_MODEL,
        contents=prompt
    )
    print(result)

function.py

python 复制代码
def read_data() -> str:
    with open("data.md", "r", encoding="utf-8") as f:
        return f.read()
 
def get_chunks() -> list[str]:
    content = read_data()
    chunks = content.split('\n\n')
    
    result = []
    header = ""
    for c in chunks:
        if c.startswith("#"):
            header += f"{c}\n"
        else:
            result.append(f"{header}{c}")
            header = ""

    return result

if __name__ == '__main__':
    chunks = get_chunks()
    for c in chunks:
        print(c)
        print("--------------")
相关推荐
杨艺韬4 小时前
MCP协议设计与实现-第02章 架构总览:Host-Client-Server 模型
agent
杨艺韬4 小时前
MCP协议设计与实现-第1章 为什么需要 MCP
agent
landuochong2004 小时前
智能体闭环进展:从学习、记忆、决策到执行
人工智能·学习·claudecode
fly-iot4 小时前
TradingAgents 是一个模拟真实交易公司运作模式的多智能体交易框架,本地运行命令行工具,演示执行命令行模式,使用docker镜像打包
python·股票系统·tradingagents
杨艺韬4 小时前
MCP协议设计与实现-第13章 Streamable HTTP:远程流式传输
agent
杨艺韬4 小时前
MCP协议设计与实现-第11章 Python Client 实现剖析
agent
杨艺韬4 小时前
MCP协议设计与实现-第7章 Prompt:可复用的交互模板
agent
杨艺韬4 小时前
MCP协议设计与实现-第09章 TypeScript Client 实现剖析
agent
杨艺韬4 小时前
MCP协议设计与实现-第03章 JSON-RPC 与消息格式
agent
2401_865439634 小时前
CSS如何实现图片自动裁剪填充_巧用object-fit属性控制尺寸
jvm·数据库·python