机器学习|精选生产级LLM开源项目

为了方便LLM相关的学习,整理了ChatGPT相关开源库列表,包括数据预处理、训练/微调、评估/基准测试、服务/推理、应用/RAG、测试/监控、安全等。

LLM 数据处理

LLM 训练 / 微调

LLM 评估 / 基准测试

LLM 服务 / 推理

LLM 应用 / RAG

LLM 测试 / 监控

  • promptflow [github.com/microsoft/p...] 构建高质量的LLM应用------从原型、测试到生产部署和监控。
  • langfuse [github.com/langfuse/la...] 开源LLM工程平台:可观察性、指标、评估、提示管理、操场、数据集,与LlamaIndex、Langchain、OpenAI SDK、LiteLLM等集成。
  • evidently [github.com/evidentlyai...] Evidently是一个开源的ML和LLM可观察性框架,评估、测试和监控任何AI驱动的系统或数据管道。从表格数据到生成AI,100+指标。
  • giskard [github.com/Giskard-AI/...] 开源的LLM和ML模型评估与测试。
  • promptfoo [github.com/promptfoo/p...] 测试你的提示、代理和RAG。对LLM进行红队测试、渗透测试和漏洞扫描,提高应用质量并发现问题。比较GPT、Claude、Gemini、Llama等的性能,简单的声明性配置,支持命令行和CI/CD集成。
  • phoenix [github.com/Arize-ai/ph...] AI可观察性与评估。
  • agenta [github.com/Agenta-AI/a...] 一体化LLM开发平台:提示管理、评估、人类反馈和部署一站式解决。

LLM 安全

参考

(1)github.com/EthicalML/a...

(2)github.com/jihoo-kim/a...

相关推荐
罗西的思考2 小时前
AI Agent框架探秘:拆解 OpenHands(10)--- Runtime
人工智能·算法·机器学习
冬奇Lab3 小时前
OpenClaw 源码精读(2):Channel & Routing——一条消息如何找到它的 Agent?
人工智能·开源·源码阅读
冬奇Lab3 小时前
一天一个开源项目(第38篇):Claude Code Telegram - 用 Telegram 远程用 Claude Code,随时随地聊项目
人工智能·开源·资讯
格砸4 小时前
从入门到辞职|从ChatGPT到OpenClaw,跟上智能时代的进化
前端·人工智能·后端
可观测性用观测云4 小时前
可观测性 4.0:教系统如何思考
人工智能
sunny8654 小时前
Claude Code 跨会话上下文恢复:从 8 次纠正到 0 次的工程实践
人工智能·开源·github
小笼包包仔5 小时前
OpenClaw 多Agent软件开发最佳实践指南
人工智能
smallyoung5 小时前
AgenticRAG:智能体驱动的检索增强生成
人工智能
_skyming_5 小时前
OpenCode 如何做到结果不做自动质量评估,为什么结果还不错?
人工智能
南山安5 小时前
手写 Cursor 核心原理:从 Node.js 进程到智能 Agent
人工智能·agent·设计