机器学习|精选生产级LLM开源项目

为了方便LLM相关的学习,整理了ChatGPT相关开源库列表,包括数据预处理、训练/微调、评估/基准测试、服务/推理、应用/RAG、测试/监控、安全等。

LLM 数据处理

LLM 训练 / 微调

LLM 评估 / 基准测试

LLM 服务 / 推理

LLM 应用 / RAG

LLM 测试 / 监控

  • promptflow [github.com/microsoft/p...] 构建高质量的LLM应用------从原型、测试到生产部署和监控。
  • langfuse [github.com/langfuse/la...] 开源LLM工程平台:可观察性、指标、评估、提示管理、操场、数据集,与LlamaIndex、Langchain、OpenAI SDK、LiteLLM等集成。
  • evidently [github.com/evidentlyai...] Evidently是一个开源的ML和LLM可观察性框架,评估、测试和监控任何AI驱动的系统或数据管道。从表格数据到生成AI,100+指标。
  • giskard [github.com/Giskard-AI/...] 开源的LLM和ML模型评估与测试。
  • promptfoo [github.com/promptfoo/p...] 测试你的提示、代理和RAG。对LLM进行红队测试、渗透测试和漏洞扫描,提高应用质量并发现问题。比较GPT、Claude、Gemini、Llama等的性能,简单的声明性配置,支持命令行和CI/CD集成。
  • phoenix [github.com/Arize-ai/ph...] AI可观察性与评估。
  • agenta [github.com/Agenta-AI/a...] 一体化LLM开发平台:提示管理、评估、人类反馈和部署一站式解决。

LLM 安全

参考

(1)github.com/EthicalML/a...

(2)github.com/jihoo-kim/a...

相关推荐
AKAMAI18 小时前
从客户端自适应码率流媒体迁移到服务端自适应码率流媒体
人工智能·云计算
jinxinyuuuus18 小时前
GTA 风格 AI 生成器:跨IP融合中的“视觉语义冲突”与风格适配损失
人工智能·网络协议
如何原谅奋力过但无声18 小时前
TensorFlow 1.x常用函数总结(持续更新)
人工智能·python·tensorflow
翔云 OCR API18 小时前
人脸识别API开发者对接代码示例
开发语言·人工智能·python·计算机视觉·ocr
咚咚王者18 小时前
人工智能之数据分析 numpy:第十三章 工具衔接与迁移
人工智能·数据分析·numpy
咚咚王者18 小时前
人工智能之数据分析 numpy:第九章 数组运算(二)
人工智能·数据分析·numpy
YangYang9YangYan18 小时前
网络安全专业职业能力认证发展路径指南
大数据·人工智能·安全·web安全
aitoolhub19 小时前
精选AI设计工具测评:创新性、易用性及行业应用
人工智能·在线设计
safestar201219 小时前
n8n 架构深度解构:从设计哲学到企业级实践
人工智能·ai编程
喵手19 小时前
AI在自动化与机器人技术中的前沿应用
人工智能·机器人·自动化