机器学习|精选生产级LLM开源项目

为了方便LLM相关的学习,整理了ChatGPT相关开源库列表,包括数据预处理、训练/微调、评估/基准测试、服务/推理、应用/RAG、测试/监控、安全等。

LLM 数据处理

LLM 训练 / 微调

LLM 评估 / 基准测试

LLM 服务 / 推理

LLM 应用 / RAG

LLM 测试 / 监控

  • promptflow [github.com/microsoft/p...] 构建高质量的LLM应用------从原型、测试到生产部署和监控。
  • langfuse [github.com/langfuse/la...] 开源LLM工程平台:可观察性、指标、评估、提示管理、操场、数据集,与LlamaIndex、Langchain、OpenAI SDK、LiteLLM等集成。
  • evidently [github.com/evidentlyai...] Evidently是一个开源的ML和LLM可观察性框架,评估、测试和监控任何AI驱动的系统或数据管道。从表格数据到生成AI,100+指标。
  • giskard [github.com/Giskard-AI/...] 开源的LLM和ML模型评估与测试。
  • promptfoo [github.com/promptfoo/p...] 测试你的提示、代理和RAG。对LLM进行红队测试、渗透测试和漏洞扫描,提高应用质量并发现问题。比较GPT、Claude、Gemini、Llama等的性能,简单的声明性配置,支持命令行和CI/CD集成。
  • phoenix [github.com/Arize-ai/ph...] AI可观察性与评估。
  • agenta [github.com/Agenta-AI/a...] 一体化LLM开发平台:提示管理、评估、人类反馈和部署一站式解决。

LLM 安全

参考

(1)github.com/EthicalML/a...

(2)github.com/jihoo-kim/a...

相关推荐
IT古董几秒前
【第七章:时间序列模型】2.时间序列统计模型与神经网络模型-(2)适用广泛的时间序列模型:Arima模型
人工智能·深度学习·神经网络
IT_陈寒6 分钟前
Spring Boot 3.2性能翻倍!我仅用5个技巧就让接口响应时间从200ms降到50ms
前端·人工智能·后端
iNBC28 分钟前
AI基础概念-第一部分:核心名词与定义(一)
人工智能·语言模型·prompt
wechat_Neal2 小时前
AI革新汽车安全软件开发
人工智能·语言模型·自然语言处理
leafff1236 小时前
新手入坑 Stable Diffusion:模型、LoRA、硬件一篇讲透
人工智能·计算机视觉·stable diffusion
Liudef067 小时前
DeepseekV3.2 实现构建简易版Wiki系统:从零开始的HTML实现
前端·javascript·人工智能·html
格林威9 小时前
AOI在产品质量检测制造领域的应用
人工智能·数码相机·计算机网络·计算机视觉·目标跟踪·视觉检测·制造
短视频矩阵源码定制9 小时前
矩阵系统源码推荐:技术架构与功能完备性深度解析
java·人工智能·矩阵·架构
彩云回9 小时前
多维尺度分析法(MDS)
人工智能·机器学习·1024程序员节
Rock_yzh9 小时前
AI学习日记——Transformer的架构:编码器与解码器
人工智能·深度学习·神经网络·学习·transformer