机器学习|精选生产级LLM开源项目

为了方便LLM相关的学习,整理了ChatGPT相关开源库列表,包括数据预处理、训练/微调、评估/基准测试、服务/推理、应用/RAG、测试/监控、安全等。

LLM 数据处理

LLM 训练 / 微调

LLM 评估 / 基准测试

LLM 服务 / 推理

LLM 应用 / RAG

LLM 测试 / 监控

  • promptflow [github.com/microsoft/p...] 构建高质量的LLM应用------从原型、测试到生产部署和监控。
  • langfuse [github.com/langfuse/la...] 开源LLM工程平台:可观察性、指标、评估、提示管理、操场、数据集,与LlamaIndex、Langchain、OpenAI SDK、LiteLLM等集成。
  • evidently [github.com/evidentlyai...] Evidently是一个开源的ML和LLM可观察性框架,评估、测试和监控任何AI驱动的系统或数据管道。从表格数据到生成AI,100+指标。
  • giskard [github.com/Giskard-AI/...] 开源的LLM和ML模型评估与测试。
  • promptfoo [github.com/promptfoo/p...] 测试你的提示、代理和RAG。对LLM进行红队测试、渗透测试和漏洞扫描,提高应用质量并发现问题。比较GPT、Claude、Gemini、Llama等的性能,简单的声明性配置,支持命令行和CI/CD集成。
  • phoenix [github.com/Arize-ai/ph...] AI可观察性与评估。
  • agenta [github.com/Agenta-AI/a...] 一体化LLM开发平台:提示管理、评估、人类反馈和部署一站式解决。

LLM 安全

参考

(1)github.com/EthicalML/a...

(2)github.com/jihoo-kim/a...

相关推荐
机器之心17 分钟前
刚刚,苹果基础模型团队负责人庞若鸣被Meta挖走!加入超级智能团队、年薪千万美元
人工智能
G.E.N.1 小时前
开源!RAG竞技场(2):标准RAG算法
大数据·人工智能·深度学习·神经网络·算法·llm·rag
西西弗Sisyphus1 小时前
如果让计算机理解人类语言- Word2Vec(Word to Vector,2013)
人工智能·word·word2vec
前端双越老师1 小时前
30 行代码 langChain.js 开发你的第一个 Agent
人工智能·node.js·agent
东坡肘子2 小时前
高温与奇怪的天象 | 肘子的 Swift 周报 #092
人工智能·swiftui·swift
KaneLogger2 小时前
视频转文字,别再反复拖进度条了
前端·javascript·人工智能
度假的小鱼2 小时前
从 “人工编码“ 到 “AI 协同“:大模型如何重塑软件开发的效率与范式
人工智能
zm-v-159304339863 小时前
ArcGIS 水文分析升级:基于深度学习的流域洪水演进过程模拟
人工智能·深度学习·arcgis
拓端研究室4 小时前
视频讲解|核密度估计朴素贝叶斯:业务数据分类—从理论到实践
人工智能·分类·数据挖掘