ChatGPT实战与私有化大模型落地

文章目录

大模型现状

baseline底座选择

数据构造

  • 领域数据
  • 书籍数据
  • 网站数据
  • 新闻内容
  • 指令微调数据

混合数据(公用数据+领域数据,比例1:5 )避免知识遗忘,导致通用能力下降。

迁移方法

  • 资源不充足的时候,在chat模型基础上训练
  • 资源充足的时候,在Base模型上训练
    千万级别的数据,在chat模型上不要用全量数据进行训练。

评价

思考


领域大模型训练技巧

Tokenizer

分布式深度学习

数据并行

管道并行

向量并行


分布式框架------Megatron-LM

分布式深度学习框架------Colossal-AI

分布式深度学习框架------DeepSpeed




P-tuning 微调

资源消耗


模型推理加速

模型推理加速方法------FastLLM

模型推理加速方法------VLLm


领域大模型产品形态及落地场景

ChatGPT用户视角思考

ChatGPT企业视角思考

企业级ChatGPT的建设要素

选择优质的应用场景

ChatGPT场景设计-工业制造

ChatGPT场景设计-文案编写

相关推荐
云天AI实战派6 小时前
2026 跨境出海全流程实战:独立开发者如何用开源工具搭建落地页、订阅支付、客服工单与多语言 SEO 闭环
人工智能·安全·chatgpt·个人开发·独立开发·跨境出海
凯丨7 小时前
从零构建一个 MCP Server:让 Claude 和 ChatGPT 接入你自己的工具
chatgpt
ComPDFKit7 小时前
使用AI Agent自动化生成订单/发票/合同:从自然语言到PDF的一站式方案
人工智能·chatgpt·智能合约
DS随心转APP7 小时前
2026年AI对话导出Word完全指南|ChatGPT/DeepSeek/豆包/Claude一键转换–AI导出鸭
人工智能·ai·chatgpt·豆包·deepseek·ai导出鸭
Nayxxu9 小时前
ChatGPT API 中转站技术选型与接入实测:从词元无忧 API(token5u API)开始更省事
人工智能·chatgpt
武子康9 小时前
调查研究-148 Deepseek-V4-Flash 生成式AI十大高频业务场景落地指南
大数据·人工智能·深度学习·ai·chatgpt·deepseek
企服AI产品测评局19 小时前
Agent适配信创环境实测:企业级自动化如何实现国产操作系统与数据库全兼容?
运维·数据库·人工智能·ai·chatgpt·自动化
rannn_1111 天前
OpenAI Function Calling 全解析:从函数定义到流式调用
人工智能·chatgpt·openai·ai agent
战族狼魂1 天前
Claude 大模型在真实业务场景中的落地应用指南
人工智能·chatgpt·大模型
武子康1 天前
Ollama 2026最新实践:从本地大模型到本地+云端+Agent工具链
人工智能·ai·chatgpt·ollama·deepseek