ChatGPT实战与私有化大模型落地

文章目录

大模型现状

baseline底座选择

数据构造

  • 领域数据
  • 书籍数据
  • 网站数据
  • 新闻内容
  • 指令微调数据

混合数据(公用数据+领域数据,比例1:5 )避免知识遗忘,导致通用能力下降。

迁移方法

  • 资源不充足的时候,在chat模型基础上训练
  • 资源充足的时候,在Base模型上训练
    千万级别的数据,在chat模型上不要用全量数据进行训练。

评价

思考


领域大模型训练技巧

Tokenizer

分布式深度学习

数据并行

管道并行

向量并行


分布式框架------Megatron-LM

分布式深度学习框架------Colossal-AI

分布式深度学习框架------DeepSpeed




P-tuning 微调

资源消耗


模型推理加速

模型推理加速方法------FastLLM

模型推理加速方法------VLLm


领域大模型产品形态及落地场景

ChatGPT用户视角思考

ChatGPT企业视角思考

企业级ChatGPT的建设要素

选择优质的应用场景

ChatGPT场景设计-工业制造

ChatGPT场景设计-文案编写

相关推荐
新缸中之脑1 天前
ChatGPT 容器
chatgpt
DS随心转APP2 天前
ChatGPT和Gemini回答怎么导出
人工智能·ai·chatgpt·deepseek·ds随心转
DS随心转插件2 天前
ChatGPT和Gemini排版指令
人工智能·ai·chatgpt·deepseek·ds随心转
hunteritself2 天前
反击 OpenAI!谷歌史诗级更新:Gemini in Chrome 正式上线,免费用
人工智能·深度学习·microsoft·机器学习·chatgpt
SEO_juper2 天前
实现ChatGPT的被动推荐:让你的品牌被主动提及的核心优化路径
人工智能·ai·chatgpt·seo·数字营销
DS随心转插件3 天前
元宝 千问 文心 Kimi排版指令
人工智能·ai·chatgpt·豆包·deepseek·ds随心转
陆研一3 天前
Clawdbot:Mac mini 卖爆背后的 AI 代理革命
人工智能·ai·chatgpt
LaughingZhu4 天前
Product Hunt 每日热榜 | 2026-01-28
数据库·经验分享·神经网络·搜索引擎·chatgpt
FreeBuf_5 天前
ChatGPT引用马斯克AI生成的Grokipedia是否陷入“内容陷阱“?
人工智能·chatgpt
DS随心转APP5 天前
怎么导出deepseek聊天记录
人工智能·ai·chatgpt·deepseek·ds随心转