ChatGPT实战与私有化大模型落地

文章目录

大模型现状

baseline底座选择

数据构造

  • 领域数据
  • 书籍数据
  • 网站数据
  • 新闻内容
  • 指令微调数据

混合数据(公用数据+领域数据,比例1:5 )避免知识遗忘,导致通用能力下降。

迁移方法

  • 资源不充足的时候,在chat模型基础上训练
  • 资源充足的时候,在Base模型上训练
    千万级别的数据,在chat模型上不要用全量数据进行训练。

评价

思考


领域大模型训练技巧

Tokenizer

分布式深度学习

数据并行

管道并行

向量并行


分布式框架------Megatron-LM

分布式深度学习框架------Colossal-AI

分布式深度学习框架------DeepSpeed




P-tuning 微调

资源消耗


模型推理加速

模型推理加速方法------FastLLM

模型推理加速方法------VLLm


领域大模型产品形态及落地场景

ChatGPT用户视角思考

ChatGPT企业视角思考

企业级ChatGPT的建设要素

选择优质的应用场景

ChatGPT场景设计-工业制造

ChatGPT场景设计-文案编写

相关推荐
正在走向自律9 小时前
第二章-AIGC入门-AIGC工具全解析:技术控的效率神器,DeepSeek国产大模型的骄傲(8/36)
人工智能·chatgpt·aigc·可灵·deepseek·即梦·阿里通义千问
sinat_2869451916 小时前
harness engineering
人工智能·算法·chatgpt
极昆仑智慧1 天前
NL2X技术正从模型驱动到系统工程驱动的范式转变
人工智能·自然语言处理·chatgpt
半页码书1 天前
2026年哪个AI改简历最好用
人工智能·chatgpt·面试·求职招聘·职场发展·远程工作
Lei活在当下2 天前
【Part 1】Harness Engineering 对程序员来说意味着什么?
chatgpt·openai·ai编程
Agent产品评测局2 天前
企业发票管理自动化落地,验真归档全流程实现方法:2026企业级智能体选型与实测指南
运维·网络·人工智能·ai·chatgpt·自动化
花千树-0102 天前
Java AI + TTS:让大模型开口说话
java·人工智能·ai·chatgpt·langchain·aigc·ai编程
健康人猿2 天前
Business 降价导致 Codex 额度减少?GPT 各类套餐在 Codex 的使用限制是多少?
人工智能·gpt·chatgpt
花千树-0102 天前
IndexTTS2 入门指南:从模型概念到 macOS 安装实战
人工智能·ai·chatgpt·aigc
淡忘旧梦2 天前
ChatGPT回答白屏
人工智能·chatgpt·代理模式