ChatGPT实战与私有化大模型落地

文章目录

大模型现状

baseline底座选择

数据构造

  • 领域数据
  • 书籍数据
  • 网站数据
  • 新闻内容
  • 指令微调数据

混合数据(公用数据+领域数据,比例1:5 )避免知识遗忘,导致通用能力下降。

迁移方法

  • 资源不充足的时候,在chat模型基础上训练
  • 资源充足的时候,在Base模型上训练
    千万级别的数据,在chat模型上不要用全量数据进行训练。

评价

思考


领域大模型训练技巧

Tokenizer

分布式深度学习

数据并行

管道并行

向量并行


分布式框架------Megatron-LM

分布式深度学习框架------Colossal-AI

分布式深度学习框架------DeepSpeed




P-tuning 微调

资源消耗


模型推理加速

模型推理加速方法------FastLLM

模型推理加速方法------VLLm


领域大模型产品形态及落地场景

ChatGPT用户视角思考

ChatGPT企业视角思考

企业级ChatGPT的建设要素

选择优质的应用场景

ChatGPT场景设计-工业制造

ChatGPT场景设计-文案编写

相关推荐
win4r20 小时前
🚀彻底改写浏览器自动化!ChatGPT Atlas浏览器深度评测:Agent模式自动操作网页太疯狂!跨网页理解+长文秒懂+图片识别,论文工作流被改写!看完你会
chatgpt·aigc·openai
一点一木1 天前
ChatGPT Atlas 发布:把 AI 直插进浏览器的一次重构
人工智能·chatgpt·浏览器
产业家4 天前
Sora 后思考:从 AI 工具到 AI 平台,产业 AGI 又近了一步
人工智能·chatgpt·agi
weixin_519535775 天前
从ChatGPT到新质生产力:一份数据驱动的AI研究方向指南
人工智能·深度学习·机器学习·ai·chatgpt·数据分析·aigc
尽兴-6 天前
【10 分钟!M4 Mac mini 离线部署「私有 ChatGPT」完整实录】
macos·ai·chatgpt·大模型·ollama·私有化
七牛云行业应用6 天前
100美元成本复现ChatGPT:nanochat全栈技术栈深度剖析
chatgpt·开源项目·nanochat·karpathy·lm训练
小虚竹and掘金6 天前
GPT-5-Codex 发布!claude编程王位即将不保?国内直接使用
chatgpt
007tg6 天前
OpenAI推出即时支付功能,ChatGPT将整合电商能力|技术解析与行业影响
chatgpt
马拉AI7 天前
Andrej Karpathy 发布新项目 nanochat:一个从零开始构建的极简全栈式 ChatGPT 克隆
chatgpt
神码小Z7 天前
特斯拉前AI总监开源的一款“小型本地版ChatGPT”,普通家用电脑就能运行!
人工智能·chatgpt