ChatGPT实战与私有化大模型落地

文章目录

大模型现状

baseline底座选择

数据构造

  • 领域数据
  • 书籍数据
  • 网站数据
  • 新闻内容
  • 指令微调数据

混合数据(公用数据+领域数据,比例1:5 )避免知识遗忘,导致通用能力下降。

迁移方法

  • 资源不充足的时候,在chat模型基础上训练
  • 资源充足的时候,在Base模型上训练
    千万级别的数据,在chat模型上不要用全量数据进行训练。

评价

思考


领域大模型训练技巧

Tokenizer

分布式深度学习

数据并行

管道并行

向量并行


分布式框架------Megatron-LM

分布式深度学习框架------Colossal-AI

分布式深度学习框架------DeepSpeed




P-tuning 微调

资源消耗


模型推理加速

模型推理加速方法------FastLLM

模型推理加速方法------VLLm


领域大模型产品形态及落地场景

ChatGPT用户视角思考

ChatGPT企业视角思考

企业级ChatGPT的建设要素

选择优质的应用场景

ChatGPT场景设计-工业制造

ChatGPT场景设计-文案编写

相关推荐
哪吒编程9 小时前
重磅更新!满血GPT-5.1上线,全方位提升,很强
chatgpt·openai
FreeBuf_12 小时前
攻击者利用自定义GPT的SSRF漏洞窃取ChatGPT机密数据
gpt·chatgpt
yaocheng的ai分身13 小时前
【转载】 OpenAI 推出 GPT-5.1:面向开发者的智能模型
gpt·chatgpt
win4r1 天前
🚀深度实测!GPT-5.1 vs Claude Sonnet 4.5!谁是赢家?从万字长文到古诗词创作,从3D游戏编程到浏览器自动化,结果竟然出人意料!Cla
chatgpt·aigc·openai
算家计算1 天前
GPT-5.1深夜发布却无惊喜?从GPT-5.1看大模型发展瓶颈
人工智能·chatgpt·openai
知了一笑2 天前
AI时代,不被淘汰的开发者,都有这三种能力
chatgpt·ai编程·claude·cursor
FreeBuf_3 天前
研究人员诱导ChatGPT对自身实施提示注入攻击
chatgpt
KKKlucifer3 天前
技术漏洞被钻营!Agent 感知伪装借 ChatGPT Atlas 批量输出虚假数据,AI 安全防线面临新挑战
人工智能·安全·chatgpt
oil欧哟3 天前
AI 的环保账,训练一个模型要用多少电?
人工智能·chatgpt
明天好,会的3 天前
智能时代的缘起:从ChatGPT到修行之路
chatgpt