ChatGPT实战与私有化大模型落地

文章目录

大模型现状

baseline底座选择

数据构造

  • 领域数据
  • 书籍数据
  • 网站数据
  • 新闻内容
  • 指令微调数据

混合数据(公用数据+领域数据,比例1:5 )避免知识遗忘,导致通用能力下降。

迁移方法

  • 资源不充足的时候,在chat模型基础上训练
  • 资源充足的时候,在Base模型上训练
    千万级别的数据,在chat模型上不要用全量数据进行训练。

评价

思考


领域大模型训练技巧

Tokenizer

分布式深度学习

数据并行

管道并行

向量并行


分布式框架------Megatron-LM

分布式深度学习框架------Colossal-AI

分布式深度学习框架------DeepSpeed




P-tuning 微调

资源消耗


模型推理加速

模型推理加速方法------FastLLM

模型推理加速方法------VLLm


领域大模型产品形态及落地场景

ChatGPT用户视角思考

ChatGPT企业视角思考

企业级ChatGPT的建设要素

选择优质的应用场景

ChatGPT场景设计-工业制造

ChatGPT场景设计-文案编写

相关推荐
带刺的坐椅11 小时前
Solon AI 开发学习13 - chat - Tool的输入输出架构及生成类
ai·chatgpt·llm·solon·mcp
一直在学习的小白~11 小时前
React大模型网站-流式推送markdown转换问题以及开启 rehype-raw,rehype-sanitize,remark-gfm等插件的使用
react.js·chatgpt·文心一言
我太想进步了C~~21 小时前
chatGPT的conversation management模块的加强
chatgpt
我要改名叫嘟嘟1 天前
各个模型rate limit汇总
chatgpt
景联文科技1 天前
景联文AI观察动态速递 第3期
人工智能·chatgpt
L_cl1 天前
【NLP 79、强化学习串讲】
人工智能·chatgpt
LinkTime_Cloud1 天前
OpenAI 拉响红色警报,以突击式提升 ChatGPT
人工智能·chatgpt
中國龍在廣州1 天前
李飞飞最新思考:语言模型救不了机器人
人工智能·深度学习·算法·语言模型·自然语言处理·chatgpt·机器人
Elastic 中国社区官方博客2 天前
用 Elasticsearch 构建一个 ChatGPT connector 来查询 GitHub issues
大数据·人工智能·elasticsearch·搜索引擎·chatgpt·github·全文检索
组合缺一2 天前
Solon AI 开发学习11 - chat - 工具调用与定制(Tool Call)
人工智能·学习·ai·chatgpt·llm·solon·toolcall