【笔记】从零开始大模型开发与微调:基于PyTorch与ChatGLM

从零开始大模型开发与微调:基于PyTorch与ChatGLM

2023.11.1版

介绍DL应用、大模型,ChatGLM

由清华大学自主研发,基于 General Language Model (GLM) 架构的一种最新型、最为强大的深度学习大模型。

1、经过约 1T 标识符的中英双语训练,辅以监督微调、对比学习、人类反馈强化学习等技术的加持

2、针对中文问答和对话进行了优化

3、开源的ChatGLM-6B 具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)

相关推荐
焦点问界11 分钟前
Newline全场景方案闪耀2025中国智慧生活大会
大数据·人工智能
fen_fen13 分钟前
学习笔记(39):结合生活案例,介绍 10 种常见模型
笔记·学习·生活
愚昧之山绝望之谷开悟之坡16 分钟前
相机长焦个短焦
笔记
偶尔贪玩的骑士18 分钟前
Machine Learning HW2 report:语音辨识(Hongyi Lee)
人工智能·深度学习·机器学习
玲娜贝儿--努力学习买大鸡腿版25 分钟前
推荐系统---AUC计算
人工智能·python·机器学习
金融RPA机器人丨实在智能32 分钟前
从爬虫到AI:亚马逊数据采集工具的进化与应用
大数据·人工智能·数据采集·亚马逊
云畅新视界35 分钟前
从算力到智能资产:Sol long引领A I A g ent赋能设备的价值重构
大数据·人工智能
产业家42 分钟前
飞书,正在成为中国AI制造故事的新阵地
人工智能·飞书·制造
Codebee1 小时前
OneCode3.0 DSM 技术原理与创新点
人工智能·开源
sunbyte1 小时前
50天50个小项目 (Vue3 + Tailwindcss V4) ✨ | NotesApp(便签笔记组件)
前端·javascript·css·vue.js·笔记·tailwindcss