【笔记】从零开始大模型开发与微调:基于PyTorch与ChatGLM

从零开始大模型开发与微调:基于PyTorch与ChatGLM

2023.11.1版

介绍DL应用、大模型,ChatGLM

由清华大学自主研发,基于 General Language Model (GLM) 架构的一种最新型、最为强大的深度学习大模型。

1、经过约 1T 标识符的中英双语训练,辅以监督微调、对比学习、人类反馈强化学习等技术的加持

2、针对中文问答和对话进行了优化

3、开源的ChatGLM-6B 具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)

相关推荐
TY-202517 分钟前
【CV 目标检测】Fast RCNN模型①——与R-CNN区别
人工智能·目标检测·目标跟踪·cnn
CareyWYR1 小时前
苹果芯片Mac使用Docker部署MinerU api服务
人工智能
失散131 小时前
自然语言处理——02 文本预处理(下)
人工智能·自然语言处理
mit6.8242 小时前
[1Prompt1Story] 滑动窗口机制 | 图像生成管线 | VAE变分自编码器 | UNet去噪神经网络
人工智能·python
sinat_286945192 小时前
AI应用安全 - Prompt注入攻击
人工智能·安全·prompt
星星火柴9363 小时前
关于“双指针法“的总结
数据结构·c++·笔记·学习·算法
迈火3 小时前
ComfyUI-3D-Pack:3D创作的AI神器
人工智能·gpt·3d·ai·stable diffusion·aigc·midjourney
Moshow郑锴4 小时前
机器学习的特征工程(特征构造、特征选择、特征转换和特征提取)详解
人工智能·机器学习
CareyWYR5 小时前
每周AI论文速递(250811-250815)
人工智能
AI精钢5 小时前
H20芯片与中国的科技自立:一场隐形的博弈
人工智能·科技·stm32·单片机·物联网