昇思学习打卡-18-LLM原理与实践/MindNLP ChatGLM-6B StreamChat

文章目录

模型介绍

ChatGLM-6B模型是一个开源的、支持中英双语的对话语言模型,由清华大学和智谱AI联合研发。

技术特点

  • 模型量化技术:ChatGLM-6B结合了模型量化技术,使得用户可以在消费级的显卡上进行本地部署。在INT4量化级别下,最低只需6GB显存即可运行,大大降低了部署门槛。
  • 优化方向:该模型针对中文问答和对话进行了优化,能够生成相当符合人类偏好的回答。
  • 训练数据:ChatGLM-6B经过了约1T标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术,提升了模型的性能。

运行效果

测试了3句,感觉ChatGLM-6B还是有点钝,有点回复的最大长度限制了他的发挥一样的感觉。

所以又测试了一句长的,感觉回答还挺有意思的

此章节学习到此结束,感谢昇思平台。

相关推荐
盐焗西兰花6 小时前
鸿蒙学习实战之路-Reader Kit修改翻页方式字体大小及行间距最佳实践
学习·华为·harmonyos
QiZhang | UESTC6 小时前
学习日记day76
学习
久邦科技6 小时前
20个免费电子书下载网站,实现电子书自由(2025持续更新)
学习
Gain_chance6 小时前
34-学习笔记尚硅谷数仓搭建-DWS层最近一日汇总表建表语句汇总
数据仓库·hive·笔记·学习·datagrip
Gain_chance7 小时前
36-学习笔记尚硅谷数仓搭建-DWS层数据装载脚本
大数据·数据仓库·笔记·学习
XH华8 小时前
备战蓝桥杯,第九章:结构体和类
学习·蓝桥杯
Gain_chance8 小时前
35-学习笔记尚硅谷数仓搭建-DWS层最近n日汇总表及历史至今汇总表建表语句
数据库·数据仓库·hive·笔记·学习
Ziky学习记录10 小时前
从零到实战:React Router 学习与总结
前端·学习·react.js
sensen_kiss10 小时前
INT303 Coursework1 爬取影视网站数据(如何爬虫网站数据)
爬虫·python·学习
red_redemption11 小时前
自由学习记录(116)
学习