昇思学习打卡-18-LLM原理与实践/MindNLP ChatGLM-6B StreamChat

文章目录

模型介绍

ChatGLM-6B模型是一个开源的、支持中英双语的对话语言模型,由清华大学和智谱AI联合研发。

技术特点

  • 模型量化技术:ChatGLM-6B结合了模型量化技术,使得用户可以在消费级的显卡上进行本地部署。在INT4量化级别下,最低只需6GB显存即可运行,大大降低了部署门槛。
  • 优化方向:该模型针对中文问答和对话进行了优化,能够生成相当符合人类偏好的回答。
  • 训练数据:ChatGLM-6B经过了约1T标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术,提升了模型的性能。

运行效果

测试了3句,感觉ChatGLM-6B还是有点钝,有点回复的最大长度限制了他的发挥一样的感觉。

所以又测试了一句长的,感觉回答还挺有意思的

此章节学习到此结束,感谢昇思平台。

相关推荐
maxruan4 分钟前
PyTorch学习
人工智能·pytorch·python·学习
MYX_30915 分钟前
第三章 线型神经网络
深度学习·神经网络·学习·算法
_李小白18 分钟前
【Android Gradle学习笔记】第八天:NDK的使用
android·笔记·学习
Jose_lz2 小时前
C#开发学习杂笔(更新中)
开发语言·学习·c#
QT 小鲜肉2 小时前
【个人成长笔记】Qt 中 SkipEmptyParts 编译错误解决方案及版本兼容性指南
数据库·c++·笔记·qt·学习·学习方法
A9better2 小时前
嵌入式开发学习日志41——stm32之SPI总线基本结构
stm32·单片机·嵌入式硬件·学习
Lynnxiaowen3 小时前
今天我们学习python编程常用模块与面向对象
运维·python·学习·云计算
Han.miracle5 小时前
数据结构——排序的学习(一)
java·数据结构·学习·算法·排序算法
电子云与长程纠缠5 小时前
Blender入门学习01
学习·blender
qiuiuiu4136 小时前
正点原子RK3568学习日志12-注册字符设备
linux·开发语言·单片机·学习·ubuntu