昇思学习打卡-18-LLM原理与实践/MindNLP ChatGLM-6B StreamChat

文章目录

模型介绍

ChatGLM-6B模型是一个开源的、支持中英双语的对话语言模型,由清华大学和智谱AI联合研发。

技术特点

  • 模型量化技术:ChatGLM-6B结合了模型量化技术,使得用户可以在消费级的显卡上进行本地部署。在INT4量化级别下,最低只需6GB显存即可运行,大大降低了部署门槛。
  • 优化方向:该模型针对中文问答和对话进行了优化,能够生成相当符合人类偏好的回答。
  • 训练数据:ChatGLM-6B经过了约1T标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术,提升了模型的性能。

运行效果

测试了3句,感觉ChatGLM-6B还是有点钝,有点回复的最大长度限制了他的发挥一样的感觉。

所以又测试了一句长的,感觉回答还挺有意思的

此章节学习到此结束,感谢昇思平台。

相关推荐
Tutankaaa3 小时前
从被动接受到主动挑战:知识竞赛如何重塑学习价值
人工智能·经验分享·笔记·学习
房开民3 小时前
modbus相关学习
网络·学习
STC_USB_CAN_80515 小时前
菜单学习,科学计算器使用【TFT240*320彩屏+实际键盘】@Ai8051U,ST7789
单片机·学习·51单片机
handler015 小时前
拒绝权限报错!三分钟掌握 Linux 权限管理
linux·c语言·c++·笔记·学习
xiaotao1315 小时前
02-机器学习基础: 无监督学习——scikit-learn实战与模型管理
学习·机器学习·scikit-learn
hipolymers8 小时前
C语言怎么样?难学吗?
c语言·数据结构·学习·算法·编程
richxu202510019 小时前
嵌入式学习之路->stm32篇->(11)SPI通信(下)
stm32·嵌入式硬件·学习
xuhaoyu_cpp_java9 小时前
连接池学习
数据库·经验分享·笔记·学习
GHL28427109010 小时前
Agent相关问题整理学习
学习·ai
qq_4294995710 小时前
恒流源学习
学习