昇思学习打卡-18-LLM原理与实践/MindNLP ChatGLM-6B StreamChat

文章目录

模型介绍

ChatGLM-6B模型是一个开源的、支持中英双语的对话语言模型,由清华大学和智谱AI联合研发。

技术特点

  • 模型量化技术:ChatGLM-6B结合了模型量化技术,使得用户可以在消费级的显卡上进行本地部署。在INT4量化级别下,最低只需6GB显存即可运行,大大降低了部署门槛。
  • 优化方向:该模型针对中文问答和对话进行了优化,能够生成相当符合人类偏好的回答。
  • 训练数据:ChatGLM-6B经过了约1T标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术,提升了模型的性能。

运行效果

测试了3句,感觉ChatGLM-6B还是有点钝,有点回复的最大长度限制了他的发挥一样的感觉。

所以又测试了一句长的,感觉回答还挺有意思的

此章节学习到此结束,感谢昇思平台。

相关推荐
通信小呆呆16 天前
当算法有了“五感”:多模态数据融合如何向人体感官协同学习?
人工智能·学习·算法·机器学习·机器人
H__Rick16 天前
自动对焦学习-3
人工智能·学习·计算机视觉
Daisy Lee16 天前
量化学习-第1章-什么是量化金融
学习·金融·datawhale
Alsn8616 天前
等待学习-学习目录:Docker 容器安全攻防
学习·安全·docker
YM52e16 天前
买菜计算器小应用 - HarmonyOS ArkUI 开发实战-PC版本
学习·华为·harmonyos·鸿蒙·鸿蒙系统
小雨下雨的雨16 天前
HarmonyOS ArkUI训练营入门-组件掌握系列-Animation 动画效果实现-PC版本
学习·华为·harmonyos·鸿蒙
cqbzcsq16 天前
CellFlow虚拟细胞论文阅读
论文阅读·人工智能·笔记·学习·生物信息
YangYang9YangYan16 天前
2026初入职场学习数据分析的价值
学习·数据挖掘·数据分析
guslegend16 天前
理论学习:什么是 Coding Agent?
学习
自传.16 天前
尚硅谷 Vibe Coding|第三章(1) Claude Code深度使用与进阶技巧 学习笔记
笔记·学习·尚硅谷·vibecoding