昇思学习打卡-18-LLM原理与实践/MindNLP ChatGLM-6B StreamChat

文章目录

模型介绍

ChatGLM-6B模型是一个开源的、支持中英双语的对话语言模型,由清华大学和智谱AI联合研发。

技术特点

  • 模型量化技术:ChatGLM-6B结合了模型量化技术,使得用户可以在消费级的显卡上进行本地部署。在INT4量化级别下,最低只需6GB显存即可运行,大大降低了部署门槛。
  • 优化方向:该模型针对中文问答和对话进行了优化,能够生成相当符合人类偏好的回答。
  • 训练数据:ChatGLM-6B经过了约1T标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术,提升了模型的性能。

运行效果

测试了3句,感觉ChatGLM-6B还是有点钝,有点回复的最大长度限制了他的发挥一样的感觉。

所以又测试了一句长的,感觉回答还挺有意思的

此章节学习到此结束,感谢昇思平台。

相关推荐
知识分享小能手7 小时前
R语言入门学习教程,从入门到精通,R语言日期和时间序列(6)
开发语言·学习·r语言
噜噜噜阿鲁~8 小时前
python学习笔记 | 9.2、模块-安装第三方模块
笔记·python·学习
南境十里·墨染春水9 小时前
linux学习进展 守护进程
linux·服务器·学习
Ares-Wang9 小时前
AI》》 监督学习,无监督学习,半监督学习、强化学习 、深度学习 统计学的常用方法
人工智能·深度学习·学习
Bechamz9 小时前
大数据开发学习Day31
大数据·学习·ajax
-SOLO-10 小时前
Python 爬取小红书 文章标题和内容 仅供学习
android·python·学习
科技林总10 小时前
【系统分析师】14.6 测试策略与过程
学习
森屿~~11 小时前
CMA-ES:从搜索分布自适应到协方差矩阵学习
学习·elasticsearch·矩阵
程序员卷卷狗12 小时前
Claude Code工作原理学习笔记:从Agent Loop到工具调用
chrome·笔记·学习
li星野12 小时前
滑动窗口五题通关:从最小覆盖子串到水果成篮(Python + C++)
c++·python·学习