Langchain-Chatchat项目:1.1-ChatGLM2项目整体介绍

  ChatGLM2-6B是开源中英双语对话模型ChatGLM-6B的第2代版本,引入新的特性包括更长的上下文(基于FlashAttention技术,将基座模型的上下文长度由ChatGLM-6B的2K扩展到了32K,并在对话阶段使用8K的上下文长度训练);更高效的推理(基于Multi-QueryAttention技术,ChatGLM2-6B有更高效的推理速度和更低的显存占用)。

1.环境安装

  下载仓库并安装依赖,如下所示:

复制代码
git clone https://github.com/THUDM/ChatGLM2-6B
cd ChatGLM2-6B
pip install -r requirements.txt

2.代码调用

  通过如下代码调用 ChatGLM2-6B 模型来生成对话:

复制代码
>>> from transformers import AutoTokenizer, AutoModel
>>> tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm2-6b", trust_remote_code=True)
>>> model = AutoModel.from_pretrained("THUDM/chatglm2-6b", trust_remote_code=True, device='cuda')
>>> model = model.eval()
>>> response, history = model.chat(tokenizer, "你好", history=[])
>>> print(response)
你好👋!我是人工智能助手 ChatGLM2-6B,很高兴见到你,欢迎问我任何问题。
>>> response, history = model.chat(tokenizer, "晚上睡不着应该怎么办", history=history)
>>> print(response)
晚上睡不着可能会让你感到焦虑或不舒服,但以下是一些可以帮助你入睡的方法:

1. 制定规律的睡眠时间表:保持规律的睡眠时间表可以帮助你建立健康的睡眠习惯,使你更容易入睡。尽量在每天的相同时间上床,并在同一时间起床。
2. 创造一个舒适的睡眠环境:确保睡眠环境舒适,安静,黑暗且温度适宜。可以使用舒适的床上用品,并保持房间通风。
3. 放松身心:在睡前做些放松的活动,例如泡个热水澡,听些轻柔的音乐,阅读一些有趣的书籍等,有助于缓解紧张和焦虑,使你更容易入睡。
4. 避免饮用含有咖啡因的饮料:咖啡因是一种刺激性物质,会影响你的睡眠质量。尽量避免在睡前饮用含有咖啡因的饮料,例如咖啡,茶和可乐。
5. 避免在床上做与睡眠无关的事情:在床上做些与睡眠无关的事情,例如看电影,玩游戏或工作等,可能会干扰你的睡眠。
6. 尝试呼吸技巧:深呼吸是一种放松技巧,可以帮助你缓解紧张和焦虑,使你更容易入睡。试着慢慢吸气,保持几秒钟,然后缓慢呼气。

如果这些方法无法帮助你入睡,你可以考虑咨询医生或睡眠专家,寻求进一步的建议。

3.从本地加载模型

  从Hugging Face Hub下载模型需要先安装Git LFS,然后执行命令:

复制代码
git clone https://huggingface.co/THUDM/chatglm2-6b

  将模型下载到本地之后,将以上代码中的THUDM/chatglm2-6b替换为你本地的chatglm2-6b文件夹的路径,即可从本地加载模型。

4.网页版Demo

  通过命令python web_demo.py启动基于Gradio的网页版demo:

  通过命令streamlit run web_demo2.py启动基于Streamlit的网页版demo。网页版demo会运行一个Web Server,并输出地址。在浏览器中打开输出的地址即可使用。经测试,基于Streamlit的网页版Demo会更流畅。

5.命令行Demo

  运行命令python cli_demo.py,程序会在命令行中进行交互式的对话,在命令行中输入指示并回车即可生成回复,输入clear可以清空对话历史,输入stop终止程序。

6.API部署

  首先需要安装额外的依赖pip install fastapi uvicorn,然后运行仓库中的api.py

复制代码
python api.py

  默认部署在本地的8000端口,通过POST方法进行调用:

复制代码
curl -X POST "http://127.0.0.1:8000" \
     -H 'Content-Type: application/json' \
     -d '{"prompt": "你好", "history": []}'

  得到的返回值为:

复制代码
{
  "response":"你好👋!我是人工智能助手 ChatGLM2-6B,很高兴见到你,欢迎问我任何问题。",
  "history":[["你好","你好👋!我是人工智能助手 ChatGLM2-6B,很高兴见到你,欢迎问我任何问题。"]],
  "status":200,
  "time":"2023-03-23 21:38:40"
}

参考文献:

1ChatGLM2-6B:https://github.com/THUDM/ChatGLM2-6B

2ChatGLM2-6B-32K模型:https://huggingface.co/THUDM/chatglm2-6b-32k

3https://huggingface.co/THUDM/chatglm2-6b

相关推荐
颜酱10 小时前
LangChain使用RAG 入门:让大模型读懂你的私有文档
python·langchain
湘美书院--湘美谈教育12 小时前
湘美谈教育AI系列经验集锦:赋能整理聊斋志异大寓言
大数据·人工智能·深度学习·神经网络·机器学习
质造者13 小时前
LangChain + Ollama + Tavily 实现旅游问答系统
linux·人工智能·python·langchain·rag
Solis程序员13 小时前
LangChain从入门到精通(1)
langchain
大模型最新论文速读13 小时前
小红书提出 RedKnot:分头处理 kv 缓存,延时降低 60%效果还提升
论文阅读·人工智能·深度学习·机器学习·缓存·自然语言处理
leeyi13 小时前
Workflow 编排:字段映射、数据流分离
langchain·workflow·graphql
倾颜14 小时前
从手写 Runner 到 LangGraph:受控 Agent 接入 LangGraph
前端·后端·langchain
wuhen_n14 小时前
从零到一!前端搭建本地轻量化 RAG 问答系统
前端·langchain·ai编程
早起CaiCai14 小时前
【Pytorch 实践1】手写数字
人工智能·pytorch·python
星浩AI14 小时前
(七)GPT2中文生成模型定制化微调训练[附源码]
pytorch·深度学习·llm