glm-4v-9b 部署

glm-4v-9b 模型文件地址

GLM-4 仓库文件地址

官方测试 硬件配置和系统要求

官方测试硬件信息:

  • OS: Ubuntu 22.04
  • Memory: 512GB
  • Python: 3.12.3
  • CUDA Version: 12.3
  • GPU Driver: 535.104.05
  • GPU: NVIDIA A100-SXM4-80GB * 8

最低硬件要求

如果希望运行官方提供的最基础代码 (transformers 后端) 需要:

  • Python >= 3.10
  • 内存不少于 32 GB

如果希望运行官方提供的本文件夹的所有代码,还需要:

  • Linux 操作系统 (Debian 系列最佳)
  • 大于 8GB 显存的,支持 CUDA 或者 ROCM 并且支持 BF16 推理的 GPU 设备。(FP16 精度无法训练,推理有小概率出现问题)
一、Codestral-22B-v0.1环境安装

1、硬件配置

用两张4090D

2、配置环境

建议最好自己新建一个conda环境

复制代码
conda create -n glm4v python=3.10 -y

conda activate glm4v

unzip GLM-4-main.zip

3、安装依赖

复制代码
pip install -r requirements.txt -i https://pypi.mirrors.ustc.edu.cn/simple 

pip install gradio==3.40.0 -i https://pypi.mirrors.ustc.edu.cn/simple

/root/autodl-tmp/glm-4v-9b

基础功能调用

除非特殊说明,本文件夹所有 demo 并不支持 Function Call 和 All Tools 等进阶用法

使用 transformers 后端代码

  • 使用命令行与 GLM-4-9B 模型进行对话。

    python trans_cli_demo.py # GLM-4-9B-Chat

    python trans_cli_vision_demo.py # GLM-4V-9B

  • 使用 Gradio 网页端与 GLM-4-9B-Chat 模型进行对话。

    python trans_web_demo.py

  • 使用 Batch 推理。

    python cli_batch_request_demo.py

使用 vLLM 后端代码

  • 使用命令行与 GLM-4-9B-Chat 模型进行对话。

    python vllm_cli_demo.py

  • 自行构建服务端,并使用 OpenAI API 的请求格式与 GLM-4-9B-Chat 模型进行对话。本 demo 支持 Function Call 和 All Tools功能。

启动服务端:

复制代码
python openai_api_server.py

客户端请求:

复制代码
python openai_api_request.py
相关推荐
namelessmyth1 小时前
聚合AI大模型API平台-横向评测对比
人工智能·语言模型·chatgpt·ai编程
黑巧克力可减脂2 小时前
工欲善其事:从先秦工匠到AI辅助编程的智慧传承
人工智能·语言模型·ai编程
陈天伟教授2 小时前
人工智能应用- 人机对战:03.玩转 ATARI 游戏
人工智能·神经网络·游戏·语言模型·自然语言处理·机器翻译
MaoziShan3 小时前
CMU Subword Modeling | 01 Things Smaller than Words
人工智能·机器学习·自然语言处理
shenxianasi4 小时前
【论文精读】Flamingo: a Visual Language Model for Few-Shot Learning
人工智能·深度学习·机器学习·计算机视觉·语言模型·自然语言处理
学生高德5 小时前
Perplexity AI 团队以 扩散预训练语言模型
人工智能·语言模型·自然语言处理
阿杰学AI5 小时前
AI核心知识101——大语言模型之 Cherry Studio(简洁且通俗易懂版)
人工智能·ai·语言模型·自然语言处理·aigc·cherry studio·ai 桌面客户端
羊羊小栈5 小时前
基于YOLO26和多模态大语言模型的路面缺陷智能监控预警系统
人工智能·语言模型·自然语言处理·毕业设计·创业创新·大作业
阿杰学AI5 小时前
AI核心知识102——大语言模型之 AIHubMix(简洁且通俗易懂版)
人工智能·ai·语言模型·自然语言处理·aigc·aihubmix·推理时代
文艺小码农5 小时前
Hugging Face微调语言模型:问答任务
人工智能·语言模型·自然语言处理