mac M系列芯片安装chatGLM3-6b模型

1 环境安装

1.1 mac安装conda.

下载miniconda,并安装

复制代码
curl -O https://repo.anaconda.com/miniconda/Miniconda3-latest-MacOSX-arm64.sh
sh Miniconda3-latest-MacOSX-arm64.sh

1.2 创建虚拟环境并激活

创建名为chatglm3的虚拟环境,python版本为3.10.2

激活环境(后续要在这个环境安装pytorch及依赖包)

复制代码
conda create -n chatglm3 python==3.10.2
conda activate chatglm3

1.3 安装pytorch-nightly

复制代码
conda install pytorch torchvision torchaudio -c pytorch-nightly

1.4 下载chatglm3 代码

1 下载地址,git地址:https://github.com/THUDM/ChatGLM3

2 进入代码中,安装依赖包

复制代码
git clone https://github.com/THUDM/ChatGLM3
cd ChatGLM3-main
pip install -r requirement.txt

2 模型下载

推荐使用方式3下载,可以下载任意开源大模型,且速度飞快,没有墙限制

方式1: 直接在huggingface官网下载(国内比较难)

https://huggingface.co/dwdcth/chatglm3-6b-int4

方式2 使用国内镜像

https://hf-mirror.com/dwdcth/chatglm3-6b-int4

方式3

  • 使用modelscope下载

    https://modelscope.cn/models/ZhipuAI/chatglm3-6b/summary

  • 安装魔塔依赖

    pip install modelscope -U

  • 代码中的路径即为要下载的模型,可以自行选择模型下载(mac 16G推荐下载int4)

    model_dir = snapshot_download('ZhipuAI/chatglm3-6b', revision='v1.0.1')

  • 模型默认保存路径为家目录下, ~/.cache/modelscope/hub/ZhipuAI/ChatGLM3-6B/

    1 安装依赖
    pip install modelscope -U

    2 使用代码下载
    from modelscope import snapshot_download
    model_dir = snapshot_download("ZhipuAI/chatglm3-6b", revision = "v1.0.0")

3 模型使用

1 修改web_demo2.py中的device为"mps"

DEVICE = 'mps'

如果测试cli_demo.py文件,修改如下代码,模型需要时float()类型的,不然会报错。(不过好像还没有用到mps,待测试)

DEVICE = 'mps'

model = AutoModel.from_pretrained(TOKENIZER_PATH, trust_remote_code=True).float()

复制代码
# web_demo2.py 运行
streamlit run basic_demo/web_demo2.py 

4 模型web展示

streamlit run basic_demo/web_demo2.py

相关推荐
GPUStack6 小时前
45分钟从零搭建私有MaaS平台和生产级的Qwen3模型服务
ai·大模型·qwen·genai·gpu集群
一点.点8 小时前
VLM-E2E:通过多模态驾驶员注意融合增强端到端自动驾驶——论文阅读
论文阅读·大模型·自动驾驶·端到端
小研学术14 小时前
如何开展有组织的AI素养教育?
大数据·人工智能·ai·大模型·deepseek·ai素养
PLUS_WAVE1 天前
CogCoM: A Visual Language Model with Chain-of-Manipulations Reasoning 学习笔记
学习·语言模型·大模型·cot·vlm·推理模型·reasoning
q_q王1 天前
dify对接飞书云文档,并且将图片传入飞书文档
python·大模型·飞书·dify·智能体·图片展示
GPUStack2 天前
GPUStack v0.5:模型Catalog、图生图功能上线,多维优化全面提升产品能力与使用体验
ai·大模型·llm·genai·gpu集群
阿东玩AI2 天前
基于 MCP 架构的知识库问答系统实战,已拿字节offer
架构·大模型·大模型实战·mcp·知识库问答系统
AI蜗牛车2 天前
【LLM+Code】Windsurf Agent 模式Prompt&Tools详细解读
ai·大模型·llm·agent
q_q王2 天前
实时数字人——DH_LIVE
python·大模型·数字人·实时
吃鱼不卡次3 天前
视觉大模型专栏导航
大模型·sam·cv