Baichuan2百川模型部署的bug汇总

lsf_0072024-01-19 1:04

1.4bit的量化版本最好不要在Windows系统中运行，大概原因报错原因是bitsandbytes不支持window，bitsandbytes-windows目前仅支持8bit量化。

2.

报错原因是机器没有足够的内存和显存，offload_folder设置一个文件夹来保存那些离线加载到硬盘的权重。

ag：需要再cli_demo.py的文件中增加

offload_folder="offload" model.float()

3.安装对应的cuda版本 Python版本 pytorch版本

读者有bug可以在评论区留言，我会尽可能回复解答

上一篇：[BUG] cannot import name ‘quantize_qat‘ from ‘onnxruntime.quantization‘

下一篇：C++ 设计模式之命令模式

热门推荐

01GitHub 镜像站点 02BongoCat - 跨平台键盘猫动画工具 03UV安装并设置国内源 04GitLab 零基础入门指南：从安装到项目管理全流程 05Linux下V2Ray安装配置指南 06一文了解国产算子编程语言 TileLang，TileLang 对国产开源生态的影响与启示 07NVIDIA显卡驱动、CUDA、cuDNN 和 TensorRT 版本匹配指南 08在VSCode配置Java开发环境的保姆级教程（适配各类AI编程IDE）092025软件测试面试八股文（含答案+文档）10Labelme从安装到标注：零基础完整指南