infllm_v2安装

github上的安装流程很简单 pip install -e . 即可。 但是环境如果没有配置好会踩几个小坑。

cuda安装配置

从略

依赖的pip包

pip install numpy

cutlass安装配置

这里临时配置一下

bash 复制代码
git clone https://github.com/NVIDIA/cutlass.git /tmp/cutlass
export CUTLASS_PATH=/tmp/cutlass
export CPATH=$CUTLASS_PATH/include:$CPATH
export C_INCLUDE_PATH=$CUTLASS_PATH/include:$C_INCLUDE_PATH
export CPLUS_INCLUDE_PATH=$CUTLASS_PATH/include:$CPLUS_INCLUDE_PATH

安装

bash 复制代码
git clone https://github.com/OpenBMB/infllmv2_cuda_impl.git
cd infllmv2_cuda_impl
pip install -e .

编译线程数限制

注意, 机器如果核心较多, 可能会资源占用过多被杀进程。

Command '['ninja', '-v', '-j', '112']' returned non-zero exit status 255.

此时报错比较隐蔽只有一个Killed.

可以通过环境变量限制一下

bash 复制代码
export MAX_JOBS=4
相关推荐
猫咪老师2 小时前
RAG与GraphRAG介绍
人工智能·算法·llm
tangdou3690986552 小时前
图文并茂安装Claude Code 以及配置 Coding Plan 教程
前端·人工智能·后端
跨境猫小妹2 小时前
供应链交付不稳定跨境卖家如何建立备选供应商
大数据·人工智能·产品运营·跨境电商·营销策略
跨境海王哥2 小时前
Google Ads vs Meta Ads:2026广告流量本质差异与投放选择指南
人工智能
CHU7290352 小时前
让知识传递更顺畅:在线教学课堂APP的功能设计
前端·人工智能·小程序
雷焰财经2 小时前
首都在线海外大带宽筑基,加速大模型出海全球化进程
大数据·人工智能
2301_766558652 小时前
实战源码级解读:矩阵跃动龙虾机器人本地AI智能体部署,实现7×24小时无人值守获客
人工智能·矩阵·机器人
大侠区块链2 小时前
【2026】AI Agent 生产环境踩坑实录:错误放大效应、权限失控与架构选型
人工智能·架构
又是忙碌的一天2 小时前
从像素到形状:我用 OpenCV + YOLO 实现的单一特征识别实践
人工智能·opencv·yolo