infllm_v2安装

github上的安装流程很简单 pip install -e . 即可。 但是环境如果没有配置好会踩几个小坑。

cuda安装配置

从略

依赖的pip包

pip install numpy

cutlass安装配置

这里临时配置一下

bash 复制代码
git clone https://github.com/NVIDIA/cutlass.git /tmp/cutlass
export CUTLASS_PATH=/tmp/cutlass
export CPATH=$CUTLASS_PATH/include:$CPATH
export C_INCLUDE_PATH=$CUTLASS_PATH/include:$C_INCLUDE_PATH
export CPLUS_INCLUDE_PATH=$CUTLASS_PATH/include:$CPLUS_INCLUDE_PATH

安装

bash 复制代码
git clone https://github.com/OpenBMB/infllmv2_cuda_impl.git
cd infllmv2_cuda_impl
pip install -e .

编译线程数限制

注意, 机器如果核心较多, 可能会资源占用过多被杀进程。

Command '['ninja', '-v', '-j', '112']' returned non-zero exit status 255.

此时报错比较隐蔽只有一个Killed.

可以通过环境变量限制一下

bash 复制代码
export MAX_JOBS=4
相关推荐
youcans_2 小时前
【HALCON机器视觉实战】专栏介绍
图像处理·人工智能·计算机视觉·halcon
火山引擎开发者社区2 小时前
火山引擎 veRoCE 获权威认证:IANA 官方为 veRoCE 分配专属 UDP 端口号 4794
人工智能
飘落的数码折腾日记2 小时前
你的AI Agent可能正在“叛变“ | 5类真实威胁与四层防御
人工智能
放羊郎2 小时前
基于ORB-SLAM2算法的优化工作
人工智能·算法·计算机视觉
AI袋鼠帝3 小时前
字节的技术决心,都藏在这个动作里
人工智能
AI袋鼠帝3 小时前
企微又偷偷进化AI,并开始不对劲了..
人工智能
工业机器人销售服务3 小时前
2026 年,探索专业伯朗特机器人的奇妙世界
人工智能·机器人
摆烂大大王3 小时前
AI 日报|2026年5月9日:四部门力推AI与能源双向赋能,AI终端国标出台,中国大模型融资潮涌
人工智能
萑澈3 小时前
编程能力强和多模态模型的模型后训练
人工智能·深度学习·机器学习
LaughingZhu3 小时前
Product Hunt 每日热榜 | 2026-05-08
人工智能·经验分享·深度学习·神经网络·产品运营