一些意外的bug

类型一:安装包问题

1、包内部代码报错,如:某方法没有

检查版本:

python -> import 包名 -> 包名.version -> 包名.file

若import 的包名与 pip安装的包的路径不一致,则copy过去

具体:

1、key llama error transformers问题,需安装4.28

2、deepspeed没有adam_cuda属性,需要安装0.8.3 (torch的版本要1.12.1的)

类型二:目录没有权限

sudo chmod 777 dir

sudo chmod 777 dir/* (目录下的文件负最大权限)

类型三、python使用版本不对

sudo python与python用的不是同一个python

解决办法:

iii. sudo cp /usr/bin/python /usr/bin/python_bak

iv. sudo rm /usr/bin/python

v. sudo ln -s /opt/conda/bin/python /usr/bin/python

类型三、cpu与gpu上的半精度问题

def normalize(x, axis=-1):

x = 1. * x / (torch.norm(x, 2, axis, keepdim=True).expand_as(x)+1e-12)

return x

embed 目前在显卡上且是半精度

normalize(embed_f).cpu() 与 normalize(embed_f.cpu()) 的结果会不一样,后者会改变精度

解决办法:采用normalize(embed_f.cpu().float())

tips:这三种结果都有细微 的差别,只是normalize(embed_f.cpu())差别很明显

numpy与tensor 取值问题:

复制代码
[str(i.item()) for i in normalize(embed_f[0]).cpu().numpy()]

result:['0.02435302734375', '0.0052337646484375']

[str(i) for i in normalize(embed_f[0]).cpu().numpy()]

result:['0.02435', '0.005234']

cuda error:

RuntimeError: CUDA error: device-side assert triggered

CUDA kernel errors might be asynchronously reported at some other API call, so the stacktrace below might be incorrect.

For debugging consider passing CUDA_LAUNCH_BLOCKING=1.

Compile with `TORCH_USE_CUDA_DSA` to enable device-side assertions.

解决办法:python 前面加入CUDA_VISIBLE_DEVICES=3

llama1 加入这一串也能解决:

复制代码
if tokenizer.pad_token is None:
        DEFAULT_PAD_TOKEN = "[PAD]"
        DEFAULT_EOS_TOKEN = "</s>"
        DEFAULT_BOS_TOKEN = "</s>"
        DEFAULT_UNK_TOKEN = "</s>"
        tokenizer.add_special_tokens(
            {
                "eos_token": DEFAULT_EOS_TOKEN,
                "bos_token": DEFAULT_BOS_TOKEN,
                "unk_token": DEFAULT_UNK_TOKEN,
                "pad_token": DEFAULT_PAD_TOKEN,
            }
        )
        tokenizer.add_eos_token = False
相关推荐
隔窗听雨眠2 天前
Git二分法精准定位Bug
git·bug·git bisect
技术人生黄勇3 天前
GitNexus 把代码库变成知识图谱|审核 AI 产出更清晰,改 Bug 更精准
人工智能·bug
黑夜里的小夜莺4 天前
黑马点评登录成功后点击【我的】会跳转到登录页面 BUG 修复
java·bug
熟人看不到4 天前
解决Claude Code界面错位更新不及时-Windows
bug·vibecoding·claude code
深念Y4 天前
踩坑实录:把 Windows 默认 PowerShell 换成 7.x 到底有多坑?一条龙解决指南
windows·乱码·bug·控制台·powershell·管道·流式
油炸自行车5 天前
【Qt bug排查】Qt项目debug模式下,关闭可视化界面后,后台程序不退出,依然在打印log
bug
SoraShim5 天前
2026实测:深入理解Gemini 3 Pro镜像站链式思考提示工程,三步解决复杂Bug定位
bug
AI 编程助手GPT6 天前
GPT-5.6意外曝光、Claude安全检查全面公测、Grok 4.3搅局价格战——多模型混战的五月,开发者如何避坑?
人工智能·gpt·ai·chatgpt·bug·ai编程
Zxxxxxy_7 天前
测试入门:从 0 到 1 搞懂开发与 Bug
bug
专注VB编程开发20年9 天前
Windows API 所有老式结构体4字节对齐,但是64位VBA,Twinbasic弄成了8字节对齐,大BUG
windows·bug