CLIP 学的是github官方给的教程
Interacting_with_CLIP.ipynb
注意:我运行程序遇到了很多问题
numpy
用低版本的numpy
pip install numpy==1.25.0
Jupyter notebook 内核崩溃
python
with torch.no_grad():
image_features = model.encode_image(image_input).float()
text_features = model.encode_text(text_tokens).float()
是在这里崩溃的,我按照github的提示,显示更新了一下jupyter kernel
,再把所有变量都放在cpu
上,还修改了精度才运行成功的;
python
# for CPU
image_input = image_input.float()
text_tokens = text_tokens.int()