【问题解决】关于pip缓存,HUggingface缓存,HUggingface无法正常下载的问题解决

文章目录

  • [1 pip缓存](#1 pip缓存)
    • [1.1 位置](#1.1 位置)
    • [1.2 更改](#1.2 更改)
  • [2 Huggingface的缓存](#2 Huggingface的缓存)
    • [2.1 位置](#2.1 位置)
    • [2.2 更改](#2.2 更改)
      • [2.2.1 方式一](#2.2.1 方式一)
      • [2.2.2 方式二](#2.2.2 方式二)
  • [3 Hhuggingface无法访问下载模型](#3 Hhuggingface无法访问下载模型)

第一个问题

我在安装的pip install torch的时候,出现了C盘磁盘空间不够的问题

但是我的环境明明在E盘啊,给我整不会了!!!

后来发现是因为缓存的问题

感觉理解缓存相关机制可以更好debug~

先来回答缓存在哪里

1 pip缓存

1.1 位置

pip 的安装缓存在哪里

  • Windows 10:C:\Users\username\AppData\Local\pip\Cache
  • macOS:/Users/username/Library/Caches/pip
  • Linux:~/.cache/pip

如果我们想手动清除缓存,可以使用以下命令:

pip cache purge

这个命令会清除所有缓存,包括已下载但未安装的软件包和已安装但未被使用的缓存。

只想清除特定软件包的缓存,可以使用以下命令:

pip cache remove

其中,package-name 是你要清除缓存的软件包的名称。

所以更加理解了pip过程,首先会去缓存找对应包的对应版本,找到则直接用,找不到则从官网下载

这也解释了为什么感觉每次下载好多包之前下过还都需要重新下载,因为版本不一样

1.2 更改

想要更改pip缓存位置,用命令

pip config set global.cache-dir "XXX"

2 Huggingface的缓存

2.1 位置

一般来说HUggingfaceface如果调用from_pretrain什么的就是会先去缓存找,如果找不到的话则去huggingface上面下载

huggingface的缓存在哪里?

  • Linux:'~/.cache/huggingface/hub'

2.2 更改

2.2.1 方式一

可以通过from_pretrained函数中的 cache_dir 参数来指定,但是这样比较麻烦。

如:加载一个bert-base-uncased模型

python 复制代码
from transformers import AutoTokenizer, AutoModelForMaskedLM
tokenizer = AutoTokenizer.from_pretrained("google-bert/bert-base-uncased",cache_dir="路径")
model = AutoModelForMaskedLM.from_pretrained("google-bert/bert-base-uncased",cache_dir="路径")

2.2.2 方式二

看这里吧,感觉很清晰

不会修改HuggingFace模型下载默认缓存路径?一篇教会你!_huggingface缓存文件转移-CSDN博客

3 Hhuggingface无法访问下载模型

huggingface被墙了

huggingface无法链接,怎么办,可以下载模型到本地目录,然后换目录名,但有些时候不好用,也不能直接放缓存,因为缓存是哈希处理的

所以

用镜像站!!!!

用法

python 复制代码
import os
os.environ['HF_ENDPOINT']='https://hf-mirror.com'

注意要在import transformer库之前用~

我是SB

参考:

Windows下更改pip默认缓存目录的方法_appdata local pip-CSDN博客

【Python】pip安装库时存在缓存(及清除方法)_pip 清除缓存-CSDN博客

相关推荐
力江1 天前
FastAPI 最佳架构实践,从混乱到优雅的进化之路
python·缓存·架构·单元测试·fastapi·分页·企业
屋外雨大,惊蛰出没1 天前
小白安装Redis
数据库·redis·缓存
Maiko Star1 天前
基于Redis ZSet实现多维度题目贡献度排行榜
数据库·redis·缓存
勇往直前plus2 天前
PyCharm 找不到包?Anaconda base 环境 pip 装到用户目录的排查与修复
ide·python·pycharm·conda·pip
pingcode2 天前
IDEA清除缓存
缓存·intellij-idea
不会写程序的未来程序员2 天前
Redis 缓存
数据库·redis·缓存
脸大是真的好~2 天前
黑马消息队列-rabbitMQ2-生产者重连机制-生产者确认机制-数据持久化-LazyQueue-消费者确认机制-失败重试机制-重试耗尽告警手动处理-
java·缓存·中间件
源代码•宸2 天前
分布式缓存-GO(分布式算法之一致性哈希、缓存对外服务化)
开发语言·经验分享·分布式·后端·算法·缓存·golang
code bean2 天前
【CMake】为什么需要清理 CMake 缓存文件?深入理解 CMake 生成器切换机制
java·spring·缓存
武子康2 天前
Java-193 Spymemcached 深入解析:线程模型、Sharding 与序列化实践全拆解
java·开发语言·redis·缓存·系统架构·memcached·guava