安装NVIDIA Parakeet时,我遇到的两个Pip“小插曲”

使用Python的开发者,对 pip 命令可以说是又爱又恨。我们依赖它来管理项目包,但安装过程也常常伴随着各种报错。

版本冲突、缺少C++编译环境、网络问题......这些都是老熟人了。遇到多了,解决起来也算得心应手。但有时候,pip 会抛出一些不那么常见的错误,根源不在我们的环境,而在于包本身。

最近我在安装英伟达的开源项目 Parakeet 时,就遇到了两个这样的"小插曲"。记录下来,希望能帮助遇到类似问题的朋友。

第一个坎:ModuleNotFoundError: No module named 'docopt'

安装进行到一半,终端弹出了这个错误。

vbnet 复制代码
Preparing metadata (setup.py) ... error
error: subprocess-exited-with-error

× python setup.py egg_info did not run successfully.
...
ModuleNotFoundError: No module named 'docopt'
...

这个错误有点奇怪。我正是在尝试安装一个包,它却告诉我找不到它自己。这就像一个需要钥匙才能打开的盒子,而钥匙就在盒子里面。

问题出在 docopt 这个包的安装脚本 setup.py 上。脚本在执行安装前,试图先导入 docopt 模块,可能是为了读取版本号。但此时,docopt 还没有被安装到环境中,Python自然找不到它,于是安装失败。

这是一个由包自身打包方式引起的问题,而不是 pip 的错。

解决方法很直接:既然它找不到,我们就手动把文件放到它面前。

  1. 从网上找到 docopt.py 这个源文件。它通常在docopt的官方代码仓库里。https://raw.githubusercontent.com/docopt/docopt/master/docopt.py
  2. 将这个 docopt.py 文件下载下来,直接放到你的项目根目录下。
  3. 然后,回到终端,重新运行之前的 pip install 命令。

这一次,当安装脚本需要导入 docopt 时,它能在当前路径下找到这个文件,于是顺利地继续执行,问题解决。

第二个坎:UnicodeDecodeError: 'gbk' codec can't decode...

解决了上一个问题后,安装继续进行。没过多久,又一个新的错误出现了。

vbnet 复制代码
Preparing metadata (setup.py) ... error
error: subprocess-exited-with-error

× python setup.py egg_info did not run successfully.
...
UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 268: illegal multibyte sequence
...

这是一个编码错误,在中文Windows系统上尤其常见。

错误日志告诉我们,问题出在另一个依赖包 indic_numtowordssetup.py 文件上。脚本在尝试读取一个文件(通常是README.md这样的项目说明文件)时出了错。

原因在于,Windows系统默认使用GBK编码。而很多开源包的说明文件都是用更通用的UTF-8编码保存的。当安装脚本试图用GBK的方式去读取一个UTF-8文件时,遇到了不认识的字符,就报错了。

这个问题同样是包的开发者没有考虑到跨平台编码的兼容性。

最简单且无副作用的解决方法是,临时告诉Python,在当前这次操作中,请统一使用UTF-8编码。

  1. 打开你的命令行工具(CMD或PowerShell)。

  2. 在执行安装命令之前,先输入一条指令来设置环境变量。这个设置只在当前窗口生效,关掉就没了。

    • 如果你用的是CMD,输入:

      shell 复制代码
      set PYTHONUTF8=1
    • 如果你用的是PowerShell,输入:

      shell 复制代码
      $env:PYTHONUTF8=1
  3. 然后,就在这个窗口里,重新运行你的pip install命令。

设置之后,Python在读写文件时会优先使用UTF-8,编码不匹配的问题也就迎刃而解。

这两个问题都不算复杂,但初次遇到可能会有些不知所措。它们的共同点是,错误根源都在于包本身的 setup.py 安装脚本写得不够完善。通过仔细阅读错误日志,我们就能找到线索,对症下药。希望这段经历能给你带来一点启发。

相关推荐
高洁0112 分钟前
DNN案例一步步构建深层神经网络(3)
python·深度学习·算法·机器学习·transformer
AI_567816 分钟前
Jupyter交互式数据分析的效率革命
开发语言·python
superman超哥18 分钟前
仓颉语言中并发集合的实现深度剖析与高性能实践
开发语言·后端·python·c#·仓颉
superman超哥19 分钟前
仓颉语言中原子操作的封装深度剖析与无锁编程实践
c语言·开发语言·后端·python·仓颉
拾贰_C21 分钟前
【Anaconda | Python | pytorch】sklearn scikit-learn 报错:
pytorch·python·sklearn
叶子丶苏24 分钟前
第十八节_PySide6基本窗口控件深度补充_剪贴板与拖曳功能(QMimeData 类) 上篇
python·pyqt
酷酷的佳30 分钟前
python--面向对象(3)
python
百锦再42 分钟前
Python实现开源AI模型引入及测试全过程
人工智能·python·ai·开源·aigc·模型·自然语言
有时有晌1 小时前
影视解说混剪工具
python·影视解说·影视混剪
BoBoZz191 小时前
ImplicitPolyDataDistance 隐式距离显示
python·vtk·图形渲染·图形处理