安装NVIDIA Parakeet时,我遇到的两个Pip“小插曲”

使用Python的开发者,对 pip 命令可以说是又爱又恨。我们依赖它来管理项目包,但安装过程也常常伴随着各种报错。

版本冲突、缺少C++编译环境、网络问题......这些都是老熟人了。遇到多了,解决起来也算得心应手。但有时候,pip 会抛出一些不那么常见的错误,根源不在我们的环境,而在于包本身。

最近我在安装英伟达的开源项目 Parakeet 时,就遇到了两个这样的"小插曲"。记录下来,希望能帮助遇到类似问题的朋友。

第一个坎:ModuleNotFoundError: No module named 'docopt'

安装进行到一半,终端弹出了这个错误。

vbnet 复制代码
Preparing metadata (setup.py) ... error
error: subprocess-exited-with-error

× python setup.py egg_info did not run successfully.
...
ModuleNotFoundError: No module named 'docopt'
...

这个错误有点奇怪。我正是在尝试安装一个包,它却告诉我找不到它自己。这就像一个需要钥匙才能打开的盒子,而钥匙就在盒子里面。

问题出在 docopt 这个包的安装脚本 setup.py 上。脚本在执行安装前,试图先导入 docopt 模块,可能是为了读取版本号。但此时,docopt 还没有被安装到环境中,Python自然找不到它,于是安装失败。

这是一个由包自身打包方式引起的问题,而不是 pip 的错。

解决方法很直接:既然它找不到,我们就手动把文件放到它面前。

  1. 从网上找到 docopt.py 这个源文件。它通常在docopt的官方代码仓库里。https://raw.githubusercontent.com/docopt/docopt/master/docopt.py
  2. 将这个 docopt.py 文件下载下来,直接放到你的项目根目录下。
  3. 然后,回到终端,重新运行之前的 pip install 命令。

这一次,当安装脚本需要导入 docopt 时,它能在当前路径下找到这个文件,于是顺利地继续执行,问题解决。

第二个坎:UnicodeDecodeError: 'gbk' codec can't decode...

解决了上一个问题后,安装继续进行。没过多久,又一个新的错误出现了。

vbnet 复制代码
Preparing metadata (setup.py) ... error
error: subprocess-exited-with-error

× python setup.py egg_info did not run successfully.
...
UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 268: illegal multibyte sequence
...

这是一个编码错误,在中文Windows系统上尤其常见。

错误日志告诉我们,问题出在另一个依赖包 indic_numtowordssetup.py 文件上。脚本在尝试读取一个文件(通常是README.md这样的项目说明文件)时出了错。

原因在于,Windows系统默认使用GBK编码。而很多开源包的说明文件都是用更通用的UTF-8编码保存的。当安装脚本试图用GBK的方式去读取一个UTF-8文件时,遇到了不认识的字符,就报错了。

这个问题同样是包的开发者没有考虑到跨平台编码的兼容性。

最简单且无副作用的解决方法是,临时告诉Python,在当前这次操作中,请统一使用UTF-8编码。

  1. 打开你的命令行工具(CMD或PowerShell)。

  2. 在执行安装命令之前,先输入一条指令来设置环境变量。这个设置只在当前窗口生效,关掉就没了。

    • 如果你用的是CMD,输入:

      shell 复制代码
      set PYTHONUTF8=1
    • 如果你用的是PowerShell,输入:

      shell 复制代码
      $env:PYTHONUTF8=1
  3. 然后,就在这个窗口里,重新运行你的pip install命令。

设置之后,Python在读写文件时会优先使用UTF-8,编码不匹配的问题也就迎刃而解。

这两个问题都不算复杂,但初次遇到可能会有些不知所措。它们的共同点是,错误根源都在于包本身的 setup.py 安装脚本写得不够完善。通过仔细阅读错误日志,我们就能找到线索,对症下药。希望这段经历能给你带来一点启发。

相关推荐
2601_9516437712 分钟前
Python第一,Java跌出前三,C语言杀回来了
java·c语言·python·编程语言排行·技术趋势
kyriewen21 分钟前
从本地到生产:迁移到 GitHub Actions 自动化 CI/CD,总结了这 5 个坑
前端·github·自动化运维
江畔柳前堤2 小时前
github实战指南02-仓库管理与 Issue
人工智能·深度学习·github·信号处理·caffe·wps·issue
AC赳赳老秦2 小时前
OpenClaw+Power Apps 实战:自动生成 Power Apps 应用、连接 Excel 数据源
大数据·开发语言·python·serverless·excel·deepseek·openclaw
江畔柳前堤3 小时前
github实战指南07-CLI 与高级技巧
前端·人工智能·chrome·深度学习·github·caffe·issue
右耳朵猫AI3 小时前
GitHub周趋势2026W23 | last30days-skill AI搜索、headroom令牌压缩、apple/container开源
人工智能·开源·github
茉莉玫瑰花茶4 小时前
综合案例 - AI 智能租房助手 [ 5 ]
服务器·数据库·人工智能·python·ai
文艺倾年4 小时前
【强化学习】强化学习基本概念,20W字总结(一)
人工智能·python·语言模型·自然语言处理·面试·职场和发展·大模型
宸丶一4 小时前
Day 13:持久化记忆 - 让 Agent 拥有长期记忆
jvm·python·ai
器灵科技4 小时前
AI视频工具实测:Seedance/可灵/HappyHorse谁最能打?
java·运维·数据库·人工智能·github