python 爬虫的开发环境配置

1、新建一个python项目

2、在控制台中分别安装下面三个包

pip install requests

pip install beautifulsoup4

pip install selenium/

如果安装时报以下错误:

raise ReadTimeoutError(self._pool, None, "Read timed out.")
pip._vendor.urllib3.exceptions.ReadTimeoutError:

HTTPSConnectionPool(host='files.pythonhosted.org', port=443):
Read timed out.

可以多试几次,或者运行以下命令,延长超时时间

1000 是超时时间

pip --default-timeout=1000 install -U selenium

我在安装 selenium 时以上方法都不行,最后百度了一下,运行以下命令一下子就可以了!

pip --default-timeout=100 install selenium -i https://pypi.tuna.tsinghua.edu.cn/simple

3、检查是否安装完成

在项目下建一个 test 包。之后在 test 包下新建一个 test_env.py 文件,写入如下代码然后运行,如果没有报错,则证明上述三个包安装成功

python 复制代码
import requests
from bs4 import BeautifulSoup
import selenium

print('ok')

简单的爬虫架构

相关推荐
转转技术团队几秒前
回收团队基于Cursor集成MCP的智能代码修复提示词生成实践
人工智能·python·程序员
是一个Bug8 分钟前
如何阅读JDK源码?
java·开发语言
石头dhf12 分钟前
大模型配置
开发语言·python
南科1号12 分钟前
Tushare数据来源分析一例
python
inferno18 分钟前
JavaScript 基础
开发语言·前端·javascript
派大鑫wink24 分钟前
【Day15】集合框架(三):Map 接口(HashMap 底层原理 + 实战)
java·开发语言
API技术员26 分钟前
京东API接口:如何高效获取商品详情与SKU信息
python
派大鑫wink32 分钟前
【Day14】集合框架(二):Set 接口(HashSet、TreeSet)去重与排序
java·开发语言
sort浅忆1 小时前
deeptest执行接口脚本,添加python脚本断言
开发语言·python
趣知岛1 小时前
JavaScript性能优化实战大纲
开发语言·javascript·性能优化