Python入门到实战:网络请求与数据获取

一、环境准备,安装requests库

1.安装命令(终端执行)

python 复制代码
 #安装requests库
pip install requests -i https://pypi.tuna.tsinghua.edu.cn/simple/
#(该方式是临时指定的,每次下载需要去cmd终端下载库 相对来说比较麻烦,每次添加库的时候就要去cmd终端去下载)

2.解决安装超时的问题(配置国内镜像源)

python 复制代码
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
说明:默认连接Python官方仓库,国内镜像源(如清华源)可提升下载速度。

二、基本用法:发起GET请求

1.导入模块与基础请求

python 复制代码
import requests #导入requests库
# 在要获取数据的浏览器页面里,找到目标URL(以疾病查询页面为例),键盘按下Fn+F12,查看是什么请求方式
url = 'https://www.youlai.cn/dise'
# 发起get请求,获取响应对象 将获取到的响应对象的结果给到变量res
res = requests.get(url) 
# 打印响应内容(如果响应结果是HTML文本内容)
print("响应内容:",res.text)

2.处理中文乱码问题

python 复制代码
import requests
url = 'https://www.tjwenming.cn/'
res = requests.get(url)
# 手动指定编码(根据目标网页的meta标签设置,此处以gb2312为例)
res.encoding = 'gb2312'
print('处理后的中午内容:',res.text)

调用encoding前 调用encoding后

关键步骤:
  • 检查网页源码中的<metacharset="xxx">标签,获取编码格式(如utf-8、gbk、gb2312)。
  • 通过response.encoding设置编码,确保中文正常显示。

三、带参数的GET请求

1.参数传递方式

方式一:URL拼接参数(直接在URL中携带参数)

python 复制代码
import requests
#包含参数的完整URL(从浏览器复制)
url='https://careers.tencent.com/tencentcareer/api/post/Query?timestamp=1763364793381&countryId=&cityId=&bgIds=&productId=&categoryId=&parentCategoryId=&attrId=2,3&keyword=&pageIndex=1&pageSize=10&language=zh-cn&area=cn'
res = requests.get(url)
print(res.text)

方式二:通过params参数传递

python 复制代码
url = 'https://careers.tencent.com/tencentcareer/api/post/Query' # 注意写基础的URL 不带后面的请求参数
params = { # 将请求参数通过字典的形式存起来,给到params
    'timestamp': 1763364793381,
    'ountryId': '',
    'cityId': '',
    'bgIds': '',
    'productId': '',
    'categoryId': '',
    'parentCategoryId': '',
    'attrId': '2,3', # 注意参数为字符串类型
    'keyword': '',
    'pageIndex': 1,
    'pageSize': 10,
    'language': 'zh-cn',
    'area': 'cn'
}
# 发起请求时传递params参数
res = requests.get(url,params=params)
print(res.text)

四、获取二进制数据(图片、视频等)

:下载网络图片并保存

python 复制代码
import requests
url = 'http://pic.enorth.com.cn/005/026/920/00502692031_21660ab6.jpg'
res = requests.get(url)
#如果请求网址对应的数据为图片视频音频
#获取数据的方式:响应对象.content--->字节数据
res_img = res.content 
with open('1.jpg','wb') as f:
    f.write(res_img)
关键点:
  • 二进制数据通过response.content获取,而非text。
  • 文件扩展名需与内容类型匹配(如.gif、.mp4、.jpg)。
相关推荐
2401_8948281215 分钟前
从原理到实战:随机森林算法全解析(附 Python 完整代码)
开发语言·python·算法·随机森林
B站计算机毕业设计超人15 分钟前
计算机毕业设计Python知识图谱中华古诗词可视化 古诗词情感分析 古诗词智能问答系统 AI大模型自动写诗 大数据毕业设计(源码+LW文档+PPT+讲解)
大数据·人工智能·hadoop·python·机器学习·知识图谱·课程设计
玄同76516 分钟前
Python「焚诀」:吞噬所有语法糖的终极修炼手册
开发语言·数据库·人工智能·python·postgresql·自然语言处理·nlp
johnny23316 分钟前
Python管理工具:包、版本、环境
python
羽翼.玫瑰17 分钟前
关于重装Python失败(本质是未彻底卸载Python)的问题解决方案综述
开发语言·python
cdut_suye17 分钟前
解锁函数的魔力:Python 中的多值传递、灵活参数与无名之美
java·数据库·c++·人工智能·python·机器学习·热榜
木头左39 分钟前
指数期权备兑策略量化实现
python
小镇学者1 小时前
【python】python项目是如何部署到服务器上的
服务器·python·github
weixin_462446231 小时前
使用 jsr:@langchain/pyodide-sandbox 构建 Python 安全沙箱(完整入门教程)
python·安全·langchain·sandbox
Loo国昌1 小时前
【LangChain1.0】第九阶段:文档处理工程 (LlamaIndex)
人工智能·后端·python·算法·langchain