爬虫学习(2)破解百度翻译

代码

python 复制代码
import requests
import json

if __name__ == "__main__":
    url = 'https://fanyi.baidu.com/sug'
    #post请求参数处理(同get请求一致)
    headers = {
        "User-Agent": 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/124.0.0.0 Safari/537.36'
    }
    word = input('enter a word:')
    data = {
        'kw': word
    }
    response = requests.post(url=url,data=data,headers=headers)
    #获取响应数据:json()方法返回的是obj
    dic_obj = response.json()
    fileNmae = word + '.json'
    fp = open(fileNmae,'w',encoding='utf-8')
    json.dump(dic_obj,fp=fp,ensure_ascii=False)
    print('over!')

1.找到要爬取的数据类型

在百度翻译页面,右键选择"检查",然后是Network,Fetch,如下图所示。可以看到网站地址是

https://fanyi.baidu.com/sug

且返回的数据类型是json

2.response.json()

response.json() 是用于将HTTP响应体解析为JSON格式的方法。通常情况下,当你使用 requests 库发送HTTP请求并得到响应后,可以使用 response.json() 方法来提取JSON格式的数据。这个方法会自动将JSON格式的响应内容转换为Python字典或列表,以便于在代码中进行处理。

相关推荐
YJlio1 小时前
Process Monitor 学习笔记(5.24):工具栏参考与高效快捷键指南
笔记·学习·php
deng-c-f2 小时前
Linux C/C++ 学习日记(30):协程(一):同步和异步、协程的简要介绍、用户态CPU调度的实现
学习·协程·同步/异步
hello kitty w2 小时前
Python学习(11) ----- Python的泛型
windows·python·学习
讽刺人生Yan3 小时前
RFSOC学习记录(五)带通采样定理
学习·fpga·rfsoc
报错小能手3 小时前
linux学习笔记(49)Redis详解(1)
linux·笔记·学习
QT 小鲜肉3 小时前
【个人成长笔记】在本地Windows系统中如何正确使用adb pull命令,把Linux系统中的文件或文件夹复制到本地中(亲测有效)
linux·windows·笔记·学习·adb
_李小白6 小时前
【OPENGL ES 3.0 学习笔记】第九天:缓存、顶点和顶点数组
笔记·学习·elasticsearch
洛白白7 小时前
Word文档中打勾和打叉的三种方法
经验分享·学习·word·生活·学习方法
楼田莉子8 小时前
C++学习:C++11关于类型的处理
开发语言·c++·后端·学习
酷讯网络_2408701608 小时前
PHP双轨直销企业会员管理系统/购物直推系统/支持人脉网络分销系统源码
学习·开源