爬虫学习(2)破解百度翻译

代码

python 复制代码
import requests
import json

if __name__ == "__main__":
    url = 'https://fanyi.baidu.com/sug'
    #post请求参数处理(同get请求一致)
    headers = {
        "User-Agent": 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/124.0.0.0 Safari/537.36'
    }
    word = input('enter a word:')
    data = {
        'kw': word
    }
    response = requests.post(url=url,data=data,headers=headers)
    #获取响应数据:json()方法返回的是obj
    dic_obj = response.json()
    fileNmae = word + '.json'
    fp = open(fileNmae,'w',encoding='utf-8')
    json.dump(dic_obj,fp=fp,ensure_ascii=False)
    print('over!')

1.找到要爬取的数据类型

在百度翻译页面,右键选择"检查",然后是Network,Fetch,如下图所示。可以看到网站地址是

https://fanyi.baidu.com/sug

且返回的数据类型是json

2.response.json()

response.json() 是用于将HTTP响应体解析为JSON格式的方法。通常情况下,当你使用 requests 库发送HTTP请求并得到响应后,可以使用 response.json() 方法来提取JSON格式的数据。这个方法会自动将JSON格式的响应内容转换为Python字典或列表,以便于在代码中进行处理。

相关推荐
●VON4 分钟前
CANN推理引擎:从云端到边缘的极致加速与部署实战
学习·react native
笔画人生8 分钟前
深度解析 CANN 项目:以 `ops-transformer` 为例探索高性能 AI 算子库
学习·开源
AI视觉网奇41 分钟前
3d数字人 ue blender 绑定衣服对齐 2026
学习·ue5
Nan_Shu_6141 小时前
学习: Blender 基础篇
学习·blender
奶茶精Gaaa2 小时前
工具分享--json在线转换工具
学习
wdfk_prog2 小时前
[Linux]学习笔记系列 -- [drivers][I2C]I2C
linux·笔记·学习
盐焗西兰花2 小时前
鸿蒙学习实战之路-Reader Kit自定义字体最佳实践
学习·华为·harmonyos
近津薪荼3 小时前
dfs专题5——(二叉搜索树中第 K 小的元素)
c++·学习·算法·深度优先
敏叔V5874 小时前
AI智能体的工具学习进阶:零样本API理解与调用
人工智能·学习
2501_941864964 小时前
科学方法论破解学习时间堆砌误区
学习