爬虫学习(2)破解百度翻译

代码

python 复制代码
import requests
import json

if __name__ == "__main__":
    url = 'https://fanyi.baidu.com/sug'
    #post请求参数处理(同get请求一致)
    headers = {
        "User-Agent": 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/124.0.0.0 Safari/537.36'
    }
    word = input('enter a word:')
    data = {
        'kw': word
    }
    response = requests.post(url=url,data=data,headers=headers)
    #获取响应数据:json()方法返回的是obj
    dic_obj = response.json()
    fileNmae = word + '.json'
    fp = open(fileNmae,'w',encoding='utf-8')
    json.dump(dic_obj,fp=fp,ensure_ascii=False)
    print('over!')

1.找到要爬取的数据类型

在百度翻译页面,右键选择"检查",然后是Network,Fetch,如下图所示。可以看到网站地址是

https://fanyi.baidu.com/sug

且返回的数据类型是json

2.response.json()

response.json() 是用于将HTTP响应体解析为JSON格式的方法。通常情况下,当你使用 requests 库发送HTTP请求并得到响应后,可以使用 response.json() 方法来提取JSON格式的数据。这个方法会自动将JSON格式的响应内容转换为Python字典或列表,以便于在代码中进行处理。

相关推荐
梦境虽美,却不长19 小时前
算法 学习 排序 2025年6月16日10:25:37
数据结构·学习·排序算法
speop19 小时前
【datawhale组队学习】共读AI新圣经
人工智能·学习
羑悻的小杀马特19 小时前
从信息孤岛到智能星云:学习助手编织高校学习生活的全维度互联网络
c++·学习·生活·api
Chef_Chen2 天前
从0开始学习语言模型--Day02-如何最大化利用硬件
人工智能·学习·语言模型
LuLaLuLaLeLLLLLL2 天前
Elastic Search 学习笔记
笔记·学习
Jack魏2 天前
React学习001-创建 React 应用
前端·学习·react.js
武昌库里写JAVA2 天前
【微服务】134:SpringCloud
java·开发语言·spring boot·学习·课程设计
暗离子跃迁2 天前
达梦数据库单机部署dmhs同步复制(dm8->kafka)
linux·运维·数据库·分布式·学习·kafka·达梦数据库
Chef_Chen2 天前
从0开始学习R语言--Day24--稀疏建模
学习
sealaugh322 天前
docker(学习笔记第一课) 使用nginx +https + wordpress
笔记·学习·docker