爬虫学习(2)破解百度翻译

代码

python 复制代码
import requests
import json

if __name__ == "__main__":
    url = 'https://fanyi.baidu.com/sug'
    #post请求参数处理(同get请求一致)
    headers = {
        "User-Agent": 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/124.0.0.0 Safari/537.36'
    }
    word = input('enter a word:')
    data = {
        'kw': word
    }
    response = requests.post(url=url,data=data,headers=headers)
    #获取响应数据:json()方法返回的是obj
    dic_obj = response.json()
    fileNmae = word + '.json'
    fp = open(fileNmae,'w',encoding='utf-8')
    json.dump(dic_obj,fp=fp,ensure_ascii=False)
    print('over!')

1.找到要爬取的数据类型

在百度翻译页面,右键选择"检查",然后是Network,Fetch,如下图所示。可以看到网站地址是

https://fanyi.baidu.com/sug

且返回的数据类型是json

2.response.json()

response.json() 是用于将HTTP响应体解析为JSON格式的方法。通常情况下,当你使用 requests 库发送HTTP请求并得到响应后,可以使用 response.json() 方法来提取JSON格式的数据。这个方法会自动将JSON格式的响应内容转换为Python字典或列表,以便于在代码中进行处理。

相关推荐
段一凡-华北理工大学几秒前
工业领域的Hadoop架构学习~系列文章24:adoop工业应用总结与展望 - 技术路线图与最佳实践
大数据·人工智能·hadoop·分布式·学习·架构·高炉炼铁
一锅炖出任易仙13 分钟前
创梦汤锅学习日记day30
学习·ai·ue5·游戏引擎
AOwhisky26 分钟前
Redis 学习笔记(第二期):核心数据类型与消息队列实战
运维·数据库·redis·笔记·学习·云计算
keira67429 分钟前
个人健康日程表(小时级行为系统)
学习·生活
YangYang9YangYan32 分钟前
专科大数据技术学习数据分析的价值分析
大数据·学习·数据分析
段一凡-华北理工大学38 分钟前
工业领域的Hadoop架构学习~系列文章23:物流行业Hadoop应用实践 - 智能物流的数字化引擎
大数据·人工智能·hadoop·分布式·学习·架构·高炉炼铁
峥无41 分钟前
MySQL 系统学习之路 第一篇:服务安装、基础概念与架构全解
学习·mysql·架构
OSwich1 小时前
【UE5学习笔记】UMG中控件命名规范
笔记·学习·ue5
闪闪发亮的小星星1 小时前
STK-01-通信卫星方向学习路线
网络·学习
小宋加油啊11 小时前
学习机械臂相关知识
学习