爬虫学习(2)破解百度翻译

代码

python 复制代码
import requests
import json

if __name__ == "__main__":
    url = 'https://fanyi.baidu.com/sug'
    #post请求参数处理(同get请求一致)
    headers = {
        "User-Agent": 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/124.0.0.0 Safari/537.36'
    }
    word = input('enter a word:')
    data = {
        'kw': word
    }
    response = requests.post(url=url,data=data,headers=headers)
    #获取响应数据:json()方法返回的是obj
    dic_obj = response.json()
    fileNmae = word + '.json'
    fp = open(fileNmae,'w',encoding='utf-8')
    json.dump(dic_obj,fp=fp,ensure_ascii=False)
    print('over!')

1.找到要爬取的数据类型

在百度翻译页面,右键选择"检查",然后是Network,Fetch,如下图所示。可以看到网站地址是

https://fanyi.baidu.com/sug

且返回的数据类型是json

2.response.json()

response.json() 是用于将HTTP响应体解析为JSON格式的方法。通常情况下,当你使用 requests 库发送HTTP请求并得到响应后,可以使用 response.json() 方法来提取JSON格式的数据。这个方法会自动将JSON格式的响应内容转换为Python字典或列表,以便于在代码中进行处理。

相关推荐
gjf05_057 小时前
人该怎样活着呢?55
学习
试着8 小时前
零基础学习性能测试第二章-linux服务器监控:CPU监控
linux·服务器·学习·零基础·性能测试·cpu监控
名字不要太长 像我这样就好9 小时前
【iOS】消息传递和消息转发
开发语言·学习·macos·ios·objective-c
屁股割了还要学9 小时前
【C语言进阶】题目练习(3)
c语言·开发语言·c++·学习·算法·青少年编程
wjpwjpwjp083110 小时前
[MySQL基础3] 数据控制语言DCL和MySQL中的常用函数
数据库·笔记·后端·学习·mysql
PP东10 小时前
Mybatis学习之简介(一)
学习·oracle·mybatis
典孝赢麻崩乐急10 小时前
Java学习--------消息队列的重复消费、消失与顺序性的深度解析
java·开发语言·学习
斟的是酒中桃10 小时前
【学习记录】智能客服小桃(进度更新ing)
人工智能·python·学习·语言模型·langchain·agent
西岭千秋雪_11 小时前
NIO网络通信基础
笔记·学习·计算机网络·nio
努力自学的小夏12 小时前
RK3568 Linux驱动学习——SDK安装编译
linux·arm开发·笔记·学习