爬虫学习(3)豆瓣电影

代码

python 复制代码
import requests
import json

if __name__ == "__main__":
    url = 'https://movie.douban.com/j/chart/top_list'
    #post请求参数处理(同get请求一致)
    headers = {
        "User-Agent": 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/124.0.0.0 Safari/537.36'
    }

    param = {
        'type':'24',
        'interval_id':'100:90',
        'action':'',
        'start':'1',
        'limit':'20'
    }


    response = requests.get(url=url,params=param,headers=headers)
    #获取响应数据:json()方法返回的是obj
    dic_obj = response.json()
    fileNmae = './douban.json'
    fp = open(fileNmae,'w',encoding='utf-8')
    json.dump(dic_obj,fp=fp,ensure_ascii=False)
    print('over!')

1.寻找信息

url='https://movie.douban.com/j/chart/top_list?type=24\&interval_id=100%3A90\&action=\&start=0\&limit=20'

数据格式为json

需要的数据可以在response中查看

2.将url中的参数写成字典

param = {

'type':'24',

'interval_id':'100:90',

'action':'',

'start':'1',

'limit':'20'

}

3.将得到的数据在json校验网站处理一下

json在线校验网站

相关推荐
Nuyoah.9 分钟前
《Vue3学习手记7》
javascript·vue.js·学习
冰茶_20 分钟前
WPF之Button控件详解
大数据·学习·microsoft·c#·wpf
MrZWCui38 分钟前
iOS—仿tableView自定义闹钟列表
学习·macos·ios·objective-c
API小爬虫1 小时前
利用 Python 爬虫按关键字搜索 1688 商品详情:实战指南
开发语言·爬虫·python
IT技术员1 小时前
【Java学习】Java的CGLIB动态代理:通俗解释与使用指南
java·开发语言·学习
Luck_ff08102 小时前
【Python爬虫详解】第五篇:使用正则表达式提取网页数据
爬虫·python·正则表达式
我的golang之路果然有问题3 小时前
案例速成GO+Socket,个人笔记
开发语言·笔记·后端·websocket·学习·http·golang
song_ly0013 小时前
《软件测试52讲》学习笔记:如何设计一个“好的“测试用例?
笔记·学习·测试用例
xiaohanbao093 小时前
day10 python机器学习全流程实践
人工智能·python·学习·机器学习·信息可视化·pandas
xixixiLucky4 小时前
爬虫学习笔记(一)
笔记·爬虫·学习