爬虫学习(3)豆瓣电影

代码

python 复制代码
import requests
import json

if __name__ == "__main__":
    url = 'https://movie.douban.com/j/chart/top_list'
    #post请求参数处理(同get请求一致)
    headers = {
        "User-Agent": 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/124.0.0.0 Safari/537.36'
    }

    param = {
        'type':'24',
        'interval_id':'100:90',
        'action':'',
        'start':'1',
        'limit':'20'
    }


    response = requests.get(url=url,params=param,headers=headers)
    #获取响应数据:json()方法返回的是obj
    dic_obj = response.json()
    fileNmae = './douban.json'
    fp = open(fileNmae,'w',encoding='utf-8')
    json.dump(dic_obj,fp=fp,ensure_ascii=False)
    print('over!')

1.寻找信息

url='https://movie.douban.com/j/chart/top_list?type=24\&interval_id=100%3A90\&action=\&start=0\&limit=20'

数据格式为json

需要的数据可以在response中查看

2.将url中的参数写成字典

param = {

'type':'24',

'interval_id':'100:90',

'action':'',

'start':'1',

'limit':'20'

}

3.将得到的数据在json校验网站处理一下

json在线校验网站

相关推荐
这个名字先用着4 分钟前
形位公差速查详解
学习·汽车·制造
Jackyzhe20 分钟前
从零学习Kafka:幂等与事务
数据库·学习·kafka
小新同学^O^27 分钟前
简单学习 --> 文件IO
java·学习·文件io
学习使我快乐0129 分钟前
Express 学习
学习·node.js·express
熠熠仔33 分钟前
《Agentic Design Patterns》概览
学习·设计模式
Tutankaaa1 小时前
从单场到多场并发:知识竞赛平台的弹性扩展能力
服务器·笔记·学习·职场和发展
奶人五毛拉人一块2 小时前
C++ AVL树的学习
学习·二叉树·avl树·旋转
咸鱼翻身小阿橙2 小时前
Qt Quick QML 登录界面代码学习报告
开发语言·qt·学习
小夏子_riotous2 小时前
Kubernetes学习路径——3. Kubernetes 1.25 高可用集群部署实战:从 Docker 到 Calico 全链路详解
linux·运维·学习·docker·容器·kubernetes·centos
今天也是元气满满的一天呢2 小时前
20260512-SQL学习大览
数据库·sql·学习