python爬取某财富网

过程:

点击底部的第3页,第5页,网页刷新了,但是顶部的url地址没有变。那么就是 动态加载, 就是 XHR. 直接请求api.

实验代码如下:

python3 复制代码
import requests

headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36"
}


def get_data():
    url = "https://datacenter-web.eastmoney.com/api/data/v1/get?callback=jQuery1123003202116224702545_1721237385870&sortColumns=SCGGRQ&sortTypes=-1&pageSize=50&pageNumber=18&columns=ALL&source=WEB&token=894050c76af8597a853f5b408b759f5d&reportName=RPTA_WEB_BGCZMX"
    resp = requests.get(url, headers=headers)
    print(resp.status_code)
    ret = resp.text
    print(ret)

    file_path = 'resp2.txt'
    with open(file_path, 'w', encoding='utf-8') as f:
        f.write(ret)

get_data()

输出:

相关推荐
2401_891482177 分钟前
C++中的代理模式实战
开发语言·c++·算法
七夜zippoe10 分钟前
MongoDB聚合框架与性能优化实战指南
数据库·python·mongodb·性能优化·聚合框架
weisian15113 分钟前
Java并发编程--12-读写锁与StampedLock:高并发读场景下的性能优化利器
java·开发语言·性能优化·读写锁·stampedlock
2401_8386833715 分钟前
C++中的代理模式高级应用
开发语言·c++·算法
暮冬-  Gentle°5 小时前
C++中的命令模式实战
开发语言·c++·算法
勾股导航5 小时前
大模型Skill
人工智能·python·机器学习
2501_945423546 小时前
Django全栈开发入门:构建一个博客系统
jvm·数据库·python
FreakStudio7 小时前
保姆级 uPyPi 教程|从 0 到 1:MicroPython 驱动包一键安装 + 分享全攻略
python·嵌入式·电子diy
Volunteer Technology7 小时前
架构面试题(一)
开发语言·架构·php
清水白石0087 小时前
Python 对象序列化深度解析:pickle、JSON 与自定义协议的取舍之道
开发语言·python·json