python爬取某财富网

过程:

点击底部的第3页,第5页,网页刷新了,但是顶部的url地址没有变。那么就是 动态加载, 就是 XHR. 直接请求api.

实验代码如下:

python3 复制代码
import requests

headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36"
}


def get_data():
    url = "https://datacenter-web.eastmoney.com/api/data/v1/get?callback=jQuery1123003202116224702545_1721237385870&sortColumns=SCGGRQ&sortTypes=-1&pageSize=50&pageNumber=18&columns=ALL&source=WEB&token=894050c76af8597a853f5b408b759f5d&reportName=RPTA_WEB_BGCZMX"
    resp = requests.get(url, headers=headers)
    print(resp.status_code)
    ret = resp.text
    print(ret)

    file_path = 'resp2.txt'
    with open(file_path, 'w', encoding='utf-8') as f:
        f.write(ret)

get_data()

输出:

相关推荐
温轻舟4 分钟前
禁毒路上,任重道远 | HTML页面
开发语言·前端·javascript·css·html·温轻舟
学历真的很重要24 分钟前
Hello-Agents —— 03大语言模型基础 通俗总结
开发语言·人工智能·后端·语言模型·自然语言处理·面试·langchain
wefg11 小时前
【C++】IO流
开发语言·c++
aloha_7891 小时前
联易融测开面试准备
java·python·面试·单元测试
"菠萝"1 小时前
C#知识学习-020(访问关键字)
开发语言·学习·c#
箫笙默2 小时前
JS基础 - 正则笔记
开发语言·javascript·笔记
学历真的很重要2 小时前
LangChain V1.0 Short-term Memory 详细指南
后端·python·语言模型·面试·langchain·agent·ai编程
xxp43212 小时前
Qt 网络编程 TCP通信
开发语言·qt
T***u3332 小时前
PHP在电商中的会员管理
开发语言·wireshark·php·ue4·jina
张丶大帅2 小时前
JS案例合集
开发语言·javascript·笔记