python开发:爬虫示例——GET和POST请求处理

一、Get请求

python 复制代码
import json
import requests

#输入示例:url='https://www.baidu.com'
#RequestHeader:F12标头-请求标头-原始-复制到这(忽略第一句)
def GetRequest(url,RequestHeader=""):
    try:
        dic={}
        RequestHeaderList = RequestHeader.strip().split("\n")
        if RequestHeader!="":
            for item in RequestHeaderList:
                if ":" in item:
                    key = item.split(":")[0].strip()
                    value = item.split(":")[1].strip()
                    dic[key] = value
        else:
            dic["User-Agent"]="Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/132.0.0.0 Safari/537.36 Edg/132.0.0.0"
            #dic["Cookie"]=""
        response=requests.get(url=url,headers=dic)  ##跳过安全验证:逗号补充一个"verify=False"
        response.encoding='utf-8'  ##一般填写utf-8或者gbk
        data=response.json() #获取json字符串
        data = json.dumps(data, indent=4, sort_keys=True, ensure_ascii=False)#字符串格式化为json
        #print(data)#打印Json
        response.close()
        data = json.loads(data)#json转化为py字典
        #print(data)#打印字典
        return data
    except Exception as ex:
        print(f"爬取异常,错误:{ex}")

if __name__ == '__main__':
    url = "https://xxxx/query?leftTicketDTO.train_no=6e000D402202&leftTicketDTO.train_date=2025-02-14&rand_code="
    RequestHeader="""
    GET /otn/queryTrainInfo/query?leftTicketDTO.train_no=6e000D402202&leftTicketDTO.train_date=2025-02-14&rand_code= HTTP/1.1
    Accept: */*
Accept-Encoding: gzip, deflate, br, zstd
Accept-Language: zh-CN,zh;q=0.9,en;q=0.8,en-GB;q=0.7,en-US;q=0.6
Connection: keep-alive
Cookie: JSESSIONID=3C843B300AF2985CE9CDC31F5271E223; _jc_save_wfdc_flag=dc; _jc_save_fromStation=%u8087%u5E86%u4E1C%2CFCQ; _jc_save_toStation=%u6B66%u6C49%u4E1C%2CLFN; _jc_save_toDate=2025-01-19; BIGipServerotn=1977155850.24610.0000; BIGipServerpassport=887619850.50215.0000; guidesStatus=off; highContrastMode=defaltMode; cursorStatus=off; route=9036359bb8a8a461c164a04f8f50b252; _jc_save_fromDate=2025-02-14
Host: kyfw.12306.cn
Referer: https://kyfw.12306.cn/otn/queryTrainInfo/init
Sec-Fetch-Dest: empty
Sec-Fetch-Mode: cors
Sec-Fetch-Site: same-origin
User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/132.0.0.0 Safari/537.36 Edg/132.0.0.0
X-Requested-With: XMLHttpRequest
sec-ch-ua: "Not A(Brand";v="8", "Chromium";v="132", "Microsoft Edge";v="132"
sec-ch-ua-mobile: ?0
sec-ch-ua-platform: "Windows"
    """
    result = GetRequest(url,RequestHeader)#返回一个py字典
    dataList = result["data"]["data"]#依次选择key,就可以获得对应的值
    print(dataList[0])#尝试输出第一个值
相关推荐
羊羊小栈7 小时前
基于「多模态大模型 + BGE向量检索增强RAG」的航空维修智能问答系统(vue+flask+AI算法)
vue.js·人工智能·python·语言模型·flask·毕业设计
星期天要睡觉7 小时前
模型部署——Flask 部署 PyTorch 模型
pytorch·python·flask
weixin_456904277 小时前
SHAP可视化代码详细讲解
python
DTS小夏7 小时前
算法社Python基础入门面试题库(新手版·含答案)
python·算法·面试
刘一哥GIS7 小时前
Windows环境搭建:PostGreSQL+PostGIS安装教程
数据库·python·arcgis·postgresql·postgis
西柚小萌新7 小时前
【深入浅出PyTorch】--4.PyTorch基础实战
人工智能·pytorch·python
用户8356290780517 小时前
掌控PDF页面:使用Python轻松实现添加与删除
后端·python
hsjkdhs8 小时前
C++之类的继承与派生
开发语言·c++
用户3721574261358 小时前
Python 实现 Excel 文件加密与保护
python
lly2024068 小时前
HTML 元素:构建网页的基础
开发语言