Python零基础---爬虫技术相关

python 爬虫技术,关于数据相关的拆解:

1.对页面结构的拆解

2.数据包的分析(是否加密了参数)(Md5 aes)难易程度,价格

3.对接客户(433,334)

数据库 CSV

4.结单(发一部分数据)截图,录视频

举例如下:分析拆解过程

数据结构分析:

如下:

写爬虫技术

1.确定网址

2.请求(难度在这个过程)

3.刷选数据

4,保存

import requests

#1.确定网址

Url = 'https://liak,envsc,cn/0utInterface/GetpSList,ashx?regionCode=0&psname=&SystemType=C16A8820480E678F&sgn=4a4f94d86e81fc:b99170851369&ts=1698041764795&tc=92501981

ua ={'User-Agent':Mozilla/5.0(windows NT 10.0: Win64,t/537.36(KHTMLlike Gecko)Chrome/119.0.0.0 Safari/537.36'}

2.请求

json _data =requests.get(url,headers=ua).json()

print(json_data)

3.筛选数据

for res data in json data:

g_name = res_data'ps_name'

x_zheng = res_data'region_iame'

fa_ren = res_data'corporation_name'

shuLiang = res_data'link_info'

4.保存

with open('fadianchang2.csv','a+') as file:

file.write(f'ig_name},{x_zheng},ffa_ren},{shuLiang}\n')

相关推荐
aqi009 分钟前
15天学会AI应用开发(三)把历史对话作为提示词会怎样
人工智能·python·大模型·ai编程·ai应用
大数据魔法师9 分钟前
Streamlit(十八)- API 参考文档(十一)- 页面导航组件
python·web
weixin_4684668515 分钟前
数据高效处理实战:从痛点解决到价值落地
大数据·python·自动化·数据处理
大大杰哥22 分钟前
Java 日志框架详解:SLF4J + Logback 从入门到实战
java·开发语言·logback
ylscode30 分钟前
黑客利用 GHOSTYNETWORKS 和 OMEGATECH 托管 JS 恶意软件基础设施
开发语言·安全·php·安全威胁分析
爱吃生蚝的于勒30 分钟前
QT开发第二章——信号和槽
c语言·开发语言·c++·qt
hui函数34 分钟前
Python系列Bug修复|如何解决 pip install 报错 ModuleNotFoundError: No module named ‘pygame’ 问题
python·bug·pip
xcLeigh35 分钟前
Python入门:Python3 operator模块全面学习教程
开发语言·python·学习·教程·python3·operator
xcLeigh36 分钟前
Python小游戏实战:实现2048游戏小游戏附源码
python·游戏·教程·pygame·2048·python3