爬虫案例一

首先我举一个案例比如豆瓣电影排行榜 (douban.com)这个电影,首先我们进去检查源代码

说明源代码有,说明是服务器渲染,可以直接那html

但是返回的结果是空,所以我们需要在头里面加上User-Agent

然后可以看到有返回的结果,如果想拿到其中的名字这时候就要用re正则来进行匹配

然后这是自己写的正则,可能写的不够好

结果爬出来了

如果想拿到这3个信息,如何写呢

这是我写的re正则,看结果

如果我们像吧他们存放去了,可以导入csv包只是方便分析而已

结果

相关推荐
迪霸LZTXDY6 分钟前
U-NET模型训练--图像标注脚本工具
开发语言·python
码界筑梦坊7 分钟前
119-基于Python的各类企业排行数据可视化分析系统
开发语言·python·信息可视化·数据分析·毕业设计·echarts·fastapi
习明然8 分钟前
记录下解决Python在windows 2008 Server 无法启动
开发语言·windows·python
duke8692672149 分钟前
C# 文件上传的服务器端加密 C#如何在存储到S3或Azure Blob时启用加密
jvm·数据库·python
SOC罗三炮12 分钟前
Hermes Agent v0.14.0:不用装 WSL 了,Windows 原生支持来了(Early Beta)
python
用户789377339085313 分钟前
前端转后端生存指南(中):化身架构师,用 ORM 魔法掌控数据库
后端·python
深邃-15 分钟前
【Web安全】-BurpSutie实战讲解(2):BP代理模块,BP重放模块,BP爆破模块,BP爬虫功能,BP解码模块,BP对比模块
爬虫·计算机网络·安全·web安全·网络安全·burpsutie
༒࿈南林࿈༒17 分钟前
某川数据接口逆向、SM系列国密算法
python·js逆向·国密(sm系列)
MwEUwQ3Gx34 分钟前
网络爬虫是自动从互联网上采集数据的程序
爬虫
ftpeak43 分钟前
LangGraph Agent 开发指南(10~子图 Subgraphs)
python·ai·langchain·ai编程·langgraph