爬虫案例一

首先我举一个案例比如豆瓣电影排行榜 (douban.com)这个电影,首先我们进去检查源代码

说明源代码有,说明是服务器渲染,可以直接那html

但是返回的结果是空,所以我们需要在头里面加上User-Agent

然后可以看到有返回的结果,如果想拿到其中的名字这时候就要用re正则来进行匹配

然后这是自己写的正则,可能写的不够好

结果爬出来了

如果想拿到这3个信息,如何写呢

这是我写的re正则,看结果

如果我们像吧他们存放去了,可以导入csv包只是方便分析而已

结果

相关推荐
倔强青铜三33 分钟前
苦练Python第13天:变量作用域、全局变量与局部变量
人工智能·python·面试
青衫客3634 分钟前
浅谈 Python 中的 yield——生成器对象与函数调用的区别
开发语言·python
von Neumann35 分钟前
系统学习Python——并发模型和异步编程:基础实例-[使用进程实现旋转指针]
python·线程·进程·并发·协程·异步·多进程
apihz38 分钟前
腾讯云轻量服务器创建快照免费API接口教程
android·服务器·数据库·python·网络协议·tcp/ip·腾讯云
爱分享的飘哥38 分钟前
《【第八篇-图片总结篇】Python图片处理自动化:终极工厂!从裁剪压缩到智能加水印,打造你的视觉内容生产流水线!》
python·办公自动化·自动化脚本·python图片处理·图片自动化·python实战
倔强青铜三1 小时前
苦练Python第12天:函数三板斧,def、return、参数
人工智能·python·面试
倔强青铜三1 小时前
苦练Python第11天:循环控制——break、continue 和 pass
人工智能·python·面试
chao_7891 小时前
Selenium 操作表单选择控件【selenium】
运维·python·selenium·测试工具·自动化
贝塔西塔2 小时前
PySpark中python环境打包和JAR包依赖
大数据·开发语言·python·spark·jar·pyspark
8Qi82 小时前
Win11系统安装Anaconda环境极简教程
人工智能·python·conda