爬虫案例一

首先我举一个案例比如豆瓣电影排行榜 (douban.com)这个电影,首先我们进去检查源代码

说明源代码有,说明是服务器渲染,可以直接那html

但是返回的结果是空,所以我们需要在头里面加上User-Agent

然后可以看到有返回的结果,如果想拿到其中的名字这时候就要用re正则来进行匹配

然后这是自己写的正则,可能写的不够好

结果爬出来了

如果想拿到这3个信息,如何写呢

这是我写的re正则,看结果

如果我们像吧他们存放去了,可以导入csv包只是方便分析而已

结果

相关推荐
u0109147603 分钟前
C#怎么实现OAuth2.0授权_C#如何对接第三方快捷登录【核心】
jvm·数据库·python
2301_777599378 分钟前
如何显著提升 Google Sheets 数据库批量更新脚本的执行效率
jvm·数据库·python
2201_7610405915 分钟前
bootstrap怎么给div添加自定义的边框样式
jvm·数据库·python
Java后端的Ai之路17 分钟前
当大模型开始“水土不服“:从通才到专才的进化论——Fine-tuning 企业级实战全攻略
人工智能·python·langchain·rag·lcel
weixin_5689960620 分钟前
Golang怎么用K8s Job执行一次性任务_Golang如何用Job资源运行批处理和迁移任务【操作】
jvm·数据库·python
耿雨飞23 分钟前
Python 后端开发技术博客专栏 | 第 09 篇 GIL 深度解析与并发编程实战 -- 多线程、多进程、协程的选型
开发语言·python
Ulyanov28 分钟前
像素迷宫:路径规划算法的可视化与实战
大数据·开发语言·python·算法
源码之家29 分钟前
计算机毕业设计:Python农产品销售数据可视化分析系统 Django框架 数据分析 可视化 大数据 大模型 机器学习(建议收藏)✅
python·信息可视化·数据分析·django·flask·课程设计
2401_8877245030 分钟前
如何通过JDBC写入BLOB文件_setBinaryStream上传图片与大文件至数据库
jvm·数据库·python
2301_8166602133 分钟前
如何重命名数据表_Operations面板表名修改方法
jvm·数据库·python