python爬虫(8)之认识网页结构

就以咱们csdn网站的结构来看看这些网页的基础内容

1、查看网页源代码

1、F12,或者右上角三个点找到更多工具里面有一个开发人员工具

之后点击左上角

你就能看见一个网页的源代码

当然你现抄是没法完全实现的

然后我们就以csdn的门面进行对网页结构进行认识

我们主要认识一下<body>里面的内容

1、<div>标签

他是干啥的为啥咱们这里会有这么多<div>

<div>标签 就是块标签,将网页中规划出一块区域进行显示内容

下面我将用一些代码来进行演示:

<!DOCTYPE html>

<html>

<head>

<meta charset="utf-8">

<title>过度引用</title>

<style>

div{

background-color:pink;

display: inline-block;

width: 100px;

height:100px;

}</style>

</head>

<body>

<div>

</div>

</body>

</html>

这里的div 的格式完全可以按照自己的喜好进行设置大小背景色等等以及是否独占一行等等都是可以做到的

结果如下:

2、<ul> 标签<ol>标签 <li>标签

定义列表的元素 当然在csdn的门户是用ul嵌套li做的也就是最上面的一列

现在我们来试试看去使用requests模块去爬取一下csdn

import requests

resp = requests.get(url='https://www.csdn.net')

print(resp.text)

结果如下:

其实就是把源代码给拿过来了

关于动态数据的加载等下次再说。

相关推荐
SoaringHeart23 分钟前
Flutter组件封装:验证码倒计时按钮 TimerButton
前端·flutter
San30.29 分钟前
深入理解 JavaScript OOP:从一个「就地编辑组件」看清封装、状态与原型链
开发语言·前端·javascript·ecmascript
AAA阿giao1 小时前
JavaScript 原型与原型链:从零到精通的深度解析
前端·javascript·原型·原型模式·prototype·原型链
0***86331 小时前
SQL Server2019安装步骤+使用+解决部分报错+卸载(超详细 附下载链接)
javascript·数据库·ui
烛阴1 小时前
C#异常概念与try-catch入门
前端·c#
钮钴禄·爱因斯晨1 小时前
# 企业级前端智能化架构:DevUI与MateChat融合实践深度剖析
前端·架构
摆烂工程师1 小时前
2025年12月最新的 Google AI One Pro 1年会员教育认证通关指南
前端·后端·ai编程
Gavin在路上2 小时前
DDD之用事件风暴重构“电商订单履约”(11)
java·前端·重构
我命由我123452 小时前
VSCode - VSCode 颜色值快速转换
前端·ide·vscode·前端框架·编辑器·html·js
前端涂涂2 小时前
怎么设计一个加密货币 谁有权利发行数字货币 怎么防止double spending attack 怎么验证交易合法性 铸币交易..
前端