python爬虫(8)之认识网页结构

就以咱们csdn网站的结构来看看这些网页的基础内容

1、查看网页源代码

1、F12,或者右上角三个点找到更多工具里面有一个开发人员工具

之后点击左上角

你就能看见一个网页的源代码

当然你现抄是没法完全实现的

然后我们就以csdn的门面进行对网页结构进行认识

我们主要认识一下<body>里面的内容

1、<div>标签

他是干啥的为啥咱们这里会有这么多<div>

<div>标签 就是块标签,将网页中规划出一块区域进行显示内容

下面我将用一些代码来进行演示:

<!DOCTYPE html>

<html>

<head>

<meta charset="utf-8">

<title>过度引用</title>

<style>

div{

background-color:pink;

display: inline-block;

width: 100px;

height:100px;

}</style>

</head>

<body>

<div>

</div>

</body>

</html>

这里的div 的格式完全可以按照自己的喜好进行设置大小背景色等等以及是否独占一行等等都是可以做到的

结果如下:

2、<ul> 标签<ol>标签 <li>标签

定义列表的元素 当然在csdn的门户是用ul嵌套li做的也就是最上面的一列

现在我们来试试看去使用requests模块去爬取一下csdn

import requests

resp = requests.get(url='https://www.csdn.net')

print(resp.text)

结果如下:

其实就是把源代码给拿过来了

关于动态数据的加载等下次再说。

相关推荐
小哥不太逍遥14 分钟前
Technical Report 2024
java·服务器·前端
沐墨染18 分钟前
黑词分析与可疑对话挖掘组件的设计与实现
前端·elementui·数据挖掘·数据分析·vue·visual studio code
anOnion23 分钟前
构建无障碍组件之Disclosure Pattern
前端·html·交互设计
threerocks26 分钟前
前端将死,Agent 永生
前端·人工智能·ai编程
问道飞鱼1 小时前
【前端知识】Vite用法从入门到实战
前端·vite·项目构建
爱上妖精的尾巴1 小时前
8-10 WPS JSA 正则表达式:贪婪匹配
服务器·前端·javascript·正则表达式·wps·jsa
shadow fish2 小时前
react学习记录(三)
javascript·学习·react.js
小疙瘩3 小时前
element-ui 中 el-upload 多文件一次性上传的实现
javascript·vue.js·ui
Aliex_git3 小时前
浏览器 API 兼容性解决方案
前端·笔记·学习
独泪了无痕3 小时前
useStorage:本地数据持久化利器
前端·vue.js