python爬虫(8)之认识网页结构

就以咱们csdn网站的结构来看看这些网页的基础内容

1、查看网页源代码

1、F12,或者右上角三个点找到更多工具里面有一个开发人员工具

之后点击左上角

你就能看见一个网页的源代码

当然你现抄是没法完全实现的

然后我们就以csdn的门面进行对网页结构进行认识

我们主要认识一下<body>里面的内容

1、<div>标签

他是干啥的为啥咱们这里会有这么多<div>

<div>标签 就是块标签,将网页中规划出一块区域进行显示内容

下面我将用一些代码来进行演示:

<!DOCTYPE html>

<html>

<head>

<meta charset="utf-8">

<title>过度引用</title>

<style>

div{

background-color:pink;

display: inline-block;

width: 100px;

height:100px;

}</style>

</head>

<body>

<div>

</div>

</body>

</html>

这里的div 的格式完全可以按照自己的喜好进行设置大小背景色等等以及是否独占一行等等都是可以做到的

结果如下:

2、<ul> 标签<ol>标签 <li>标签

定义列表的元素 当然在csdn的门户是用ul嵌套li做的也就是最上面的一列

现在我们来试试看去使用requests模块去爬取一下csdn

import requests

resp = requests.get(url='https://www.csdn.net')

print(resp.text)

结果如下:

其实就是把源代码给拿过来了

关于动态数据的加载等下次再说。

相关推荐
竹林8181 小时前
用 wagmi v2 + viem 监听链上事件,我踩了三天坑终于搞懂了实时日志与历史补全
javascript
Momo__1 小时前
VueUse createReusableTemplate —— 单文件组件内的模板复用神器
前端·vue.js
只一1 小时前
😭从回调地狱到 async/await:一文打通 Ajax 与 JS 异步编程
javascript
程序员小富1 小时前
我开源了一个开发者专属的智能 JSON 工具,得到了媳妇高度认可
前端·vue.js·后端
小小小小宇1 小时前
程序员如何给 LLM 装工具以及看懂推理过程
前端
写代码的皮筏艇1 小时前
React中的forwardRef
前端·react.js·面试
槑有老呆1 小时前
花三个月工资请了个 AI 程序员,结果它连青岛啤酒股价都查不了
前端
风骏时光牛马1 小时前
Verilog开发常见问题汇总解析
前端
子兮曰1 小时前
AI Coding Method Map:一张图看懂 AI 编程的完整链路
前端·人工智能·后端