python网络爬虫(零)——认识网页结构

网页一般有三部分组成,分别是HTML(超文本标记语言)、CSS(层叠样式表)、JScript(活动脚本语言)

1.HTML

HTML是整个网页的结构,相当于整个网站的框架。带"<"">"符号都属于HTML的标签,并且标签都是成对出现的。

语法 内容
html 网页
body 内容
div 框架
p 段落
li 列表
hi 标题
a href 超链接

一个简单的html代码如下:

html 复制代码
<html>
<head>
<title>python3爬虫与数据清洗入门</title>
</head>
<body>
<div>
<p>python3爬虫与数据清洗入门</p>
</div>
<ul>
<li><a href="http://www.baidu.com">爬虫</a></li>
<li>数据清洗</li>
</ul>
</div>
</body>
</html>

程序执行效果如下:

2.CSS

CSS表示样式,表示将在下面引用一个CSS,并在CSS中定义了对应的样式。

3. JScript

JScript表示功能,交互的内容和各种特效都在JScript,JScript描述了网站中的各种功能。

如果把网页比喻为人体,那么html就是人的骨架,并且定义了人的五官;CSS表示人的外观细节,即五官长什么样子,JScript表示人的技能。

相关推荐
Superstarimage1 小时前
使用conda创建python虚拟环境,并自定义路径
windows·python·conda
菜鸡码农,喵。1 小时前
已经装了pygame但pycharm显示没有该模块/软件包无法加载出来下载pygame
python·pycharm·pygame
小羊Linux客栈1 小时前
自动化:批量文件重命名
运维·人工智能·python·自动化·游戏程序
shykevin4 小时前
python开发Streamable HTTP MCP应用
开发语言·网络·python·网络协议·http
我不是程序猿儿4 小时前
【C#】 lock 关键字
java·开发语言·c#
漫路在线5 小时前
JS逆向-某易云音乐下载器
开发语言·javascript·爬虫·python
小辉懂编程5 小时前
C语言:51单片机实现数码管依次循环显示【1~F】课堂练习
c语言·开发语言·51单片机
醍醐三叶6 小时前
C++类与对象--2 对象的初始化和清理
开发语言·c++
Magnum Lehar7 小时前
3d游戏引擎EngineTest的系统实现3
java·开发语言·游戏引擎
Mcworld8577 小时前
java集合
java·开发语言·windows