python网络爬虫(零)——认识网页结构

网页一般有三部分组成,分别是HTML(超文本标记语言)、CSS(层叠样式表)、JScript(活动脚本语言)

1.HTML

HTML是整个网页的结构,相当于整个网站的框架。带"<"">"符号都属于HTML的标签,并且标签都是成对出现的。

语法 内容
html 网页
body 内容
div 框架
p 段落
li 列表
hi 标题
a href 超链接

一个简单的html代码如下:

html 复制代码
<html>
<head>
<title>python3爬虫与数据清洗入门</title>
</head>
<body>
<div>
<p>python3爬虫与数据清洗入门</p>
</div>
<ul>
<li><a href="http://www.baidu.com">爬虫</a></li>
<li>数据清洗</li>
</ul>
</div>
</body>
</html>

程序执行效果如下:

2.CSS

CSS表示样式,表示将在下面引用一个CSS,并在CSS中定义了对应的样式。

3. JScript

JScript表示功能,交互的内容和各种特效都在JScript,JScript描述了网站中的各种功能。

如果把网页比喻为人体,那么html就是人的骨架,并且定义了人的五官;CSS表示人的外观细节,即五官长什么样子,JScript表示人的技能。

相关推荐
q***06297 分钟前
PHP进阶-在Ubuntu上搭建LAMP环境教程
开发语言·ubuntu·php
郝学胜-神的一滴3 小时前
Qt的QSlider控件详解:从API到样式美化
开发语言·c++·qt·程序人生
学困昇4 小时前
C++11中的{}与std::initializer_list
开发语言·c++·c++11
郝学胜-神的一滴4 小时前
Qt的QComboBox控件详解:从API到样式定制
开发语言·c++·qt·程序人生·个人开发
憧憬blog4 小时前
【Kiro开发集训营】拒绝“屎山”堆积:在 Kiro 中重构“需求-代码”的血缘关系
java·开发语言·kiro
FL171713144 小时前
Pytorch保存pt和pkl
人工智能·pytorch·python
n***i955 小时前
Java NIO文件操作
java·开发语言·nio
星释5 小时前
Rust 练习册 72:多米诺骨牌与回溯算法
开发语言·算法·rust
爱学习的小道长6 小时前
进程、线程、协程三者的区别和联系
python·ubuntu