3.python 爬虫基础HTTP原理2和网页基础

HTTP基本原理

响应:由服务器返回给客户端

  • 响应状态码
  • 响应头
  • 响应体

响应状态码

  • 可以根据状态码来判断服务器的响应状态
  • 200代表服务器正常响应,404代表页面未找到,500代表服务器内部发生错误

响应头

  • 包含了服务器对请求的应答信息,如contenttype,server,set-cookis等

响应体

  • 爬虫请求后解析的内容就是响应体,响应的正文数据,比如请求网页时,响应体是html代码;请求一张图片时,响应体为图片的二进制数据;json数据等

网页基础

网页的组成

  • HTML,CSS和JavaScript
  • Html相当于骨架,JavaScript相当于肌肉,css相当于皮肤
  • 三者结合起来形成完善的网页

HTML:超文本标记语言(hyper text markup language)

  • 结构,决定网页的结构和内容(是什么),<'head>元素标记头部文件,用<'title>元素标记网页名称,用<'body>元素标记网页主体,用<'table>元素标记表格等等,段落用p标签表示,布局通过布
    局标签div嵌套组合合成

CSS:层叠样式表(cascading stytle sheets)

  • 层叠指在html中引用了数个样式文件,并且样式发生冲突时候,浏览器能依据层叠顺序处理
  • 设定网页的表现样式(什么样子)。将网页样式提取出来方便更改某一类元素的样式,通过'<'style>元素插入CSS代码,<'style>元素放在<'head>元素中。网页中文字的大小,颜色,元素间距,排列等

JavaScript(JS)

  • Html和css只是实现静态信息,缺乏交互性。网页的交互和动画效果通过JavaScript实现
  • JavaScript通过单独的文件形式加载,后缀为js
  • Html中通过<'script>标签引入

我的第一个网页

html 复制代码
<html>
	<head>
		<style>
			ui{color:red}
			li{color:blue}
			hi{color:green}
		</style>
		<script>
				function myf(){alert('还是学习吧')}
			</script>
	
		<title>我的第一个网页
		</title>
	</head>

<body>
	<div>
		<h1>
			<ui>我的爱好</ui>
		</h1>
			<h2>
				<li>学习</li>
			</h2>
			<h2>
				<li>游戏</li>
			</h2>
				<h3>
					<a href="javascript:myf()">
					<hi>
						开始游戏
					</hi>
					</a>
				</h3>
	</div>
</body>


	
</html>
相关推荐
softshow10262 分钟前
Vue3 :封装 WebRTC 低延迟视频流与 WebSocket 实时状态驱动的大屏可视化
websocket·网络协议·webrtc
寻星探路14 分钟前
【深度长文】深入理解网络原理:TCP/IP 协议栈核心实战与性能调优
java·网络·人工智能·python·网络协议·tcp/ip·ai
上海云盾-高防顾问8 小时前
中小企业低成本渗透测试实操指南
网络协议·web安全·网络安全
桃花键神16 小时前
Undetectable接入亮数据代理IP深度测评:高效、稳定、适配性极强的海外多账号运营利器
网络协议·tcp/ip·php
野生技术架构师19 小时前
原来可以搭建一个HTTP服务
网络·网络协议·http
我想吃烤肉肉19 小时前
Playwright中page.locator和Selenium中find_element区别
爬虫·python·测试工具·自动化
lbb 小魔仙21 小时前
【Python】零基础学 Python 爬虫:从原理到反爬,构建企业级爬虫系统
开发语言·爬虫·python
努力变大白1 天前
借助AI零基础快速学会Python爬取网页信息-以天眼查爬虫为例
人工智能·爬虫·python
北京耐用通信1 天前
耐达讯自动化CANopen转Profibus网关:为风力发电场打造高可靠协议转换解决方案
人工智能·物联网·网络协议·自动化·信息与通信
北京耐用通信1 天前
耐达讯自动化CANopen转Profibus 网关:实现光伏逆变器无缝接入工业以太网的技术解析
网络·人工智能·物联网·网络协议·自动化·信息与通信