IO 多路复用、网络协议与爬虫抓包介绍

文章目录

一、IO多路复用

二、网络数据包处理的细节

三、应用层协议

1.单元信息表示方式

1.1行文本

1.2html

1.3xml

1.4json

1.5protobuf

2.现成协议

2.1HTTP协议

四、代理

五、抓包

六、爬虫


一、IO多路复用

一个线程一时连接管理着多个socket 通过操作系统****全局地同时监听所有socket的IO状态同时等待多个连接 选出其一最早有数据绕阻非顺地一个个执行


二、网络数据包处理的细节

  1. 一个线程在 同一瞬间 只能在执行某一行
  2. 多个客户端发送 多个请求 可以同一时刻到达服务器
  3. 网卡一个个地接收
  4. 内核放进各自socket的接收缓冲区
  5. epoll一次告诉线程 各个socket的IO状况
  6. 线程 ****IO复用选择接收缓冲区有请求数据的socket ,一个个地处理写入它们socket的发送缓冲区
  7. 操作系统有一好就发它通过网卡返回响应

三、应用层协议

1.单元信息表示方式

1.1行文本

分隔符 + 值内容

|--------------------------------|
| 麦当劳, 商家图片3.jpg, 5.0, 10, 快餐\n |


1.2html

成对起始 固定键说明 + 成对<>分隔符 + 值内容

html 复制代码
<table border="1">
  <tr>
    <td>商家名称</td>
    <td>图片</td>
    <td>评分</td>
    <td>销量</td>
    <td>分类</td>
  </tr>
  <tr>
    <td>麦当劳</td>
    <td><img src="商家图片3.jpg" width="80"></td>
    <td>5.0</td>
    <td>10</td>
    <td>快餐</td>
  </tr>
</table>

1.3xml

成对起始 自定义键说明 + 成对<>分隔符 + 值内容

XML 复制代码
<merchant>
    <name>麦当劳</name>
    <image>商家图片3.jpg</image>
    <score>5.0</score>
    <sales>10</sales>
    <category>快餐</category>
</merchant>

1.4json

一个自定义键说明 + 分隔符 + 值内容

javascript 复制代码
{
  "name": "麦当劳",
  "image": "商家图片3.jpg",
  "score": 5.0,
  "sales": 10,
  "category": "快餐"
}

1.5protobuf

二进制值内容


2.现成协议

2.1HTTP协议

约定 在应用层 构成网页的 数据格式

  1. 请求和响应****一一对应
  2. 文本内容html单元信息

四、代理

中间 的代理 参与两者的发接工作


五、抓包

抓包工具可以抓取 网络数据包的各部分


六、爬虫

抓包抓住请求响应 自己仿造发送

相关推荐
求学中--21 小时前
数据持久化与网络请求全攻略:Preferences、关系数据库、HTTP实战
网络·网络协议·http
yantaohk21 小时前
高层住宅只有一根光纤入户,能不能多装几条宽带跑PCDN?
网络
路溪非溪1 天前
关于wifi和蓝牙的共存问题
网络
IPDEEP全球代理1 天前
美国原生IP是什么意思?有什么用?
网络·网络协议·tcp/ip
威联通网络存储1 天前
威联通全闪 iSCSI 底座:虚拟化 MPIO 与 VAAI 卸载解析
网络
ACP广源盛139246256731 天前
磐石 100 :IX6012 :ASM1812@ACP#国产 PCIe 2.0 交换芯片,轻量级算力扩展应用分享
大数据·linux·运维·网络·人工智能·嵌入式硬件·电脑
H Journey1 天前
网络编程:服务器监听+非阻塞设置
服务器·网络·服务器监听+非阻塞设置
Promise微笑1 天前
开关柜局放国产替代浪潮下:开关柜局放监测技术与实践深度解析
网络·数据库·人工智能
yyuuuzz1 天前
国际云服务商运维常见问题梳理
运维·服务器·网络·github·aws
广然1 天前
eNSP Pro 实战:华为交换机堆叠,两台变一台
服务器·网络·华为