IO 多路复用、网络协议与爬虫抓包介绍

文章目录

一、IO多路复用

二、网络数据包处理的细节

三、应用层协议

1.单元信息表示方式

1.1行文本

1.2html

1.3xml

1.4json

1.5protobuf

2.现成协议

2.1HTTP协议

四、代理

五、抓包

六、爬虫


一、IO多路复用

一个线程一时连接管理着多个socket 通过操作系统****全局地同时监听所有socket的IO状态同时等待多个连接 选出其一最早有数据绕阻非顺地一个个执行


二、网络数据包处理的细节

  1. 一个线程在 同一瞬间 只能在执行某一行
  2. 多个客户端发送 多个请求 可以同一时刻到达服务器
  3. 网卡一个个地接收
  4. 内核放进各自socket的接收缓冲区
  5. epoll一次告诉线程 各个socket的IO状况
  6. 线程 ****IO复用选择接收缓冲区有请求数据的socket ,一个个地处理写入它们socket的发送缓冲区
  7. 操作系统有一好就发它通过网卡返回响应

三、应用层协议

1.单元信息表示方式

1.1行文本

分隔符 + 值内容

|--------------------------------|
| 麦当劳, 商家图片3.jpg, 5.0, 10, 快餐\n |


1.2html

成对起始 固定键说明 + 成对<>分隔符 + 值内容

html 复制代码
<table border="1">
  <tr>
    <td>商家名称</td>
    <td>图片</td>
    <td>评分</td>
    <td>销量</td>
    <td>分类</td>
  </tr>
  <tr>
    <td>麦当劳</td>
    <td><img src="商家图片3.jpg" width="80"></td>
    <td>5.0</td>
    <td>10</td>
    <td>快餐</td>
  </tr>
</table>

1.3xml

成对起始 自定义键说明 + 成对<>分隔符 + 值内容

XML 复制代码
<merchant>
    <name>麦当劳</name>
    <image>商家图片3.jpg</image>
    <score>5.0</score>
    <sales>10</sales>
    <category>快餐</category>
</merchant>

1.4json

一个自定义键说明 + 分隔符 + 值内容

javascript 复制代码
{
  "name": "麦当劳",
  "image": "商家图片3.jpg",
  "score": 5.0,
  "sales": 10,
  "category": "快餐"
}

1.5protobuf

二进制值内容


2.现成协议

2.1HTTP协议

约定 在应用层 构成网页的 数据格式

  1. 请求和响应****一一对应
  2. 文本内容html单元信息

四、代理

中间 的代理 参与两者的发接工作


五、抓包

抓包工具可以抓取 网络数据包的各部分


六、爬虫

抓包抓住请求响应 自己仿造发送

相关推荐
寒秋花开曾相惜3 小时前
(学习笔记)第四章 处理器体系结构
linux·网络·数据结构·笔记·学习
SilentSamsara4 小时前
TCP 三次握手:连接建立失败的那些坑
运维·服务器·网络·网络协议·tcp/ip
门思科技8 小时前
LoRaWAN项目无需NS和平台?一体化网关如何简化部署与成本
服务器·网络·物联网
Bruce_Liuxiaowei8 小时前
顺藤摸瓜:一次从防火墙告警到设备实物的溯源实战
运维·网络·网络协议·安全
IpdataCloud9 小时前
效果广告中点击IP与转化IP不一致?用IP查询怎么做归因分析?
运维·服务器·网络
Deitymoon9 小时前
linux——TCPIP协议原理
linux·网络
米啦啦.9 小时前
HTTP,
网络·网络协议·http
kyle~10 小时前
SPOOLing 技术(假脱机技术)独占设备 → 虚拟共享设备
运维·服务器·网络
calm1310 小时前
通信网络单元的划分和级别调整方法分享
网络·安全·web安全
车载诊断技术10 小时前
2026年经济政策与投资方向核心
网络·安全·架构·汽车·系统工程与系统架构的内涵