IO 多路复用、网络协议与爬虫抓包介绍

文章目录

一、IO多路复用

二、网络数据包处理的细节

三、应用层协议

1.单元信息表示方式

1.1行文本

1.2html

1.3xml

1.4json

1.5protobuf

2.现成协议

2.1HTTP协议

四、代理

五、抓包

六、爬虫


一、IO多路复用

一个线程一时连接管理着多个socket 通过操作系统****全局地同时监听所有socket的IO状态同时等待多个连接 选出其一最早有数据绕阻非顺地一个个执行


二、网络数据包处理的细节

  1. 一个线程在 同一瞬间 只能在执行某一行
  2. 多个客户端发送 多个请求 可以同一时刻到达服务器
  3. 网卡一个个地接收
  4. 内核放进各自socket的接收缓冲区
  5. epoll一次告诉线程 各个socket的IO状况
  6. 线程 ****IO复用选择接收缓冲区有请求数据的socket ,一个个地处理写入它们socket的发送缓冲区
  7. 操作系统有一好就发它通过网卡返回响应

三、应用层协议

1.单元信息表示方式

1.1行文本

分隔符 + 值内容

|--------------------------------|
| 麦当劳, 商家图片3.jpg, 5.0, 10, 快餐\n |


1.2html

成对起始 固定键说明 + 成对<>分隔符 + 值内容

html 复制代码
<table border="1">
  <tr>
    <td>商家名称</td>
    <td>图片</td>
    <td>评分</td>
    <td>销量</td>
    <td>分类</td>
  </tr>
  <tr>
    <td>麦当劳</td>
    <td><img src="商家图片3.jpg" width="80"></td>
    <td>5.0</td>
    <td>10</td>
    <td>快餐</td>
  </tr>
</table>

1.3xml

成对起始 自定义键说明 + 成对<>分隔符 + 值内容

XML 复制代码
<merchant>
    <name>麦当劳</name>
    <image>商家图片3.jpg</image>
    <score>5.0</score>
    <sales>10</sales>
    <category>快餐</category>
</merchant>

1.4json

一个自定义键说明 + 分隔符 + 值内容

javascript 复制代码
{
  "name": "麦当劳",
  "image": "商家图片3.jpg",
  "score": 5.0,
  "sales": 10,
  "category": "快餐"
}

1.5protobuf

二进制值内容


2.现成协议

2.1HTTP协议

约定 在应用层 构成网页的 数据格式

  1. 请求和响应****一一对应
  2. 文本内容html单元信息

四、代理

中间 的代理 参与两者的发接工作


五、抓包

抓包工具可以抓取 网络数据包的各部分


六、爬虫

抓包抓住请求响应 自己仿造发送

相关推荐
123过去9 小时前
wifi-honey使用教程
linux·网络·测试工具
志栋智能10 小时前
低成本自动化巡检:7×24小时守护业务稳定
运维·网络·自动化
tang7778913 小时前
小红书平台用什么代理 IP 比较好?2026年3月实测数据 + 选型推荐
网络·爬虫·python·网络协议·tcp/ip·数据挖掘·ip
wheelmouse778815 小时前
网络排查基础与实战指南:Ping 与 Telnet
开发语言·网络·php
OxyTheCrack16 小时前
深入浅出TCP拥塞控制技术
网络·tcp/ip
龚礼鹏16 小时前
使用Perfetto进行Settings中网络热点开启后anr分析的整体流程记录
网络
23zhgjx-zgx16 小时前
华为ensp:配置Local区域的安全策略及ASPF配置
网络·华为
半壶清水16 小时前
[软考网规考点笔记]-局域网之HDLC 协议
网络·笔记·网络协议·考试
123过去17 小时前
pixiewps使用教程
linux·网络·测试工具·算法·哈希算法