1、协议的通俗理解

[1.1 理解协议](#1.1 理解协议)

2.应用层

[2.1 http协议](#2.1 http协议)

[2.2 HTTP的方法](#2.2 HTTP的方法)

[2.3 HTTP的状态码](#2.3 HTTP的状态码)

[2.4 HTTP常见Header](#2.4 HTTP常见Header)

3、传输层

[3.1 端口号](#3.1 端口号)

[3.1.1 端口号范围划分](#3.1.1 端口号范围划分)

[3.1.2 netstat](#3.1.2 netstat)

[3.1.3 认识知名端口号(Well-Know Port Number)](#3.1.3 认识知名端口号(Well-Know Port Number))

[3.2 UDP协议](#3.2 UDP协议)

[3.2.1 UDP协议端格式](#3.2.1 UDP协议端格式)

[3.2.2 UDP的特点](#3.2.2 UDP的特点)

[3.2.3 基于UDP的应用层协议](#3.2.3 基于UDP的应用层协议)

[3.3 TCP协议](#3.3 TCP协议)

[3.3.1 TCP协议段格式](#3.3.1 TCP协议段格式)

[3.3.2 确认应答(ACK)机制](#3.3.2 确认应答(ACK)机制)

[3.3.3 超时重传机制](#3.3.3 超时重传机制)

[3.3.4 连接管理机制](#3.3.4 连接管理机制)

[3.3.5 滑动窗口](#3.3.5 滑动窗口)

[3.3.6 流量控制](#3.3.6 流量控制)

[3.3.7 拥塞控制](#3.3.7 拥塞控制)

[3.3.8 延迟应答](#3.3.8 延迟应答)

[3.3.9 捎带应答](#3.3.9 捎带应答)

[3.4 面向字节流](#3.4 面向字节流)

[3.4.1 粘包问题](#3.4.1 粘包问题)

[4.5 TCP异常情况](#4.5 TCP异常情况)

1、协议的通俗理解

在之前的几篇文章中，我们一起看过一些关于linux中关于网络的系统调用，就已经可以写一个简易的服务器了，

那我们在别人面前提起网络，都会听到一个字眼叫做协议，在网络中的每一层中，都有协议，在上一篇文章中，我们也说过，协议就是两台主机在通信的时候，约定好的通信格式，多方都遵守这个通信格式来通信的话，就可以实现正确通信，可以拿到对方发给我的正确信息。

我们可以模拟一个协议，对协议进行一个通俗一点的理解

1.1 理解协议

我们可以写一个服务器版本的计算器，

由于呢，在服务器端和用户端之间进行通信，存在有一些问题，所以我们对问题先进行研究，

用户端发起请求，要计算这个式子的值，那用户端是不是要以某种格式发送，因为数据在网络中都是以字符串的形式进行传输的，那用户端向服务器端发送的数据格式是不是要被服务器端知道，这样才能解析出正确的式子，

服务器端计算完之后，将结果返回给用户端的时候，是不是也要以某种形式进行组织，客户端才能将数据进行正确解析。

所以，客户端就和服务器端形成一下约定：

（1）客户端发起的请求数据必须用空格将数据隔开，比如"x + y",x和+之间、+和y之间，必须存在一个空格，方便服务器端进行解析计算，

（2）服务器端返回的数据中，须存在计算状态码，若请求式子合理且可以进行运算，状态码置为0，否则置为1，并且，状态码和计算结果中间也要用空格隔开，如"0 10"；

如上，这就是一个小小的协议约定，只不过是我们自己约定的，根据我们要设计的计算器服务定制的一套协议。

下面是关于服务器版本计算器的核心代码：

cpp 复制代码

void calcullator(int serviseSock)
{
    std::string inbuffer;
    while (1)
    {
        // 接收字符流，写入inbuffer缓冲区中，
        if (!cal::cal_server::Recv(serviseSock, inbuffer))
        {
            break;
        }
        
        // 进行反序列化，拿到运算符和运算数
        std::size_t left =  str.find(SPACE);
        if (left == std::string::npos){
            return false;
        }
        std::size_t right = str.rfind(SPACE);
        if (right == std::string::npos){
            std::cout << "输入格式有误" << std::endl;
            return ;
        }
        int _x = atoi(str.substr(0,left).c_str());
        int _y = atoi(str.substr(right + SPACE_LEN).c_str());
        if(left + SPACE_LEN > str.size()) {
            std::cout << "输入格式有误" << std::endl;
            return;
        }
        char _op = str[left + SPACE_LEN];
        
        // 进行运算，使用code接收返回码
        int code = 0;
        int result = calculate(_x,_y,_op,&code);
        
        // 进行序列化
        std::string str;
        str += std::to_string(code);
        str += SPACE;
        str += std::to_string(result);
        return str;

        //进行发送
        cal::cal_server::Send(serviseSock, str);
    }
}

我们测试发现，这样是可以运行的，但是，这个程序其实还是存在漏洞的：

如果说，这个服务器被访问的很频繁，那么服务器端在进行读取的时候，就会有问题，这是因为在服务器所调用的系统接口底层，他会有一个收发缓冲区，如果请求过多，造成了堆积，那么上面写的代码就会导致数据的粘包问题，就是一个用户的请求和下一个用户的请求粘合了，读取太多，或者上一次读取太多，导致这一次只读取了一半，比如："1+255-44100+" 、"200100" 、"-100"。

所以我们需要在制定一个协议：

我们需要在原本协议约定的基础上再加上能够区分一个报文是否为完整报文的信息：

"length/nx + y/n" 、"length/ncode result/n"

例如："9/n100 + 100/n" 、 "5/n0 200/n"

length代表这个报文的长度，两个换行符中间的是报文，

如果在报文解析的时候，格式不符合协议约定，那么就需要重新读取缓冲区里的数据，不多拿，不少拿

下来我们进行修改实现

cpp 复制代码

void calcullator(int serviseSock)
{
    std::string inbuffer;
    while (1)
    {
        // 接收字符流
        if (!cal::cal_server::Recv(serviseSock, inbuffer))
        {
            break;
        }
        // 分析字符流，如果没有拿到完整报文，就对缓冲区不作修改，
        // 如果缓冲区内不知一份报文，就只拿一份进行处理
        std::string package = Decode(inbuffer);
        if (package.empty())
        {
            continue;
        }
        // 拿到了一个完整的报文
        // 进行反序列化
        request req;
        req.Deserialize(package);
        // 进行运算
        response res = calculate(req);
        // 进行序列化
        std::string res_string = res.Serialize();
        res_string = Encode(res_string);
        cal::cal_server::Send(serviseSock, res_string);
    }
}

进行报文解析封装和包装的方法：

cpp 复制代码

#include <iostream>
#include <string>
#include <cstring>

#define SPACE " "
#define SPACE_LEN strlen(SPACE)
#define SEP "\n"
#define SEP_LEN strlen(SEP)

std::string Decode(std::string & buffer) {
    size_t pos = buffer.find(SEP);
    if (pos == std::string::npos){
        return "";
    }
    int len = atoi(buffer.substr(0, pos).c_str());
    int surplus = buffer.size() - pos -  2 * SEP_LEN;
    if (surplus >= len) {
        //说明有完整的报文
        buffer.erase(0,pos + SEP_LEN);
        std::string str = buffer.substr(0,len);
        buffer.erase(0,len + SEP_LEN);
        return str;
    }
    return "";
}
std::string Encode(std::string & s) {
    std::string new_package = std::to_string(s.size());
    new_package += SEP;
    new_package += s;
    new_package += SEP;
    return new_package;
}


class request{

public:
    request(){}
    request(int x,int y,char op):_x(x),_y(y),_op(op) {}
    ~request(){}

    std::string Serialize() {
        std::string str;
        str += std::to_string(_x);
        str += SPACE;
        str += _op;
        str += SPACE;
        str += std::to_string(_y);
        return str;
    }

    bool Deserialize(std::string &str) {
        std::size_t left =  str.find(SPACE);
        if (left == std::string::npos){
            return false;
        }
        std::size_t right = str.rfind(SPACE);
        if (right == std::string::npos){
            return false;
        }
        _x = atoi(str.substr(0,left).c_str());
        _y = atoi(str.substr(right + SPACE_LEN).c_str());
        if(left + SPACE_LEN > str.size()) {
            return false;
        }
        _op = str[left + SPACE_LEN];
        return true;
    }

public:
    int _x;
    int _y;
    char _op;
};
class response{

public:
    response(){}
    response(int code, int result):_code(code),_result(result) {}
    ~response(){}

    std::string Serialize() {
        std::string str;
        str += std::to_string(_code);
        str += SPACE;
        str += std::to_string(_result);
        return str;
    }
    bool Deserialize(std::string &str) {
        std::size_t pos =  str.find(SPACE);
        if (pos == std::string::npos){
            return false;
        }
        _code = atoi(str.substr(0,pos).c_str());
        _result = atoi(str.substr(pos + SPACE_LEN).c_str());
        return true;
    }

public:
    int _code;
    int _result;
};

相信通过上面的例子，我们就对协议就有了稍微深刻一点的理解了。

2.应用层

2.1 http协议

在我们上网的时候，浏览器地址框内的地址前面，都会有http://或者https://的字符，这个就是我们在应用层中的一些协议了，就和上面我们举的例子差不多

认识URL

平时我们俗称的 "网址" 其实就是说的 URL

下面为了方便探讨http协议，我们可以写一个简易的http服务器，用以获取http的请求：

cpp 复制代码

void httpServerRequest(int serviseSock)
{
    std::string inbuffer;

    if (!HttpServer::Recv(serviseSock, inbuffer))
    {
        exit(10);
    }
    std::cout << inbuffer << std::endl;
}

运行起来：

使用浏览器访问我们所写的服务器：

这样我们就获取了http的一个请求：

我们还可以通过抓包工具抓取我们刚刚的请求：

http请求：

首行: [方法] + [url] + [版本]

Header: 请求的属性, 冒号分割的键值对;每组属性之间使用\n分隔;遇到空行表示Header部分结束

Body: 空行后面的内容都是Body. Body允许为空字符串. 如果Body存在, 则在Header中会有一个Content-Length属性来标识Body的长度;

HTTP响应

首行: [版本号] + [状态码] + [状态码解释]

Header: 请求的属性, 冒号分割的键值对;每组属性之间使用\n分隔;遇到空行表示Header部分结束

Body: 空行后面的内容都是Body. Body允许为空字符串. 如果Body存在, 则在Header中会有一个

Content-Length属性来标识Body的长度; 如果服务器返回了一个html页面, 那么html页面内容就是在body中.

2.2 HTTP的方法

2.3 HTTP的状态码

最常见的状态码, 比如 200(OK), 404(Not Found), 403(Forbidden), 302(Redirect, 重定向), 504(Bad Gateway)

Content-Type: 数据类型(text/html等)

Content-Length: Body的长度

Host: 客户端告知服务器, 所请求的资源是在哪个主机的哪个端口上;

User-Agent: 声明用户的操作系统和浏览器版本信息;

referer: 当前页面是从哪个页面跳转过来的;

location: 搭配3xx状态码使用, 告诉客户端接下来要去哪里访问;

Cookie: 用于在客户端存储少量信息. 通常用于实现会话(session)的功能;

3、传输层

负责数据能够从发送端传输接收端.

3.1 端口号

端口号(Port)标识了一个主机上进行通信的不同的应用程序;

3.1.1 端口号范围划分

0 - 1023: 知名端口号, HTTP, FTP, SSH等这些广为使用的应用层协议, 他们的端口号都是固定的.

1024 - 65535: 操作系统动态分配的端口号. 客户端程序的端口号, 就是由操作系统从这个范围分配的.

在TCP/IP协议中, 用 "源IP", "源端口号", "目的IP", "目的端口号", "协议号" 这样一个五元组来标识一个通信(可以通过netstat -n查看);

3.1.2 netstat

netstat是一个用来查看网络状态的重要工具.

语法：netstat [选项]

功能：查看网络状态

常用选项：

n 拒绝显示别名，能显示数字的全部转化成数字

l 仅列出有在 Listen (监听) 的服務状态

p 显示建立相关链接的程序名

t (tcp)仅显示tcp相关选项

u (udp)仅显示udp相关选项

a (all)显示所有选项，默认不显示LISTEN相关

pidof

在查看服务器的进程id时非常方便.

语法：pidof [进程名]

功能：通过进程名, 查看进程id

3.1.3 认识知名端口号(Well-Know Port Number)

有些服务器是非常常用的, 为了使用方便, 人们约定一些常用的服务器, 都是用以下这些固定的端口号:

ssh服务器, 使用22端口

ftp服务器, 使用21端口

telnet服务器, 使用23端口

http服务器, 使用80端口

https服务器, 使用443

执行下面的命令, 可以看到知名端口号

bash 复制代码

cat /etc/services

3.2 UDP协议

3.2.1 UDP协议端格式

16位UDP长度, 表示整个数据报(UDP首部+UDP数据)的最大长度;

如果校验和出错, 就会直接丢弃;

3.2.2 UDP的特点

UDP传输的过程类似于寄信.

无连接: 知道对端的IP和端口号就直接进行传输, 不需要建立连接;

不可靠: 没有确认机制, 没有重传机制; 如果因为网络故障该段无法发到对方, UDP协议层也不会给应用层返回任何错误信息;

面向数据报: 不能够灵活的控制读写数据的次数和数量;

面向数据报

应用层交给UDP多长的报文, UDP原样发送, 既不会拆分, 也不会合并;

用UDP传输100个字节的数据:

如果发送端调用一次sendto, 发送100个字节, 那么接收端也必须调用对应的一次recvfrom, 接收100个字节; 而不能循环调用10次recvfrom, 每次接收10个字节;

UDP的缓冲区

UDP没有真正意义上的发送缓冲区. 调用sendto会直接交给内核, 由内核将数据传给网络层协议进行后续的传输动作;

UDP具有接收缓冲区. 但是这个接收缓冲区不能保证收到的UDP报的顺序和发送UDP报的顺序一致; 如果缓冲区满了, 再到达的UDP数据就会被丢弃;

UDP的socket既能读, 也能写, 这个概念叫做全双工

UDP使用注意事项

我们注意到, UDP协议首部中有一个16位的最大长度. 也就是说一个UDP能传输的数据最大长度是64K(包含UDP首部).

然而64K在当今的互联网环境下, 是一个非常小的数字.

如果我们需要传输的数据超过64K, 就需要在应用层手动的分包, 多次发送, 并在接收端手动拼装;

3.2.3 基于UDP的应用层协议

NFS: 网络文件系统

TFTP: 简单文件传输协议

DHCP: 动态主机配置协议

BOOTP: 启动协议(用于无盘设备启动)

DNS: 域名解析协议

当然, 也包括你自己写UDP程序时自定义的应用层协议;

3.3 TCP协议

TCP全称为 "传输控制协议(Transmission Control Protocol"). 人如其名, 要对数据的传输进行一个详细的控制;

3.3.1 TCP协议段格式

源/目的端口号: 表示数据是从哪个进程来, 到哪个进程去;

4位TCP报头长度: 表示该TCP头部有多少个32位bit(有多少个4字节); 所以TCP头部最大长度是15 * 4 = 60

6位标志位:

URG: 紧急指针是否有效

ACK: 确认号是否有效

PSH: 提示接收端应用程序立刻从TCP缓冲区把数据读走

RST: 对方要求重新建立连接; 我们把携带RST标识的称为复位报文段

SYN: 请求建立连接; 我们把携带SYN标识的称为同步报文段

FIN: 通知对方, 本端要关闭了, 我们称携带FIN标识的为结束报文段

16位校验和: 发送端填充, CRC校验. 接收端校验不通过, 则认为数据有问题. 此处的检验和不光包含TCP首部, 也包含TCP数据部分.

16位紧急指针: 标识哪部分数据是紧急数据;

3.3.2 确认应答(ACK)机制

TCP将每个字节的数据都进行了编号. 即为序列号.

每一个ACK都带有对应的确认序列号, 意思是告诉发送者, 我已经收到了哪些数据; 下一次你从哪里开始发.

3.3.3 超时重传机制

主机A发送数据给B之后, 可能因为网络拥堵等原因, 数据无法到达主机B;

如果主机A在一个特定时间间隔内没有收到B发来的确认应答, 就会进行重发;

但是, 主机A未收到B发来的确认应答, 也可能是因为ACK丢失了;

因此主机B会收到很多重复数据. 那么TCP协议需要能够识别出那些包是重复的包, 并且把重复的丢弃掉.这时候我们可以利用前面提到的序列号, 就可以很容易做到去重的效果.

最理想的情况下, 找到一个最小的时间, 保证 "确认应答一定能在这个时间内返回".

但是这个时间的长短, 随着网络环境的不同, 是有差异的.

如果超时时间设的太长, 会影响整体的重传效率;

如果超时时间设的太短, 有可能会频繁发送重复的包;

TCP为了保证无论在任何环境下都能比较高性能的通信, 因此会动态计算这个最大超时时间.

Linux中(BSD Unix和Windows也是如此), 超时以500ms为一个单位进行控制, 每次判定超时重发的超时时间都是500ms的整数倍.

如果重发一次之后, 仍然得不到应答, 等待 2*500ms 后再进行重传.

如果仍然得不到应答, 等待 4*500ms 进行重传. 依次类推, 以指数形式递增.

累计到一定的重传次数, TCP认为网络或者对端主机出现异常, 强制关闭连接.

3.3.4 连接管理机制

在正常情况下, TCP要经过三次握手建立连接, 四次挥手断开连接

服务端状态转化:

计算机网络中的应用层和传输层（http/tcp）

1、协议的通俗理解

1.1 理解协议

2.应用层

2.1 http协议

2.2 HTTP的方法

2.3 HTTP的状态码

2.4 HTTP常见Header

3、传输层

3.1 端口号

3.1.1 端口号范围划分

3.1.2 netstat

3.1.3 认识知名端口号(Well-Know Port Number)

3.2 UDP协议

3.2.1 UDP协议端格式

3.2.2 UDP的特点

3.2.3 基于UDP的应用层协议

3.3 TCP协议

3.3.1 TCP协议段格式

3.3.2 确认应答(ACK)机制

3.3.3 超时重传机制

3.3.4 连接管理机制