【C/C++】web服务器项目开发总结【请求 | 响应

博客主页：花果山~程序猿-CSDN博客

文章分栏：Linux_花果山~程序猿的博客-CSDN博客

关注我一起学习，一起进步，一起探索编程的无限可能吧！让我们一起努力，一起成长！

[http 1.0与http 1.1](#http 1.0与http 1.1)

[区分URI & URL & URN](#区分URI & URL & URN)

五，技术要点

[1. http请求&响应](#1. http请求&响应)

[2. 请求方法](#2. 请求方法)

嗨！收到一张超美的图，愿你每天都能顺心！

一，背景

http 协议被广泛使用，从移动端， pc 端浏览器， http 协议无疑是打开互联网应用窗口的重要协议， http 在网络应用层中的地位不可撼动，是能准确区分前后台的重要协议。

二，目标

对 http 协议的理论学习，从零开始完成 web 服务器开发，坐拥下三层协议，从技术到应用。

三，基本描述

采用C/S 模型，编写支持中小型应用的 http ，并结合 mysql ，理解常见互联网应用行为，做完该项目，你可以从技术上完全理解从你上网开始，到关闭浏览器的所有操作中的技术细节。

四，技术特点

网络编程（TCP/IP协议, socket流式套接字，http协议）
多线程技术
cgi技术
shell脚本
线程池

项目定位：研发岗

开发环境：centos7 + vim/g++/vscode + c/c++

网络基本认识补充

web服务器（http服务器工作原理）

http 1.0与http 1.1

目前主流的浏览器使用http1.1

http1.0优点：

简单快速,HTTP服务器的程序规模小,因而通信速度很快。
灵活 ,HTTP允许传输任意类型的数据对象,正在传输的类型由Content-Type加以标记。
无连接 ,每次连接只处理一个请求。服务器处理完客户的请求，并收到客户的应答后，即断开连接。采用这种方式可以节省传输时间。(http/1.0具有的功能，http/1.1兼容)

http 协议每当有新的请求产生，就会有对应的新响应产生。协议本身并不会保留你之前的一切请求或者响应，这是为了更快的处理大量的事务，确保协议的可伸缩性。

http1.1的优化：可是，随着web的发展，因为无状态而导致业务处理 变的棘手起来。比如保持用户的登陆状态（由于无状态，所以每次访问不知道用户信息，而又不可能让用户每次登录）。
http/1.1 虽然也是无状态 的协议，但是为了保持状态的功能，引入了 cookie 技术。

区分URI & URL & URN

URI, 是 uniform resource identifier ，统一资源标识符，用来唯一的标识一个资源
URL, 是 uniform resource locator ，统一资源定位符，它是一种具体的 URI ，即 URL 可以用来标识一个资源，而且还指明了如何locate 这个资源。
URN,uniform resource name ，统一资源命名，是通过名字来标识资源，比如 mailto:javanet@java.sun.com 。

例如：

URI: /home/index.html
URL: www.xxx.com:/home/index.html

五，技术要点

1. http请求&响应

下面是对应的示意图

请求详细的：

响应详细的：

在此项目中对请求，响应报文头进行简化 ，代表大致即可，主要是首行和正文。

测试工具：telnet(linux)，postman(windows)

2. 请求方法

GET(多服务器请求资源):

GET 请求中的参数会被附加在 URL 后面，因此可以被浏览器缓存，并且可以在浏览历史中看到，也可能被记录在网络日志中。这使得 GET 请求不适合传输敏感信息。
有浏览器URL长度限制；
安全性较差；

POST（多向服务器上传数据）:

POST 请求的数据不会显示在 URL 中，也不会被缓存或保存在历史记录中，因此相对更安全。
数据在正文，大小没有URL限制；
正文信息，不会被URL记录，安全性较高；

等等其他请求方法用的少，感兴趣可以查查

3.http响应报文状态码设置

HTTP 状态码（ HTTP Status Code ）是用以表示服务器 HTTP 响应状态的 3 位数字代码 。客户端（浏览器）通过状态码，就可以知道服务
器端是否正确的处理的请求，如果不正确，是因为什么原因导致的（ 404 ）

如：

200 OK

404 资源未找到

具体状态码详细可以查看详细资料

4.CGI机制

CGI(Common Gateway Interface) 是 WWW 技术中最重要的技术之一，有着不可替代的重要地位。 CGI 是外部应用程序（CGI 程序）与 WEB 服务器之间的接口标准，是在 CGI 程序和 Web 服务器之间传递信息的过程。
浏览器除了从服务器下获得资源（网页，图片，文字等），有时候还有能上传一些东西（提交表单，注册用户之类的），看看我们目前的http只能进行获得资源，并不能够进行上传资源，所以目前 http 并不具有交互式。
为了让我们的网站能够实现交互式，我们需要使用CGI完成，时刻记着，我们目前是要写一个 http ，所以， CGI 的所有交互细节，都需要我们来完成。
理论上，可以使用任何语言来编写CGI 程序（如：java，php等以及脚本语言）。
实现原理图

CGI实现原理

我们知道带参数的GET和POST是携带数据的，处理数据是需要程序运行才能得到结果，server线程中执行程序的就有 execl程序替换法，将子进程替换为能处理数据的程序，
但execl是进程替换，server线程替换则会替换整个server进程，所以需要server线程fork出的子进程进行替换即可。
接下来，需要进程通信，传递从请求中获取的参数，我们可以通过匿名管道法（接口：pipe）
我们知道进程替换会保留原有的 文件描述符表，环境变量，信号处理程序（保留旧进程的信号处理方式）等
子进程创建好后，那子进程如何获取参数？
（1）环境变量传递
适合条件：参数量小，如带参的GET方法
接口： putenv 与 getenv来设置，读取环境变量
（2）进程间通信

适合条件：参数量大，如POST方法

而进行程序替换后，我们并不知道具体的管道描述符，因此在替换前，需要将pipe的输入输出重定向给标准输入输出，这样子进程只需要使用cout（1）,cin（0）即可与向父进程（server线程）进行进程间通信，传递参数&结果。

期间也需要通过环境变量告知子进程参数大小。

CGI代码如下：

cpp 复制代码

int ProcessCGI()
    {
        std::string tmp_iurlb = ".";
        tmp_iurlb += address;
        int output[2]; // 线程发数据
        int inget[2]; // 线程接收结果
        pipe(output);
        pipe(inget);
        pid_t pd = fork();
        // 线程为主视角
        if (pd == 0)
        {
            // 子
            close(output[1]);
            close(inget[0]);
            // 1.接收数据,准备程序替换

            std::string room = "METHOD=";   //请求类型环境变量
            room += method;
            putenv((char *)room.c_str());

            std::string tmp;          // get参数 环境变量
            std::string room_length;  // post正文的长度环境变量

            if (method == "POST")
            {
                room_length = "CONTENT-LENHTH=";
                room_length += std::to_string(content_length);
                putenv((char *)room_length.c_str());
            }
            else if (method == "GET" && parameter.size() != 0)
            {
                tmp = "PARAMENTER=";
                tmp += parameter;
                putenv((char *)tmp.c_str());
            }
            // std::cerr << "debug : excel:" << address.c_str() <<  std::endl;
           
            // 约定：子进程只需从标准输入输出进行获取数据
            dup2(output[0], 0);
            dup2(inget[1], 1);

            execl(("." + address).c_str(), nullptr); // 疑问：既然通过环境变量来传参数，那buff到时候传过去的就是
            close(0);
            close(1);
            std::cerr << "GET EXECL FAIL:" << std::endl;
            return -1;
        }
        else if (pd > 0)
        {
            // 父
            close(output[0]);
            close(inget[1]);

            if (method == "POST");
            {
                const char* str = request_body.c_str();
                int total = 0;
                int size = 0;                
                while ((total <= content_length) && 
                 (size = write(output[1], str + total, request_body.size() - total) > 0))
                 {
                    total += size;
                 }
            }
            
            //接收CGI 返回值
            while (1)
            {
                 char x = 'g';
                 int set =  read(inget[0], &x, 1);
                 if ( x == '\n')
                    break;
                httpresponse.Respone_body.push_back(x);
            }
            // std::cout << "res CGI:" << httpresponse.Respone_body << std::endl;
            int status = 0;
            waitpid(pd, &status, 0); // 线程阻塞试等待
            if (WIFEXITED(status) == 0)
                Logmessage(WARN, "CGI exit with error code");

            close(output[1]);
            close(inget[0]);
            
            return 0;
        }

5.线程池优化

优化如下：

大量链接过来导致服务器内部进程或者线程暴增，进而导致服务器效率严重降低或者挂掉
节省链接请求到来时，创建线程的时间成本
让服务器的效率在一个恒定的稳定区间内（线程个数不增多，CPU调度成本不变）

本项目采用曾经线程池博客进行简单修改，参考博客：

线程池小项目【Linux & C/C++】(踩坑分享)_c++linux项目-CSDN博客

下面用一张示意图梳理一下流程：

线程池的方法支持中，小型程序，如需支持大程序并发，需要使用epoll，以及一些在外部通过文本控制参数。
六，项目扩展
1），技术扩展

实现支持http1.1，长连接，以及处理链接管理，黏包问题
支持更高并发的epoll
添加redis，mysql等
实现为该请求转发器（代理服务）
尝试打包成组件，实现http快速搭建

后续会结合其他项目来扩展。
2），应用扩展

个人简历
个人博客等等

项目代码

Linux: 从0到1 - Gitee.com

结语

本小节就到这里了，感谢小伙伴的浏览，如果有什么建议，欢迎在评论区评论，如果给小伙伴带来一些收获，请动动你发财的小手点个免费的赞，你的点赞和关注永远是博主创作的动力源泉。

【C/C++】web服务器项目开发总结【请求 | 响应 | CGI】

一，背景

二，目标

三，基本描述

四，技术特点

网络基本认识补充

web服务器（http服务器工作原理）

http 1.0与http 1.1

区分URI & URL & URN

五，技术要点

1. http请求&响应

2. 请求方法

3.http响应报文状态码设置

4.CGI机制

CGI实现原理

5.线程池优化

项目代码

结语