HTTP分析

  • 1.WebServer:

通过HTTP协议和客户端进行通信,接收,存储,处理HTTP请求,并且做出相应,给出图片,网页,视频,或者error。

  • 2.怎么通信:

IP+端口号,要TCP三次握手,然后生成HTTP请求报文,通过TCP/IP发送到服务器上。

  • 3.如何接收HTTP请求报文:

socket-->bind-->listen

客户端会connect正在listen的port

监听到的连接会排队等待被accept

每当listenfd listen到了新用户连接,都要告诉

并且要他accept,并且分配一个逻辑单元处理。

初级:一个新连接对应一个进程 一对一

中级:多进程,父进程fork给子进程

高级:多线程,或线程池

顶级:I/O多路复用 select poll epoll

cpp 复制代码
epoll可以1.listenfd    2.连接socket

但是I/O复用还是阻塞的,可以用线程池,

为每个就绪的fd分配一个池内线程来处理

epoll流程:create-->ctl注册-->wait

  • server处理三类:I/O事件、信号、定时事件

Reactor: I/O 多路复用监听事件,收到事件后,根据事件类型分配(Dispatch)给某个进程 / 线程。I/O处理单元就负责fd是否可读可写,处理还得是工作线程。
Proactor:来了事件,我操作系统来处理,处理完通知应用进程,异步。所有的I/O操作都给主线程和内核(os),工作线程只负责处理逻辑。

cpp 复制代码
本项目:同步I/O模拟Proactor
  • 4.如何处理、响应HTTP请求报文?

    用线程池(半同步版反应堆)来并发处理用户请求,listenfd上监听的通过accept接手之后,返回一个新的fd名为connfd用于和用户通信。之后再通过发现这个connfd上可读。就会把请求报文读进读缓存内,然后将指针插入线程池的请求队列中。

  • 5.什么是线程池,为什么要用个池子?数量怎么确定?

    就是个pthread类型的数组而已。

    create创建的m个线程

    都用来执行worker函数,来应对HTTP请求

    detech就可以脱离,会自动回收。

    加锁 加锁 加锁

    因为启动新线程需要性能开销的。

    线程数目限制因素就是CPU cores

    CPU密集型最好就pthread=cores

    IO密集就要pthread>cores

最佳线程数 =

CPUCores数 * 当前CPU的利用率 * (1 + CPU等待时间 / CPU处理时间)

  • 6.具体讲讲怎么处理HTTP请求:
cpp 复制代码
void http_conn::process() {
    HTTP_CODE read_ret = process_read();
    if(read_ret == NO_REQUEST) {
        modfd(m_epollfd, m_sockfd, EPOLLIN);
        return;
    }
    bool write_ret = process_write(read_ret);
    if(!write_ret)
        close_conn();
    modfd(m_epollfd, m_sockfd, EPOLLOUT);
}

我们可以发现,就是在connfd的读缓冲区内,有客户端发来的请求报文。有GET和POST,

GET:从服务器获取资源

POST:根据报文body对指定资源处理,留言

而上述的process_read函数就可以解析GET和POST。

而如何解析,通过主从状态机:

从状态机:只负责读报文的一行

主状态机:负责对从状态机读的那一行解析。

parse_request_line(text)--->

parse_headers(text);--->

parse_content(text);

解析请求行,请求头部,请求体。

具体GET的示例:就是输入了http://1.92.129.219:9006/之后返回一个html就已经是GET了

按了button,就会发送POST,POST账号和密码。(分析html代码 button的method="post")

相关推荐
YuMiao18 小时前
gstatic连接问题导致Google Gemini / Studio页面乱码或图标缺失问题
服务器·网络协议
不可能的是2 天前
前端 SSE 流式请求三种实现方案全解析
前端·http
Jony_3 天前
高可用移动网络连接
网络协议
chilix4 天前
Linux 跨网段路由转发配置
网络协议
DianSan_ERP5 天前
电商API接口全链路监控:构建坚不可摧的线上运维防线
大数据·运维·网络·人工智能·git·servlet
呉師傅5 天前
火狐浏览器报错配置文件缺失如何解决#操作技巧#
运维·网络·windows·电脑
gihigo19985 天前
基于TCP协议实现视频采集与通信
网络协议·tcp/ip·音视频
2501_946205525 天前
晶圆机器人双臂怎么选型?适配2-12寸晶圆的末端效应器有哪些?
服务器·网络·机器人
linux kernel5 天前
第七部分:高级IO
服务器·网络
数字护盾(和中)5 天前
BAS+ATT&CK:企业主动防御的黄金组合
服务器·网络·数据库