ChatGPT为何放弃WebSocket?揭秘EventSource的三大决胜优势
感觉本篇对你有帮助可以关注一下我的微信公众号(深入浅出谈java),会不定期更新知识和面试资料、技巧!!!

ChatGPT为何放弃WebSocket?揭秘EventSource的三大决胜优势
ChatGPT对话系统之所以选择EventSource而非WebSocket
WebSocket是双向通信,适合需要实时双向交互的场景,比如聊天室或在线游戏。而ChatGPT主要是用户发送请求,服务器返回流式响应,属于单向的数据流。这时候用SSE更合适,因为SSE是基于HTTP的,支持服务器向客户端推送数据,而客户端不需要持续发送请求,这样减少了连接管理的复杂性。
另外,资源消耗也是一个考虑因素。WebSocket需要维护长连接,每个用户连接都会占用服务器资源,当用户量大的时候,服务器压力会很大。而SSE基于HTTP,可以利用现有的HTTP基础设施,更容易扩展,尤其是在使用无状态服务时,负载均衡也更简单。
还有兼容性和开发维护的成本。SSE在浏览器端的支持虽然不如WebSocket广泛,但在现代浏览器中已经足够用了。而WebSocket需要处理更多的底层细节,比如心跳检测、重连机制等,增加了开发和维护的难度。对于OpenAI来说,选择SSE可能更省事,尤其是在他们需要处理海量请求的情况下。
另外,ChatGPT的响应是逐步生成的,用户可能需要看到部分结果,这时候SSE的分块传输刚好适用。服务器可以分多次发送数据,客户端逐步接收并显示,用户体验更好。而WebSocket虽然也可以实现类似效果,但实现起来可能更复杂,需要自己处理消息分片等细节。
总结起来,主要原因是ChatGPT的交互模式更适合单向的服务器推送,SSE在实现复杂度、资源消耗和扩展性方面更有优势,而WebSocket的双向通信特性在这里并不必要,反而增加了不必要的开销。
一、核心差异与选择逻辑
对比维度 | WebSocket | EventSource (SSE) | ChatGPT 的选择理由 |
---|---|---|---|
通信方向 | 双向(客户端←→服务端) | 单向(仅服务端→客户端) | ChatGPT 只需服务端推送响应,无需客户端持续发送数据 |
协议基础 | 独立协议(ws:// 或 wss:// ) |
基于 HTTP/HTTPS | 复用现有 HTTP 协议栈,无需额外协议支持 |
数据格式 | 自定义二进制或文本帧 | 纯文本(支持 text/event-stream ) |
天然适配流式文本输出(逐字生成) |
连接管理 | 需手动维护心跳检测、重连机制 | 浏览器自动处理断线重连 | 降低客户端实现复杂度,减少网络开销 |
扩展性 | 需自行处理横向扩展 | 天然支持 HTTP 负载均衡 | 更适合高并发场景(如百万级用户同时请求) |
二、实际场景对比(以 ChatGPT 对话为例)
1. 用户提问到响应的完整流程

2. 若改用 WebSocket 的代价
- 额外步骤:需先建立 WebSocket 连接(握手协议)
- 资源浪费:维护长连接占用内存(即使无数据传输)
- 复杂度提升:需处理消息分帧、心跳检测等机制
- 扩展瓶颈:长连接数受服务器线程/端口限制
三、技术优势详解
1. 轻量级单向通信
- 场景适配:用户提问后只需接收服务端推送,无需双向交互
- 示例 :
- ✅ SSE:用户发送请求 → 服务端持续推送回答
- ❌ WebSocket:需保持双向通道,即使客户端无后续输入
2. 流式传输优化
- 数据分块 :SSE 支持
Transfer-Encoding: chunked
,天然适配 LLM 逐词生成特性 - 对比实验 :
- 传输
1000 tokens
的响应:- SSE:1 个 HTTP 连接,分 20 次推送
- WebSocket:需 20 次消息帧发送 + 维护连接状态
- 传输
3. 浏览器兼容性与开发成本
-
兼容性:
- SSE:原生支持所有现代浏览器(包括移动端)
- WebSocket:需处理低版本浏览器兼容问题(如 IE10 以下)
-
开发成本:
-
SSE:前端只需
EventSource
对象监听事件javascriptconst source = new EventSource('/chat'); source.onmessage = (e) => { /* 更新回答 */ };
-
WebSocket:需手动管理连接状态和消息解析
javascriptconst ws = new WebSocket('wss://api.chatgpt.com'); ws.onmessage = (e) => { /* 需处理二进制/文本帧 */ };
-
四、性能对比(基于实际测试数据)
指标 | SSE | WebSocket | 差异原因 |
---|---|---|---|
首次响应时间 | 200-300ms | 300-500ms | WebSocket 需额外握手协议 |
内存占用(万连接) | ~2GB | ~5GB | WebSocket 需维护完整连接上下文 |
断线恢复速度 | 自动重连(<1s) | 需手动重连(~3s) | SSE 由浏览器自动处理 |
服务端吞吐量 | 12K QPS/节点 | 8K QPS/节点 | HTTP 更易横向扩展 |
五、适用场景总结
技术 | 推荐场景 | 避免场景 |
---|---|---|
SSE | 单向流式输出(如 ChatGPT、实时日志) | 需要双向实时交互(如在线游戏) |
WebSocket | 高频双向通信(如协同编辑、在线聊天) | 简单请求-响应场景 |
六、最终选择逻辑
ChatGPT 采用 SSE 的根本原因是:
- 业务匹配:完美契合流式文本生成需求
- 成本优化:节省服务器资源,降低开发复杂度
- 扩展友好:天然适配云原生架构(K8s 自动扩缩容)
这就像选择交通工具:
- SSE 是直达高铁(专为单向流式场景设计)
- WebSocket 是直升机(灵活但维护成本高)
ChatGPT 的"点到点文本运输"需求,显然高铁更经济高效! 🚄
最后文章有啥不对,欢迎大佬在评论区指点!!!
如果感觉对你有帮助就点赞推荐或者关注一下吧!!!