实时通信对比，一场MCP协议的技术革命

在大模型应用爆发的今天，"打字机效应"式的流式输出已成为用户体验的标准配置。它不仅能有效缓解大模型生成长文本时的等待焦虑，更能为实时交互场景（如AI助手、代码补全）提供即时反馈。然而，实现这一效果的技术路径并非唯一。本文将深入剖析业界主流的三种实现方式：SSE、Streamable Http 与 Stdio。

一、核心概念与工作原理

在深入比较之前，我们首先需要理解这三种方式分别是什么。

方式一：SSE

全称：Server-Sent Events
本质：一种HTML5标准，允许服务器主动向客户端推送数据。它是基于HTTP协议的单向通信通道。
工作原理：客户端通过EventSource API与服务器建立长连接。服务器保持连接打开，并按照特定格式（data:、event:等字段）持续发送数据流，直到主动关闭连接。

方式二：Streamable Http

本质：这是一种设计模式而非具体协议。它利用HTTP/1.1的分块传输编码或HTTP/2的数据帧，在单个HTTP请求-响应周期内流式地返回数据。
工作原理：服务器在响应头中设置Transfer-Encoding: chunked，然后将响应体分成多个"块"逐个发送。客户端通过监听响应体的data事件来逐步接收数据。它比SSE更底层，没有预定义的消息格式。

方式三：Stdio

全称：Standard Input/Output
本质：一种进程间通信方式。它将AI模型（如Python脚本、C++程序）作为一个独立的子进程启动，通过标准输入流向其发送请求，并从标准输出流读取模型的流式响应。
工作原理：主进程（你的后端服务）创建一个子进程（AI模型进程），并获取其标准输入和输出流的管道。通过向stdin写入数据，并从stdout读取数据来实现通信。通常需要处理缓冲和序列化（如JSON Lines）。

二、三种方式对比

维度	SSE	Streamable Http	Stdio
协议/基础	基于HTTP的标准协议	基于HTTP的技术模式	操作系统的进程通信机制
通信方向	单向（服务器 -> 客户端）	单向（服务器 -> 客户端）	双向（可同时读写）
数据格式	有标准格式，如 data: ...\n\n	无标准格式，可自定义（如纯文本、JSON碎片）	无标准格式，通常是纯文本或JSON Lines
客户端实现	简单，使用标准 EventSource API	较灵活但也较复杂，使用 Fetch API 处理流	不直接面向客户端，需后端服务作为中介
开发复杂度	低，前后端都有现成标准	中，需要手动处理数据流的分块与拼接	高，需管理子进程生命周期、处理流阻塞和错误
适用场景	需要服务器向Web客户端主动推送消息的场景，如新闻推送、实时状态更新、AI文本流	需要高度自定义流格式或在不支持SSE的环境下使用，如API服务、非浏览器客户端	服务器内集成本地AI模型、封装AI推理进程、CI/CD管道中的工具调用
优点	1. 是Web标准，简单易用2. 自动重连机制3. 良好的浏览器支持	1. 非常灵活，无格式限制2. 兼容性极佳（只要是HTTP客户端）3. 可与现有HTTP认证机制无缝集成	1. 语言无关，可调用任何可执行程序2. 性能开销小，直接进程通信3. 隔离性好，模型崩溃不影响主服务
缺点	1. 仅支持服务器向客户端单向推送2. 有最大并发连接数限制（浏览器）3. 数据格式有要求	1. 需要手动实现消息边界和错误处理2. 客户端代码相对复杂3. 无自动重连	1. 不直接用于Web通信2. 需要处理进程管理和资源清理3. 跨平台可能遇到问题

三、实战代码片段对比

假设我们有一个生成笑话的AI API

方式一：SSE示例

服务器端

js 复制代码

app.get('/api/joke', (req, res) => {
  res.writeHead(200, {
    'Content-Type': 'text/event-stream',
    'Cache-Control': 'no-cache',
    'Connection': 'keep-alive',
  });

  const jokeParts = ['Why', 'did', 'the', 'AI', 'go', 'to', 'therapy?', 'It', 'had', 'too', 'many', 'layers', 'of', 'issues!'];

  jokeParts.forEach((part, index) => {
    // SSE 格式: `data: <content>\n\n`
    setTimeout(() => res.write(`data: ${part}\n\n`), index * 100);
  });

  setTimeout(() => {
    res.write('data: [DONE]\n\n'); // 发送结束信号
    res.end();
  }, jokeParts.length * 100);
});

客户端

js 复制代码

const eventSource = new EventSource('/api/joke');
eventSource.onmessage = (event) => {
  if (event.data === '[DONE]') {
    eventSource.close();
    return;
  }
  console.log(event.data); // 逐步打印: Why, did, the...
  // 将其追加到网页的DOM元素中
};

方式二：Streamable Http示例

服务器端

js 复制代码

app.get('/api/joke', (req, res) => {
  res.writeHead(200, {
    'Content-Type': 'text/plain', // 或 'application/x-ndjson'
    'Transfer-Encoding': 'chunked',
  });

  const jokeParts = [...]; // 同上

  jokeParts.forEach((part, index) => {
    setTimeout(() => {
      // 自定义格式，例如每块后面加个换行符作为分隔
      res.write(part + '\n');
    }, index * 100);
  });

  setTimeout(() => res.end(), jokeParts.length * 100);
});

客户端

js 复制代码

async function fetchJoke() {
  const response = await fetch('/api/joke');
  const reader = response.body.getReader();
  const decoder = new TextDecoder();

  while (true) {
    const { done, value } = await reader.read();
    if (done) break;
    const chunk = decoder.decode(value);
    // 按自定义分隔符（如换行）分割，可能一次收到多个块
    const parts = chunk.split('\n').filter(part => part.trim() !== '');
    parts.forEach(part => console.log(part)); // 逐步打印
  }
}

方式三：Stdio示例

服务器端

js 复制代码

import time
import sys

joke_parts = ['Why', 'did', 'the', 'AI', 'go', 'to', 'therapy?', 'It', 'had', 'too', 'many', 'layers', 'of', 'issues!']

for part in joke_parts:
    print(part, flush=True)  # flush=True 是关键，确保立即输出
    time.sleep(0.1)

Node服务

js 复制代码

const { spawn } = require('child_process');

app.get('/api/joke', (req, res) => {
  const pythonProcess = spawn('python', ['joke_generator.py']);

  pythonProcess.stdout.on('data', (data) => {
    // 收到来自子进程stdout的数据块
    const part = data.toString().trim();
    // 作为中介，可以选择用SSE或Streamable Http转发给客户端
    // 这里我们用简单的Streamable Http转发
    res.write(part + '\n');
  });

  pythonProcess.on('close', (code) => {
    res.end();
  });
});

四、选型建议

首选 SSE：当你的应用场景是Web浏览器需要从服务器实时接收数据时，SSE是实现AI流式输出的最佳选择。它简单、可靠且功能强大。
选择 Streamable Http：当你需要最大的灵活性，或者你的客户端是移动应用、命令行工具等非浏览器环境时，Streamable Http是更通用的方案。它也常用于需要严格自定义数据格式的API后端。
考虑 Stdio：当你的核心任务是在服务器端集成和封装一个本地AI模型（尤其是用Python、C++等编写，并非作为HTTP服务运行的模型）时，Stdio是底层、高效的解决方案。它不直接面向Web，而是作为后端服务内部的一个组件。

简而言之，SSE和Streamable Http解决了"如何将数据流从服务器送到客户端"的问题，而Stdio解决了"如何让后端服务与AI模型进程通信"的问题。在实际的AI应用中，你甚至可能会看到它们的组合使用，例如：使用Stdio与本地模型交互，然后使用SSE将结果流式推送给Web客户端。

本人正在打造技术交流群，欢迎志同道合的朋友一起探讨，一起努力，通过自己的努力，在技术岗位这条道路上走得更远。QQ群号：952912771 备注：技术交流即可通过！

加入技术群可以获取资料，含AI资料、Spring AI中文文档等，等你加入~