js fetch流式请求 AI动态生成文本,实现逐字生成渲染效果

  1. 开启流式请求:向后端接口发起普通的 fetch,它会返回一个包含 ReadableStream 的 Response 对象
  2. 获取流式读取器:调用 response.body.getReader() 获取一个 ReadableStreamDefaultReader 实例
  3. 循环读取数据块:在 while(true) 循环或 for await 中,通过 reader.read() 或 for await (const chunk of response.body.values()) 拿到 Uint8Array 块
  4. 解码并追加显示:使用 TextDecoder 将二进制数据解码成字符串,然后每获取一段就更新到页面上,无需等待完整返回
    MDN Web Docs

发起流式

复制代码
const response = await fetch('/api/chat', {
  method: 'POST',
  headers: { 'Content-Type': 'application/json' },
  body: JSON.stringify({ prompt: '你好,AI。' })
});
// response.body 即为 ReadableStream

fetch 默认支持流式响应,response.body 就是一个可读流

获取并使用 Reader

复制代码
const reader = response.body.getReader();  // 锁定流,获取 reader 实例
const decoder = new TextDecoder('utf-8'); // 用于将 Uint8Array 解码为字符串
let done = false;

while (!done) {
  const { value, done: streamDone } = await reader.read();
  done = streamDone;
  if (value) {
    const chunkText = decoder.decode(value, { stream: true });
    // 这里拿到了一段字符串 chunkText
    appendToPage(chunkText);
  }
}

reader.read() 每次返回一个包含 { value: Uint8Array, done: boolean } 的 Promise

传入 { stream: true } 可以确保多次调用 decode 时不会丢失跨块字符

将数据边读边显示

复制代码
<div id="chat"></div>
<script>
  function appendToPage(text) {
    const chat = document.getElementById('chat');
    chat.textContent += text;  // 或者用 chat.innerHTML += 转义/格式化后追加
  }
</script>

每次读取到 chunkText,就调用一次 appendToPage,实时更新 DOM,无需等到 done === true

React 示例

复制代码
import React, { useState, useEffect } from 'react';

function StreamingChat({ prompt }) {
  const [text, setText] = useState('');

  useEffect(() => {
    let cancelled = false;

    async function fetchStream() {
      setText('');
      const res = await fetch('/api/chat', { method: 'POST', body: JSON.stringify({ prompt }) });
      const reader = res.body.getReader();
      const decoder = new TextDecoder();
      let done = false;

      while (!done && !cancelled) {
        const { value, done: streamDone } = await reader.read();
        done = streamDone;
        if (value) {
          const chunk = decoder.decode(value, { stream: true });
          // 追加新内容
          setText(prev => prev + chunk);
        }
      }
    }

    fetchStream();
    return () => { cancelled = true; };
  }, [prompt]);

  return <pre style={{ whiteSpace: 'pre-wrap' }}>{text}</pre>;
}

export default StreamingChat;

拓展与注意事项

  • 错误处理:在 reader.read() 或 fetch 抛错时,捕获后展示重试选项
  • 性能优化:若数据量巨大,可考虑每累积一定长度再更新一次状态,避免过多重渲染
  • 兼容性:Safari 对流式 API 支持不完全,若需兼容可使用 polyfill 或退回到普通 fetch().then(res => res.text())
  • 流式 JSON:若后端返回的是以换行分隔的 JSON 对象流,可在 decoder.decode 后按 \n 切分并 JSON.parse 逐条处理
相关推荐
CodeCraft Studio几秒前
数据透视表控件DHTMLX Pivot v2.1发布,新增HTML 模板、增强样式等多个功能
前端·javascript·ui·甘特图
一把年纪学编程3 分钟前
【牛马技巧】word统计每一段的字数接近“字数统计”
前端·数据库·word
llc的足迹12 分钟前
el-menu 折叠后小箭头不会消失
前端·javascript·vue.js
九月TTS42 分钟前
TTS-Web-Vue系列:移动端侧边栏与响应式布局深度优化
前端·javascript·vue.js
Johnstons44 分钟前
AnaTraf:深度解析网络性能分析(NPM)
前端·网络·安全·web安全·npm·网络流量监控·网络流量分析
whatever who cares1 小时前
CSS3 伪元素(Pseudo-elements)大全
前端·css·css3
若愚67921 小时前
前端取经路——性能优化:唐僧的九道心经
前端·性能优化
积极向上的龙2 小时前
首屏优化,webpack插件用于给html中js自动添加异步加载属性
javascript·webpack·html
Bl_a_ck2 小时前
开发环境(Development Environment)
开发语言·前端·javascript·typescript·ecmascript
郝开2 小时前
扩展:React 项目执行 yarn eject 后的 scripts 目录结构详解
react.js·前端框架·react