面向大模型开发:在项目中使用 TOON 的实践与流式处理

目录

[面向大模型开发:在项目中使用 TOON 的实践与流式处理](#面向大模型开发:在项目中使用 TOON 的实践与流式处理)

[一、使用 npx 快速体验:将 JSON 转换为 TOON](#一、使用 npx 快速体验:将 JSON 转换为 TOON)

[二、项目中安装 TOON 依赖](#二、项目中安装 TOON 依赖)

1、安装命令

[2、使用 encode 将 JSON 转换为 TOON](#2、使用 encode 将 JSON 转换为 TOON)

[3、使用 encodeLines 进行流式处理](#3、使用 encodeLines 进行流式处理)

[4、使用 replacer 在编码阶段做数据处理](#4、使用 replacer 在编码阶段做数据处理)

三、结语


作者:watermelo37

CSDN优质创作者、华为云云享专家、阿里云专家博主、腾讯云"创作之星"特邀作者、火山KOL、支付宝合作作者,全平台博客昵称watermelo37。

一个假装是giser的coder,做不只专注于业务逻辑的前端工程师,Java、Docker、Python、LLM均有涉猎。


温柔地对待温柔的人,包容的三观就是最大的温柔。


面向大模型开发:在项目中使用 TOON 的实践与流式处理

TOON 入门到实战三部曲:

基础入门:TOON:一种为大模型设计的JSON压缩型数据结构

价值探究:探究TOON的价值边界:比JSON更优的大模型友好数据格式?

开发实战:面向大模型开发:在项目中使用 TOON 的实践与流式处理

前两篇文章中,我们已经介绍了 TOON 是什么,它的结构、特点和设计目标,也讨论了它的适用边界与实际收益。

这一篇将站在开发工程师的角度,聚焦两个更现实的问题:

  • 在项目中,如何快速使用 TOON

  • 当数据规模变大时,如何通过 TOON 配合流式处理,服务大模型输入

一、使用 npx 快速体验:将 JSON 转换为 TOON

如果只是想快速体验 TOON,而不想在项目中引入依赖,可以直接使用官方提供的 CLI 工具。

bash 复制代码
npx @toon-format/cli input.json -o output.toon

这个命令会读取本地目录内的 input.json,自动推断结构并输出对应的 .toon 文件。

具体操作为:新建一个文件夹,在其中创建一个 JSON 文件,并在地址栏直接输入 cmd 并回车:

输入上述指令,将 input.json 改成你实际的 JSON 文件名称,output.toon 改成你想要生成的文件名:

中途会问你是否继续,输入 y 并回车即可。最后生成了新的数据文件:

是不是很简单?

二、项目中安装 TOON 依赖

当你确认 TOON 确实适合你的数据结构后,就可以在项目中引入官方库。

1、安装命令

安装指令如下,根据自己的包管理工具三选一即可:

javascript 复制代码
# npm
npm install @toon-format/toon

# pnpm
pnpm add @toon-format/toon

# yarn
yarn add @toon-format/toon

2、使用 encode 将 JSON 转换为 TOON

在最常见的场景下,你可以直接在代码中完成转换:

javascript 复制代码
import { encode } from '@toon-format/toon'

const data = {
  users: [
    { id: 1, name: 'Alice', role: 'admin' },
    { id: 2, name: 'Bob', role: 'user' }
  ]
}

console.log(encode(data))
// users[2]{id,name,role}:
//   1,Alice,admin
//   2,Bob,user

3、使用 encodeLines 进行流式处理

在数据量较大时,一次性 encode 整个对象效率就不够了,这个时候就最好使用流式处理的方式,这正是 encodeLines 的使用场景。

javascript 复制代码
import { encodeLines } from '@toon-format/toon'

const largeData = await fetchThousandsOfRecords()

// Memory-efficient streaming for large data
for (const line of encodeLines(largeData)) {
  process.stdout.write(`${line}\n`)
}

这种方式对内存友好,不会一次性构建完整字符串,并且天然适合流式输出,可直接接 SSE / WebSocket / 流式 Prompt,非常适合 LLM 长上下文拼接。

4、使用 replacer 在编码阶段做数据处理

encode 方法还提供了一个 replacer 替换器,可以在转换的时候加入特殊的规则,比如隐藏特殊字段或者改变大小写等:

javascript 复制代码
import { encode } from '@toon-format/toon'

// Remove sensitive fields
const user = { name: 'Alice', password: 'secret', email: 'alice@example.com' }
const safe = encode(user, {
  replacer: (key, value) => key === 'password' ? undefined : value
})
// name: Alice
// email: alice@example.com

// Transform values
const data = { status: 'active', count: 5 }
const transformed = encode(data, {
  replacer: (key, value) =>
    typeof value === 'string' ? value.toUpperCase() : value
})
// status: ACTIVE
// count: 5

三、结语

TOON github仓库:https://github.com/toon-format/toon

从工程实践的角度来看,TOON 已经初具使用价值,它并不是一个停留在概念或论文层面的数据格式,而是已经具备了一定工具链、可直接落地到项目中的工程方案。在数据结构高度一致、数据量较大、需要频繁与大模型交互的场景中,TOON 提供了一种新的优化思路。

在未来的某一天,当你在做大模型相关开发时,发现模型效果已经难以通过 Prompt 调整或模型选择继续提升,而数据传输量、上下文长度、Token 消耗逐渐成为瓶颈,不妨试试 TOON。它可能无法彻底改变问题,但很可能在"效率"和"成本"这两个维度上,给你带来一次可量化的优化空间。

只有锻炼思维才能可持续地解决问题,只有思维才是真正值得学习和分享的核心要素。如果这篇博客能给您带来一点帮助,麻烦您点个赞支持一下,还可以收藏起来以备不时之需,有疑问和错误欢迎在评论区指出~

其他热门文章,请关注:

极致的灵活度满足工程美学:用Vue Flow绘制一个完美流程图

你真的会使用Vue3的onMounted钩子函数吗?Vue3中onMounted的用法详解

Web Worker:让前端飞起来的隐形引擎

测评:这B班上的值不值?在不同城市过上同等生活水平到底需要多少钱?

通过array.filter()实现数组的数据筛选、数据清洗和链式调用

DeepSeek:全栈开发者视角下的AI革命者

TreeSize:免费的磁盘清理与管理神器,解决C盘爆满的燃眉之急

通过Array.sort() 实现多字段排序、排序稳定性、随机排序洗牌算法、优化排序性能

高效工作流:用Mermaid绘制你的专属流程图;如何在Vue3中导入mermaid绘制流程图

通过MongoDB Atlas 实现语义搜索与 RAG------迈向AI的搜索机制

【前端实战】如何让用户回到上次阅读的位置?

前端实战:基于Vue3与免费满血版DeepSeek实现无限滚动+懒加载+瀑布流模块及优化策略

深入理解 JavaScript 中的 Array.find() 方法:原理、性能优势与实用案例详解

el-table实现动态数据的实时排序,一篇文章讲清楚elementui的表格排序功能

JavaScript双问号操作符(??)详解,解决使用 || 时因类型转换带来的问题

内存泄漏------海量数据背后隐藏的项目生产环境崩溃风险!如何避免内存泄漏

MutationObserver详解+案例------深入理解 JavaScript 中的 MutationObserver

JavaScript中通过array.map()实现数据转换、创建派生数组、异步数据流处理、DOM操作等

相关推荐
冬奇Lab几秒前
OpenClaw 源码精读(2):Channel & Routing——一条消息如何找到它的 Agent?
人工智能·开源·源码阅读
冬奇Lab1 分钟前
一天一个开源项目(第38篇):Claude Code Telegram - 用 Telegram 远程用 Claude Code,随时随地聊项目
人工智能·开源·资讯
ssshooter43 分钟前
看完就懂 useSyncExternalStore
前端·javascript·react.js
格砸1 小时前
从入门到辞职|从ChatGPT到OpenClaw,跟上智能时代的进化
前端·人工智能·后端
可观测性用观测云2 小时前
可观测性 4.0:教系统如何思考
人工智能
sunny8652 小时前
Claude Code 跨会话上下文恢复:从 8 次纠正到 0 次的工程实践
人工智能·开源·github
小笼包包仔2 小时前
OpenClaw 多Agent软件开发最佳实践指南
人工智能
Live000002 小时前
在鸿蒙中使用 Repeat 渲染嵌套列表,修改内层列表的一个元素,页面不会更新
前端·javascript·react native
柳杉2 小时前
使用Ai从零开发智慧水利态势感知大屏(开源)
前端·javascript·数据可视化
smallyoung2 小时前
AgenticRAG:智能体驱动的检索增强生成
人工智能