从扁平到层级：树形数据转换的工程化实践与设计哲学

最近在整理面试准备资料时，重新审视了一段"扁平列表与树形结构互转"的代码。这个问题在前端开发中太常见了------后端返回的组织架构、菜单权限、评论回复，往往都是扁平的 { id, parentId } 结构，而前端组件库需要的是嵌套的 { id, children: [] } 格式。

看似简单的数据转换，背后其实藏着不少设计思想。这篇文章记录了我对这个问题的重新思考：从算法实现到设计哲学，再到实际应用场景的权衡。

问题的起源:数据库与 UI 的矛盾

为什么会有扁平结构和树形结构的转换问题？根源在于数据存储与展示的天然矛盾。

数据库视角 ：关系型数据库的表结构是扁平的。一张员工表。每行记录一个员工。通过 parentId 字段指向上级。这种设计符合数据库范式。便于查询、更新、索引。

javascript 复制代码

// 数据库中的扁平数据
const employees = [
  { id: 1, name: 'CEO', parentId: null },
  { id: 2, name: 'CTO', parentId: 1 },
  { id: 3, name: 'Frontend Lead', parentId: 2 },
  { id: 4, name: 'Backend Lead', parentId: 2 },
  { id: 5, name: 'Developer A', parentId: 3 },
  { id: 6, name: 'Developer B', parentId: 3 }
];

前端视角：UI 组件(如 Ant Design 的 Tree、Element Plus 的 el-tree)需要嵌套的 children 数组来渲染层级关系。

javascript 复制代码

// 前端组件需要的树形数据
const tree = [
  {
    id: 1,
    name: 'CEO',
    children: [
      {
        id: 2,
        name: 'CTO',
        children: [
          {
            id: 3,
            name: 'Frontend Lead',
            children: [
              { id: 5, name: 'Developer A', children: [] },
              { id: 6, name: 'Developer B', children: [] }
            ]
          },
          { id: 4, name: 'Backend Lead', children: [] }
        ]
      }
    ]
  }
];

于是我们需要一个可靠的转换函数，在后端返回数据和前端渲染之间架起桥梁。

核心算法：从朴素到优化

朴素解法：双层循环的陷阱

最直观的思路是什么？对每个节点，遍历所有节点找它的子节点，然后递归处理。

javascript 复制代码

// 环境:Node.js / 浏览器
// 场景:朴素的树形转换(不推荐)
function listToTreeNaive(list) {
  const roots = [];
  
  list.forEach(item => {
    if (item.parentId === null) {
      // 找到根节点
      const node = { ...item, children: [] };
      // 递归找所有子节点
      node.children = findChildren(list, item.id);
      roots.push(node);
    }
  });
  
  return roots;
}

function findChildren(list, parentId) {
  const children = [];
  list.forEach(item => {
    if (item.parentId === parentId) {
      const node = { ...item, children: [] };
      node.children = findChildren(list, item.id); // 递归
      children.push(node);
    }
  });
  return children;
}

这个方案能跑，但有个致命问题:时间复杂度 O(n²) 。

对于 100 条数据，要执行 10000 次循环；1000 条数据，100 万次循环。数据量稍大，性能就崩了。

优化思路：空间换时间

关键问题在于：每次找父节点时，都要遍历整个列表。那能不能提前把所有节点索引好，需要时直接取？

这就是经典的 "空间换时间" 设计思想 ------ 用一个 Map 存储节点映射，时间复杂度降到 O(n) 。

javascript 复制代码

// 环境:Node.js 18+ / 浏览器
// 场景:高效的扁平列表转树形结构
// 依赖:无(原生 Map)

/**
 * 扁平列表转树
 * @param {Array<{ id: any, parentId: any }>} list 扁平数据
 * @param {{ rootId?: null | 0 }} options 配置
 * @returns {Array} 树形结构
 */
function listToTree(list, options = {}) {
  const rootId = options.rootId !== undefined ? options.rootId : null;
  const map = new Map(); // 核心:节点索引
  const result = [];

  // 第一次遍历:建立索引
  list.forEach((item) => {
    const node = { ...item, children: [] };
    map.set(node.id, node);
  });

  // 第二次遍历:建立父子关系
  list.forEach((item) => {
    const node = map.get(item.id);
    const parentId = item.parentId === undefined ? rootId : item.parentId;
    
    if (parentId === rootId || parentId === null || parentId === 0) {
      // 根节点
      result.push(node);
    } else {
      const parent = map.get(parentId);
      if (parent) {
        parent.children.push(node);
      } else {
        // 容错:找不到父节点,挂到根节点
        result.push(node);
      }
    }
  });

  return result;
}

这个实现有几个值得注意的细节:

两次遍历，不是递归: 第一次建立索引，第二次建立关系。避免了递归带来的栈深度问题。
Map 的威力 : map.get(id) 是 O(1)，直接找到父节点，不用遍历。
容错设计: 如果找不到父节点(数据有问题)，不会报错，而是把孤儿节点挂到根节点。

边界处理: 现实世界没有完美数据

实际开发中数据往往不那么"干净":

javascript 复制代码

// 场景:各种边界情况
const messyData = [
  { id: 1, name: 'A' },                // parentId 缺失
  { id: 2, name: 'B', parentId: null }, // null
  { id: 3, name: 'C', parentId: 0 },    // 0
  { id: 4, name: 'D', parentId: 999 },  // 父节点不存在
  { id: 5, name: 'E', parentId: 1 }
];

const tree = listToTree(messyData);
console.log(tree);
// 结果:A、B、C、D 都会成为根节点,E 是 A 的子节点

这种容错设计的思想是: 不要轻易抛出错误。数据不完美是常态，让程序尽可能继续运行，而不是崩溃。当然，实际项目中可能需要配置是否严格模式，遇到脏数据时报警。

逆向操作: 树转扁平的递归之美

有了树形结构，有时也需要转回扁平列表(比如提交给后端保存)。这时递归就派上用场了。

javascript 复制代码

// 环境:Node.js / 浏览器
// 场景:树形结构转扁平列表
// 依赖:无

/**
 * 树转扁平列表
 * @param {Array} tree 树形数据,节点含 id、children
 * @param {any} parentId 当前层的父 id
 * @returns {Array<{ id, parentId, ... }>} 扁平列表
 */
function treeToList(tree, parentId = null) {
  return tree.reduce((acc, node) => {
    // 解构:分离 children 和其他属性
    const { children = [], ...rest } = node;
    
    // 当前节点加入结果,设置 parentId
    acc.push({ ...rest, parentId });
    
    // 递归处理子节点
    if (children && children.length) {
      acc.push(...treeToList(children, node.id));
    }
    
    return acc;
  }, []);
}

这个函数很简洁，但包含了几个函数式编程的思想:

reduce 代替循环 : 用累加器模式收集结果，比 forEach + push 更声明式。
递归天然适合树: 树本身就是递归定义的数据结构，用递归处理最自然。
不可变数据 : { ...rest, parentId } 创建新对象，不修改原数据。

测试一下:

javascript 复制代码

// 场景:扁平 → 树 → 扁平,验证可逆性
const original = [
  { id: 1, name: 'A', parentId: null },
  { id: 2, name: 'B', parentId: 1 },
  { id: 3, name: 'C', parentId: 1 }
];

const tree = listToTree(original);
const flattened = treeToList(tree);

console.log(flattened);
// [
//   { id: 1, name: 'A', parentId: null },
//   { id: 2, name: 'B', parentId: 1 },
//   { id: 3, name: 'C', parentId: 1 }
// ]

可逆性是数据转换函数的重要特性，意味着没有信息丢失。

设计思想的提炼

写完这两个函数，我在想：它们背后有哪些通用的设计思想，可以应用到其他场景？

1. 空间换时间：不是银弹，要权衡

核心：用额外的内存换取时间复杂度的降低。

适用场景：

数据量不算特别大(几千到几万条)，内存压力可接受
需要频繁查找(用 Map/Object 做索引)
可以一次性预处理,后续多次使用

不适用场景:

内存紧张(如嵌入式设备)
数据量极大(几百万条)，可能撑爆内存
只查一次，建索引的开销大于遍历

javascript 复制代码

// 场景:100 万条数据,能用 Map 吗?
const hugeList = new Array(1000000).fill(null).map((_, i) => ({
  id: i,
  parentId: i > 0 ? Math.floor(i / 2) : null
}));

// Map 会占用大量内存,可能需要:
// 1. 流式处理,分批转换
// 2. 改用数据库查询,别全加载到内存
// 3. 虚拟滚动 + 懒加载,不一次性渲染全部

2. 单一职责：一个函数只做一件事

注意到 listToTree 和 treeToList 是两个独立的函数，而不是合并成一个"万能转换器"。这是单一职责原则的体现。

好处:

易测试: 每个函数的输入输出明确
易维护: 修改一个不影响另一个
易组合: 可以链式调用 treeToList(listToTree(data))

3. 配置化：让代码更灵活

listToTree 接受 options 参数，可以自定义 rootId。这是一种很好的扩展性设计。

javascript 复制代码

// 有些系统的根节点 parentId 是 0
const tree1 = listToTree(data, { rootId: 0 });

// 有些系统是 null
const tree2 = listToTree(data, { rootId: null });

// 有些系统是 -1
const tree3 = listToTree(data, { rootId: -1 });

想象一下，如果把 rootId 硬编码成 null，遇到其他系统就得改代码。通过配置化。让函数更通用。

未来还可以扩展:

javascript 复制代码

// 可能的扩展:自定义字段名
function listToTree(list, options = {}) {
  const {
    rootId = null,
    idKey = 'id',           // 自定义 id 字段名
    parentKey = 'parentId', // 自定义 parentId 字段名
    childrenKey = 'children' // 自定义 children 字段名
  } = options;
  
  // ...
}

4. 防御性编程: 预设数据不完美

代码里有很多防御性检查:

javascript 复制代码

const parentId = item.parentId === undefined ? rootId : item.parentId;

if (parent) {
  parent.children.push(node);
} else {
  result.push(node); // 容错
}

这种思维很重要: 假设数据会出错，提前做好 Plan B。现实中的数据往往来自:

第三方接口(不可控)
用户输入(千奇百怪)
数据库迁移(可能有脏数据)

宁可多几行容错代码，也不要等崩溃了再修。

实际场景思考

理论讲完了，来看看实际应用中的一些有意思的场景。

场景 1: 组织架构的渲染与编辑

需求: 后端返回扁平的员工列表,前端要渲染成树形图,支持拖拽调整上下级关系。

实现思路:

javascript 复制代码

// 环境:React / Vue
// 场景:员工树的渲染
// 依赖:Ant Design Tree 组件

import { Tree } from 'antd';

function EmployeeTree({ employees }) {
  // 1. 扁平数据转树
  const treeData = listToTree(employees);
  
  // 2. 拖拽调整时
  const onDrop = (info) => {
    // 树的拖拽会改变 children
    const newTree = updateTreeOnDrop(treeData, info);
    
    // 3. 树转扁平,提交给后端
    const newList = treeToList(newTree);
    saveToBackend(newList);
  };
  
  return <Tree treeData={treeData} onDrop={onDrop} />;
}

思考点 : 拖拽操作本身是在树上进行的，但保存时要转回扁平结构。这就是 listToTree 和 treeToList 配合使用的典型场景。

场景 2: 动态路由的权限过滤

需求: 后端返回用户有权限的菜单(扁平)，前端要渲染成侧边栏，同时要处理"父菜单没权限，但子菜单有权限"的情况。

javascript 复制代码

// 环境:Vue Router
// 场景:根据权限过滤菜单树
// 依赖:无

function filterMenuTree(menuList, userPermissions) {
  // 1. 先转成树
  const tree = listToTree(menuList);
  
  // 2. 递归过滤
  function filter(nodes) {
    return nodes
      .filter(node => {
        // 检查当前节点权限
        if (node.children && node.children.length) {
          // 递归过滤子节点
          node.children = filter(node.children);
          // 即使自己没权限,只要有子节点就保留
          return node.children.length > 0 || userPermissions.includes(node.id);
        }
        return userPermissions.includes(node.id);
      });
  }
  
  return filter(tree);
}

思考点: 这里不是简单地转换，而是在树上做业务逻辑处理。树的递归结构让权限过滤变得很自然。

场景 3: 评论系统的无限层级回复

需求 : 评论可以无限层级回复，后端返回扁平的 { id, parentId, content },前端要渲染成嵌套样式。

javascript 复制代码

// 环境:React
// 场景:评论树渲染
// 依赖:递归组件

function Comment({ node }) {
  return (
    <div style={{ marginLeft: 20 }}>
      <p>{node.content}</p>
      {node.children?.map(child => (
        <Comment key={child.id} node={child} />
      ))}
    </div>
  );
}

function CommentList({ comments }) {
  const tree = listToTree(comments);
  return tree.map(node => <Comment key={node.id} node={node} />);
}

思考点 : 递归组件天然适合渲染树形结构。React/Vue 都支持组件自己调用自己，配合 listToTree，评论树的实现变得很简洁。

场景 4: 大数据量下的性能优化

问题: 如果评论有 10000 条，全部转成树会很慢，而且用户不需要一次看完所有评论。

可能的优化方向:

分页加载: 后端分批返回，前端逐步构建树
虚拟滚动: 只渲染可见区域的节点
懒加载: 初始只渲染一级评论，点击"展开回复"时才请求子评论

javascript 复制代码

// 场景:评论懒加载
function CommentWithLazyLoad({ node }) {
  const [children, setChildren] = useState([]);
  const [expanded, setExpanded] = useState(false);
  
  const loadChildren = async () => {
    // 请求这个评论的子评论
    const childComments = await fetchChildComments(node.id);
    setChildren(childComments);
    setExpanded(true);
  };
  
  return (
    <div>
      <p>{node.content}</p>
      {!expanded && <button onClick={loadChildren}>展开回复</button>}
      {expanded && children.map(child => <CommentWithLazyLoad key={child.id} node={child} />)}
    </div>
  );
}

这时候可能就不需要一次性 listToTree 了，而是按需构建局部树。

延伸与发散

在研究这个问题时，我产生了一些新的思考:

1. 如果有多个根节点怎么办?

目前的实现假设 parentId 为 null 的是根节点。但如果数据是这样的:

javascript 复制代码

const data = [
  { id: 1, name: 'Tree A', parentId: null },
  { id: 2, name: 'Tree B', parentId: null },
  { id: 3, name: 'Child of A', parentId: 1 }
];

listToTree 会返回两棵树(森林结构)。这在某些场景下是合理的，比如多个独立的分类体系。

2. 如果数据有循环引用呢?

理论上,如果数据是这样的:

javascript 复制代码

const badData = [
  { id: 1, parentId: 2 },
  { id: 2, parentId: 1 }
];

会形成循环引用，递归会栈溢出。一种防御方式是检测:

javascript 复制代码

function listToTreeSafe(list) {
  const visited = new Set();
  // 在建立父子关系时,检查是否形成环
  // 如果 parent 的祖先中包含当前节点,说明有环
}

但实际场景中，这种数据通常是数据库层面就保证不会出现的(通过外键约束)。

3. 如果需要支持 DAG(有向无环图)?

树是一种特殊的 DAG(每个节点只有一个父节点)。但有些场景，一个节点可能有多个父节点,比如:

标签系统: 一篇文章可以有多个分类
技能树: 一个技能可能依赖多个前置技能

这时候就不是简单的 parentId，而是 parentIds: [],数据结构和算法都要调整。

4. React/Vue 的状态管理如何设计?

如果用 Redux/Vuex 管理树形数据，是存扁平结构还是树形结构?

我的理解是: 状态存扁平,渲染时转树。理由:

扁平结构易于更新(通过 id 直接定位)
树形结构更新麻烦(要递归找节点)
listToTree 的性能开销可以通过 memoization 优化

javascript 复制代码

// Redux 示例
const state = {
  employees: [
    { id: 1, name: 'A', parentId: null },
    { id: 2, name: 'B', parentId: 1 }
  ]
};

// 组件中
const selector = useMemo(
  () => listToTree(state.employees),
  [state.employees]
);

小结

从一个简单的数据转换函数，我们延伸出了很多思考：算法优化、设计原则、实际场景、性能权衡。这个过程让我意识到，工程中的"小问题"往往不小 ------ 它们是设计思想的缩影。

listToTree 和 treeToList 这两个函数，表面上是在解决数据格式转换,本质上是在处理"存储视角"与"展示视角"的差异。这种差异在前端开发中无处不在:

后端的关系型数据 vs 前端的对象/数组
API 的 snake_case vs 前端的 camelCase
时间戳 vs 格式化的日期字符串

每一次转换，都是在两种"世界观"之间架桥。理解这一点，也许能让我们写出更灵活、更健壮的代码。

参考资料

MDN - Map - Map 数据结构的官方文档
JavaScript 数据结构与算法 - 树 - 树的各种实现参考
Ant Design Tree 组件 - 树形组件的使用文档