开源贡献: antv/dataset瘦身, 从1.78M到1.71KB

遇到的问题: 项目中使用到了DataSet上的一些transform 方法来处理数据, 但是transform是 Dataset.prototype上的,无法单独导出,但是包体积很大,足足有 660.83 kB, 因此需要给Dataset瘦身,以便支持treeshaking

先看存在的问题, 再讨论解决方法, 这是transform文件结构:

jsx 复制代码
// transform/waffle.js
function transform(dataView: View, options: Options):void
DataSet.registerTransform('map', transform);

首先想到的解决方法: 通过让用户去调用 DataSet.registerTransform来注册的方式减少体积,类似于 ag-grid module

js 复制代码
import { MasterDetailModule } from "@ag-grid-enterprise/master-detail";

ModuleRegistry.registerModules([
    ClientSideRowModelModule,
    CsvExportModule,
    ExcelExportModule,
    MasterDetailModule
]);

但是效果不好, 原因是transform仅占整个 Dataset.prototype 的很少一部分,优化效果有限

考虑第二个方法: 把transform单独打包出一份

import { map } from "@antv/data-set";

考虑到语义化和将来提取其他的prototype时的命名问题, 因此放到./transform 路径上更好:

import { map } from "@antv/data-set/transform";

需要处理的点:

  1. 参数依赖了 View, 需要解耦成纯函数,再使用适配器模式包裹纯函数返回新的函数,新函数入参为View,此外如果有用到View上的api,则重新实现
  2. transform是在每一个文件里注册的,这是副作用的操作, 会影响产物, 需要迁移到其他地方

处理 transform/map.js

diff 复制代码
- DataSet.registerTransform('map', (dataView: View, options: Options) => {
- dataView.rows = dataView.rows.map(options.callback || defaultCallback);
- });
+ const map = (items: any[], options: Options): any[] => {
+  const rows = [...(items || [])];
+  return (rows || []).map(options.callback || defaultCallback);
+ };

+ const mapTransform = (dataView: any, options: Options): void => {
+  dataView.rows = map(dataView.rows, options);
+ };
+ export { map, mapTransform };

处理 src/index.js

diff 复制代码
import { DataSet } from './data-set';
- import './transform/map';
+ import { mapTransform } from './transform/map';
+ DataSet.registerTransform('map', mapTransform);

export = DataSet;

接下来就是打包

diff 复制代码
# package.json
- "build": "rm -rf build && webpack",
+ "build": "rm -rf build  && tsup  && webpack",
+  "exports": {
+    ".": {
+      "import": "./build/data-set.js",
+      "require": "./build/data-set.js",
+      "types": "./lib/src/index.d.ts"
+    },
+    "./transform": {
+      "import": "./build/transform/index.mjs",
+      "require": "./build/transform/index.js",
+      "types": "./lib/src/transform/index.d.ts"
+    },
+    "./*": {
+      "import": "./build/*.mjs",
+      "require": "./build/*.js",
+      "types": "./build/*.d.ts"
+    }
+  }

新建 tsup.config.ts, 做多入口打包

jsx 复制代码
import { defineConfig } from 'tsup';
import { globSync } from 'glob';
import path from 'node:path';
import { fileURLToPath } from 'node:url';

export default defineConfig({
  entry: Object.fromEntries(
    globSync('src/transform/**/*.ts').map((file) => {
      return [
        path.relative('src', file.slice(0, file.length - path.extname(file).length)),
        fileURLToPath(new URL(file, import.meta.url)),
      ];
    })
  ),
  format: ['esm', 'cjs'],
  outDir: 'build',
  clean: true,
  dts: true,
});

到这里基本就结束了, 然后 npm link, 找个项目测试一下

import { map } from "@antv/data-set/transform";

当打包项目时, 问题出现了, treeshaking 没生效,只引用了map但是另一个transform dagre的依赖dagre却进来了,而且没有使用到lodash, 却也被包含进来了

调试步骤:

注释 src/transform/index.ts 中的 export { dagre } from './diagram/dagre', 项目打包后就没有dagre 和lodash的依赖了, 原因就是出在dagre这个包,检查 node_modules/dagre/index 源码, 发现这是一个cjs的库

js 复制代码
// dagre/index.js
module.exports = {
  graphlib: require("./lib/graphlib"),

![image.png](https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/adaed999f1d54b628b9809372fb917eb~tplv-k3u1fbpfcp-jj-mark:0:0:0:0:q75.image#?w=2616&h=1434&s=324491&e=png&a=1&b=924447)
  layout: require("./lib/layout"),
  debug: require("./lib/debug"),
  util: {
    time: require("./lib/util").time,
    notime: require("./lib/util").notime
  },
  version: require("./lib/version")
};

原因也就知道了, 因为cjs不支持treeshaking, 又因为tsup默认会把第三方依赖都 external, 所以也不会转为esm, 一个解决办法就是打包时处理下这个模块,把 dagre 添加到tsup的 noExternal

diff 复制代码
# tsup.config.ts
+  noExternal: ['dagre'],

现在项目打包就正常了, 问题解决

之后, simple-statistics的依赖无法处理了, vite 好像也支持 import * as simpleStatistics from 'simple-statistics'的用法, 但是由于在运行时这要使用到的 simpleStatistics[method] 无法treeshaking

处理: d3-sankey的依赖,查看 transform/sankey.ts

js 复制代码
// transform/sankey.js
import { sankey } from 'd3-sankey';
// sankey/index.js
import {default as sankey} from './sankey'
// sankey/sankey.js
export default funtion sankey(){}

直接导出 不支持treeshaking

还有些transform, 对DataSet有依赖, 很难treeshaking

js 复制代码
DataSet.CONSTANTS.STATISTICS_METHODS.forEach((method) => {
  aggregates[method] = (data: any[], field: string) => {
    let values = data.map((row) => row[field]);
    if (isArray(values) && isArray(values[0])) {
      values = flattenDeep(values);
    }
    // @ts-ignore
    return simpleStatistics[method](values);
  };
});

总结:

改动之前 data-set包:1.78M

改动之后:

  • data-set: 1.08M,
  • import { map } from "@antv/data-set/transform"; 方式使用map: 368KB
  • import { map } from "@antv/data-set/transform/map";方式使用map: 1.71KB
相关推荐
hackeroink31 分钟前
【2024版】最新推荐好用的XSS漏洞扫描利用工具_xss扫描工具
前端·xss
迷雾漫步者2 小时前
Flutter组件————FloatingActionButton
前端·flutter·dart
向前看-3 小时前
验证码机制
前端·后端
燃先生._.4 小时前
Day-03 Vue(生命周期、生命周期钩子八个函数、工程化开发和脚手架、组件化开发、根组件、局部注册和全局注册的步骤)
前端·javascript·vue.js
高山我梦口香糖4 小时前
[react]searchParams转普通对象
开发语言·前端·javascript
m0_748235245 小时前
前端实现获取后端返回的文件流并下载
前端·状态模式
m0_748240255 小时前
前端如何检测用户登录状态是否过期
前端
black^sugar5 小时前
纯前端实现更新检测
开发语言·前端·javascript
寻找沙漠的人6 小时前
前端知识补充—CSS
前端·css