Narwhals:DataFrame 库的轻量兼容层

Narwhals:DataFrame 库的轻量兼容层

Narwhals 是一个 Python DataFrame 兼容层,目前已获得 1,626 个 Star:

Narwhals 的定位是在多个 DataFrame 库之间提供统一的 API 调用方式。开发者写一次代码,就能在 pandas、Polars、DuckDB、PyArrow 等库之间切换。

目前 Narwhals 完整支持 cuDF、Modin、pandas、Polars 和 PyArrow。对 Daft、Dask、DuckDB、Ibis、PySpark 和 SQLFrame 提供 Lazy 模式支持。

Narwhals 的核心特点如下:

  • 使用 Polars API 的子集,不需要学习新的接口
  • 零依赖,只使用用户传入的库,不会增加项目体积
  • 区分 eager 和 lazy 两种 API,支持表达式
  • 兼容 pandas 的类型系统和索引,不会干扰原有逻辑
  • 100% 分支覆盖率,每天针对 pandas 和 Polars 的 nightly 版本进行测试
  • 开销极低,几乎不会带来性能损耗
  • 完整的静态类型支持,IDE 可以给出准确提示
  • 向后兼容策略明确,提供 stable API 供选择

安装很简单,通过 pip 直接安装:

nginx 复制代码
pip install narwhals

也可以使用 conda:

nginx 复制代码
conda install -c conda-forge narwhals

使用 Narwhals 只需要三个步骤。先用 narwhals.from_native 把 pandas、Polars 等 DataFrame 包装成 Narwhals 对象。然后调用 Narwhals 支持的 Polars API 子集进行数据处理。最后用 narwhals.to_native 把结果转回原始的 DataFrame 类型。

以下是一个完整的示例:

python 复制代码
import narwhals as nw
from narwhals.typing import IntoFrameT


def agnostic_function(df_native: IntoFrameT) -> IntoFrameT:
    return (
        nw.from_native(df_native)
        .with_columns(
            category=nw.when(nw.col("animal").str.contains("whale"))
            .then(nw.lit("whale"))
            .otherwise(nw.lit("other"))
        )
        .to_native()
    )

这个函数可以同时接受 pandas.DataFrame、polars.DataFrame、duckdb.DuckDBPyRelation 等多种类型。计算过程始终在原库内完成,不需要额外的依赖。

python 复制代码
import duckdb
import polars as pl
import pandas as pd

data = {
    "animal": ["blue whale", "orca", "dolphin", "humpback whale", "seal"],
    "length_m": [30.0, 8, 2.5, 17, 2.2],
    "weight_kg": [150000, 4000, 200, 30000, 85],
}

df_pl = pl.DataFrame(data)
print(agnostic_function(df_pl))

df_pd = pd.DataFrame(data)
print(agnostic_function(df_pd))

输出结果保持各库原生格式。Polars 返回 Polars 的 DataFrame,pandas 返回 pandas 的 DataFrame。

这个项目已经被 altair、bokeh、plotly、marimo 等多个库采用。如果你正在维护一个需要兼容多种 DataFrame 后端的 Python 库,Narwhals 是一个值得考虑的方案。

相关推荐
右耳朵猫AI3 小时前
GitHub周趋势2026W22 | AI编程工具、知识图谱、自托管、AI代理、代码智能
人工智能·github·ai编程
逻极3 小时前
Git 从入门到精通:版本控制协作实战指南
git·github·分支管理·版本控制
用户7459571748404 小时前
hug:写 Python API,几行代码就够了
github
DogDaoDao5 小时前
【GitHub】VoxCPM2 实战全解析:原理、部署与效果对比
深度学习·大模型·github·音频·语音模型·tss·文本生成语音
朱涛的自习室7 小时前
Munk AI 正式开源:一个“自我进化”的 AI 测试引擎
android·人工智能·github
lpfasd1238 小时前
2026年第23周GitHub趋势周报
github
Aliaoo8 小时前
GitHub Copilot 改按量计费 72 小时:$28→$746 的账单、暂停新注册,以及这对普通开发者意味着什么
github·copilot
撸码小狂魔9 小时前
GitLab CI/CD 使用指南(小白版)
github
易生一世9 小时前
GitHub Copilot概述
github