opbase:CANN 所有算子的公共地基

翻开 CANN 任何一个算子仓库------ops-math、ops-nn、ops-blas、ops-fft、ops-rand------它们都依赖同一个基础库:opbase。

opbase 不提供面向用户的算子能力。它提供的是所有算子共享的基础设施:Tensor 的内存管理和形状描述、Kernel 的注册和加载机制、Buffer 的分配和生命周期管理。


opbase 在 CANN 中的位置

复制代码
上层算子库:ops-math、ops-nn、ops-blas、ops-fft、ops-rand ......(各自管一类算子)
  ↓ 全部依赖
opbase:
  ┌──────────────────────────────┐
  │ Tensor 数据结构              │
  │ Buffer 内存管理              │
  │ Kernel 注册框架              │
  │ 通用类型定义                 │
  └──────────────────────────────┘
  ↓
CANN 底层:Runtime、driver

每个新算子仓库启动时不需要从零写 Tensor 管理、Buffer 分配、Kernel 注册------这些在 opbase 中已就绪,新仓库直接引用。


为什么所有算子仓库都依赖 opbase

一个算子从写到 Runtime 执行,需要的公共能力包括:

Tensor 描述。 每个算子需要知道输入 Tensor 的形状、数据类型、内存地址。opbase 定义了统一的 TensorDesc 结构------所有算子仓库都使用这个描述。ops-math 和 ops-nn 的算子之间传递 Tensor 信息时不需要做格式转换。

Buffer 分配。 算子执行过程中的临时 Tensor 需要分配显存。opbase 提供了 opbase::AllocBuffer------封装了 Runtime 的 aclrtMalloc,但增加了算子级别的生命周期追踪。Buffer 在算子执行完后自动回收。

Kernel 注册。 写好的算子 Kernel 需要注册到 CANN 的算子表中才能被 GE 识别和调度。opbase 提供了 REGISTER_KERNEL 宏------开发者只需要在 Kernel 实现文件中加一行注册语句。

cpp 复制代码
#include "opbase/opbase.h"

// 自定义 Add Kernel
__aicore__ void AddKernel(...) { ... }

// 注册到算子表------一行搞定
REGISTER_KERNEL("CustomAdd", AddKernel);
// GE 在编译时就能在算子表中找到 "CustomAdd"

Tensor 基础能力如何复用

所有算子仓库中 Tensor 的创建和销毁走同一条路径:

cpp 复制代码
// opbase 的 Tensor 创建------所有算子仓库共用
opbase::Tensor tensor = opbase::AllocTensor(
    {batch, seq_len, hidden_dim},  // Shape
    opbase::FLOAT16,               // 数据类型
    opbase::ND                     // 格式
);

// tensor 的内存由 opbase 管理
// 算子执行完自动回收

每个算子仓库不需要重新实现 Tensor 分配逻辑。

Buffer 的生命周期管理也是复用的:

cpp 复制代码
// ops-math 的 ReduceSum 算子内部
void ReduceSumKernel(...) {
    // opbase 管理的临时 Buffer
    auto temp = opbase::AllocBuffer(partial_sum_size);
    // 计算...
    // temp 在函数结束时自动回收
}

算子开发中的基础设施

写一个新的 CANN 算子时,opbase 提供的工作流:

  1. 继承 OpBase。 新算子继承 opbase::Operator 基类,获得输入输出解析、参数校验、生命周期管理等默认实现
  2. 实现 Compute。 只需要实现 Compute() 虚函数------算子的核心计算逻辑
  3. 注册。 使用 REGISTER_KERNEL 宏将算子注册到算子表
cpp 复制代码
class MyNewOp : public opbase::Operator {
public:
    OpBase::Status Init(const OpDesc& desc) override {
        // opbase 自动解析输入输出描述
        return opbase::SUCCESS;
    }
    
    OpBase::Status Compute(const std::vector<opbase::Tensor>& inputs,
                           std::vector<opbase::Tensor>& outputs) override {
        // 只有这段代码需要开发者写
        auto input = inputs[0].data<float16>();
        auto output = outputs[0].data<float16>();
        // 计算逻辑...
        return opbase::SUCCESS;
    }
};

REGISTER_KERNEL("MyNewOp", MyNewOp);

opbase 的类型系统

opbase 定义了一套跨仓库统一的类型系统:

  • DataType:FLOAT32、FLOAT16、INT8、INT32、INT64、BOOL
  • Format:ND、NZ、NHWC、NCHW
  • Shape:动态 Shape 用 -1 表示,支持 ShapeRange

所有算子仓库都使用同一套类型。ops-math 的 ReduceSum 输出的 DataType 跟 ops-nn 的 Conv 输入的 DataType 是同一个枚举值------不需要类型转换。

opbase 的 Kernel 注册表

Kernel 注册表是 opbase 的另一个核心功能。每个算子库在加载时调用 REGISTER_KERNEL 把 Kernel 注册到全局表中。GE 在编译时查表找到对应算子的 Kernel。

注册表是进程级的------跨模型共享。模型 A 加载了 ops-nn 的 Conv Kernel,模型 B 加载同一个 Operator 时不需要重复注册。这个机制在多模型服务中节省了重复加载 Kernel 的时间。

参考仓库

opbase 算子基础组件库

Ascend C 算子编程指南

相关推荐
devilnumber7 小时前
Java 递归算法 详解 + 核心要点 + 实战运用 + 避坑指南
java·开发语言·算法
A.说学逗唱的Coke7 小时前
【大模型专题】向量数据库深度解析:从原理到实战,构建企业级 AI 知识检索底座
数据库·人工智能
果丁智能7 小时前
智能锁赋能网约房民宿数字化管控:身份核验+远程授权,筑牢安全防线、降本增效
网络·数据库·人工智能·安全·智能家居
V搜xhliang02467 小时前
AI智能体的数据安全与合规实践
人工智能·学习·数据分析·自动化·ai编程
PPIO派欧云7 小时前
PPIO登上贵州新闻联播,深化AI算力生态建设
人工智能
hai3152475438 小时前
一种通过空间几何转换进行软件编程计算的方式与现有计算的对比
人工智能·深度学习·数学建模·硬件架构·几何学·图论·拓扑学
猿饵块8 小时前
LibreOffice---文档制作
人工智能
硅谷秋水8 小时前
HARBOR:一个面向具身智体机器人强化学习的驾驭框架
人工智能·深度学习·机器学习·机器人
Mr..Jackey8 小时前
瑞佑 RUI Builder 图形化 UI 设计工具
arm开发·人工智能·单片机·ui·人机交互·ra8889·lcd控制芯片
霍格沃兹测试开发学社测试人社区8 小时前
Skills实战:从0到1封装一个“登录鉴权”Skill,拿来即用
人工智能