使用taichi 写了一个任意平台任意显卡推理的Linear

这东西就是在于任意的显卡都能加速任意模型

当然如何有人使用taichi写一个卷积那么计算机视觉也能任意显卡加速人工智能

如果还有人写了个深度学习训练框架那么恭喜AMD,ARM 等任何芯片厂商乐疯

python 复制代码
import taichi as ti
import numpy as np
ti.init(arch=ti.vulkan)


class Linear():
    def __init__(self, input_size, output_size, weights=None):
        if weights:
            self.weights = weights
        else:
            # self.weights = ti.Matrix([[0] * output_size] * input_size)
            self.weights = ti.Matrix(np.random.random(output_size*input_size).reshape([input_size,output_size]))

    @staticmethod
    def taichi_mul(a, b):
        ar, al = a.to_numpy().shape
        br, bl = b.to_numpy().shape
        assert al == br

        @ti.kernel
        def mlp() -> ti.types.matrix(ar, bl, dtype=ti.float32):
            return a @ b

        return mlp()

    def forward(self, a):
        return self.taichi_mul(a, self.weights)

    def set_weights(self, weights):
        self.weights = ti.Matrix(weights)


l1 = Linear(3, 5)
print(l1.forward(ti.Matrix([[1] * 3])))
python 复制代码
这段代码实现了一个简单的线性层(Linear layer)类,通过调用 forward 函数可以对输入进行线性变换。其中 Linear 类中的 weights 表示线性层的权重矩阵,可以通过构造函数的输入或者 set_weights 函数进行设置。forward 函数使用 taichi_mul 函数实现了矩阵乘法,并返回了乘积结果。

在 __init__ 函数中,如果 weights 参数被传入,则将其作为权重矩阵;否则通过 np.random.random 函数生成随机的权重矩阵。其中,输入参数 input_size 和 output_size 分别表示输入和输出的特征数。

在 taichi_mul 函数中,输入参数 a 和 b 分别表示两个矩阵,通过 Taichi 提供的 @ 运算符实现了矩阵乘法,返回乘积结果。值得注意的是,Taichi 不能直接操作 Python 中的数据类型,因此在使用 Taichi 前,需要将 Python 中的数据类型转换为 Taichi 中的数据类型,可以调用 to_numpy() 函数将 Taichi 中的数据类型转换为 NumPy 中的数据类型,然后对其进行操作,最后再调用 ti.Matrix() 函数将其转换为 Taichi 中的数据类型。

在主函数中,首先构造了一个输入矩阵 [[1] * 3],然后通过 l1.forward() 函数将其输入到 l1 线性层中,得到线性变换的结果,最后将结果打印输出。
相关推荐
爱喝白开水a9 小时前
前端AI自动化测试:brower-use调研让大模型帮你做网页交互与测试
前端·人工智能·大模型·prompt·交互·agent·rag
董世昌419 小时前
深度解析ES6 Set与Map:相同点、核心差异及实战选型
前端·javascript·es6
哈__10 小时前
CANN加速图神经网络GNN推理:消息传递与聚合优化
人工智能·深度学习·神经网络
七月稻草人10 小时前
CANN 生态下 ops-nn:AIGC 模型的神经网络计算基石
人工智能·神经网络·aigc·cann
User_芊芊君子10 小时前
CANN_MetaDef图定义框架全解析为AI模型构建灵活高效的计算图表示
人工智能·深度学习·神经网络
哈哈你是真的厉害10 小时前
驾驭万亿参数 MoE:深度剖析 CANN ops-transformer 算子库的“核武库”
人工智能·深度学习·aigc·transformer
island131410 小时前
CANN GE(图引擎)深度解析:计算图优化管线、内存静态规划与异构 Stream 调度机制
c语言·开发语言·神经网络
呉師傅10 小时前
【使用技巧】Adobe Photoshop 2024调整缩放与布局125%后出现点菜单项漂移问题的简单处理
运维·服务器·windows·adobe·电脑·photoshop
chian-ocean10 小时前
百万级图文检索实战:`ops-transformer` + 向量数据库构建语义搜索引擎
数据库·搜索引擎·transformer
白日做梦Q11 小时前
Anchor-free检测器全解析:CenterNet vs FCOS
python·深度学习·神经网络·目标检测·机器学习