从张量到微分方程：AI计算架构的底层思考笔记

引言

在AI技术飞速发展的今天，很多工程实践背后隐藏着深刻的计算哲学问题。从如何在低资源设备上跑语音识别，到NPU为什么省电，再到神经网络是否必须用张量，这些问题的答案指向一个根本性的认知：我们正在从离散的、逻辑的计算范式，走向连续的、物理的计算范式。

这篇文章是对这些思考的系统梳理。

一、工程最优解：蒸馏+量化+NPU

在资源受限的设备上运行语音识别，当前工业界的最优方案是蒸馏、量化和NPU的组合。

蒸馏是用大模型当老师训练一个小模型，参数量可以减少80%-90%，同时保留大部分能力。量化是把32位浮点数降到8位整数，模型体积缩小75%，速度提升3-5倍，精度损失控制在1%以内。NPU是专为神经网络设计的硬件，利用低精度计算实现毫瓦级功耗。

三者结合的效果显著：一个12MB的唤醒词模型可以压缩到3MB，延迟50ms，待机功耗低于100mW。

二、NPU低功耗的本质

NPU的低功耗并非魔法，而是源于一个关键洞察：神经网络对精度不敏感。识别语音时，乘法结果是0.73还是0.73000001，对最终结果几乎没有影响。

NPU正是利用这一点，大量使用低精度计算，去掉了传统CPU中那些为了高精度而设计的复杂电路。CPU像一位无所不能的大学教授，什么都会但能耗高；NPU则像一条专一高效的流水线，只做一件事，但做得极好极省电。

三、神经网络与张量的必然联系

神经网络的计算本质是大规模并行计算，而张量（多维数组）是组织这类数据最高效的形式。NPU最核心的部件叫脉动阵列或张量核心，其设计前提就是数据必须以张量形式送入。

如果用两个for循环每次只扔一个数给NPU，NPU会"饿死"------内部庞大的并行单元全部闲置，速度比CPU还慢。因此，现代神经网络几乎必然使用张量计算。

四、从比特到张量：计算范式的演进

计算数据的抽象层级演进，清晰地展示了计算范式的变化：

二进制是计算的"原子"，只有0和1。数字赋予了量纲，完成了从"有无"到"多少"的飞跃。向量用一组数字表达一个实体，开始表达关系。张量用多维数组表达复杂系统，如图片表示为[高,宽,通道]，视频表示为[时间,高,宽,通道]。

每一步都在更"拟合现实"。因为现实世界的物理量本身就是场和张量------一张图片的光强是二维场，一段视频是三维场。

五、向量数据库与Tensor Core的统一趋势

Tensor Core让人们能快速计算高维向量之间的相似度；向量数据库让人们能高效存储和检索海量高维向量。这两者共同指向一个根本趋势：现代AI的核心计算模式，正在从指令执行转向高维空间中的检索与匹配。

传统程序是逻辑判断：if x > 0: do A else: do B。AI模型是向量匹配：output = softmax(query · key)。大模型生成下一个词的过程，本质上就是在内部向量数据库中检索与当前上下文最相似的模式。

六、张量的根本局限

张量不能完美代表世界，它是一个权宜之计，而非终极真理。

在连续与离散的对比上，真实的时间、空间、场是连续的，张量只能通过采样近似，永远存在误差。在动态与静态的对比上，张量描述的是瞬间，要描述运动只能用一连串张量（如视频），但这只是"连环画"，丢失了瞬间的速度和加速度信息。在因果与关联的对比上，这是最根本的局限：张量只能学到相关性，不懂因果律。模型会发现乌云和下雨高度相关，但不懂乌云导致下雨这个因果。

张量是世界的离散近似地图，不是世界本身。

七、微分方程的优越性

微分方程是更高阶的数学语言，具备两个根本优势。

一是天然连续。dx/dt = f(x)描述每一瞬间的变化率，没有离散化误差。二是揭示因果。它有明确的时间箭头，当前状态通过确定规律导致未来变化，这是铁打的因果律。

如果AI能直接用微分方程建模，它将真正理解苹果会往下落是因为引力导致加速度，而不是因为训练数据里苹果下面总是有地面。

八、离散计算的必然性

尽管微分方程在数学上更优越，数字计算机（冯·诺依曼架构）天生是离散的，只能处理0和1，只能进行加减乘除。

即使梦想用微分方程描述世界，到了真正的计算环节，还是得把微分方程离散化，强行拆解成张量运算。求解dx/dt = f(x)的过程，数值上就是x_{t+1} = x_t + Δt * f(x_t)。这个x_t就是张量，这个Δt * f(x_t)就是张量运算。

这揭示了一个根本困境：内心渴望微分方程的连续真理，但手上不得不做着张量的离散近似。

九、融合方向：神经微分方程

未来的方向不是抛弃张量，而是在张量之上构建微分方程。

神经微分方程（Neural ODE）是当前研究热点：定义一个神经网络f（用张量计算），把它放进微分方程dx/dt = f(x, t)里。模型学习的是变化的规律，而非仅仅是状态的快照。

物理信息神经网络（PINNs）则把物理定律（微分方程）作为约束硬塞进损失函数，让模型既学习数据，又遵守因果律。

十、终极愿景：用物理规律计算物理规律

最激动人心的方向是用物理规律去计算物理规律本身。

忆阻器的电阻值本身就是存储的数据，电流流过产生的电压降就是计算，实现了存算一体，彻底消灭数据搬运功耗。光电计算中，光在芯片上并行传播，一个光子流过光学元件，可以同时完成整个矩阵乘法。

在这种架构下，功耗从毫瓦降到纳瓦甚至皮瓦级，计算时间近乎为零（物理过程实时演化），神经网络下沉为物理定律，构建AI不再是写代码，而是搭积木。

当然，新的上限也会出现：模拟噪声、可编程性、物理定律本身的限制（光速、焦耳热、原子尺度）。但这不妨碍它成为计算领域最值得期待的突破方向。

结语

从离散到连续，从逻辑到物理，从关联到因果------这是计算范式演进的根本脉络。张量不是终点，微分方程才是更接近真相的语言。而终极的答案，或许是用物理本身去计算物理。

这条路还很长，但每一步都值得。