基于常微分方程的神经网络(Neural ODE)

一、什么是常微分方程(ODE)

微分方程是包含未知函数及其导数的方程,未知函数导数的最高阶数称为该微分方程的阶

常微分方程(ordinary differential equation,简称ODE)是未知函数只含有一个自变量的微分方程

如:

二、Neural ODE与普通神经网络的区别

三、用ODE表示有什么优势

1.Powerful representation:微分方程可以用数值法求解,因此对于任何连续函数都有良好的逼近能力。

2.Memory efficiency:不需要用到反向传播,因此训练上节约内存

3.Simplicity:不需要考虑复杂的调参和网络设计,形式简洁

4.Abstraction:让网络不需要考虑每层需要做什么,只需要考虑怎么计算结果

四、求解微分方程

Neural ODE解的是带初始值的常微分方程

如果给定初识条件(0,1),则

这种解法微分方程满足一定的形式,但实际生活当中原函数比较复杂,通常会使用数值法求解原函数在各个点的值

比较出名的两个方法:① 欧拉法(Euler Method) ② 龙格库塔法 (Runge-Kutta)

欧拉法:

在给定初始条件和f的情况下,利用欧拉法可以推导出任意时刻的函数值

相关推荐
友思特 智能感知1 分钟前
友思特案例 | 金属行业视觉检测案例四:挖掘机钢板表面光学字符识别(OCR)检测
人工智能·视觉检测·深度学习视觉检测
爱吃泡芙的小白白4 分钟前
CNN激活函数新篇:Sigmoid与Softmax的进化与实战
人工智能·神经网络·cnn·softmax·sigmoid·函数激活层
星爷AG I9 分钟前
9-27 视觉表象(AGI基础理论)
人工智能·agi
Coder_Boy_10 分钟前
基于SpringAI的在线考试系统-企业级教育考试系统核心架构(完善版)
开发语言·人工智能·spring boot·python·架构·领域驱动
艾莉丝努力练剑10 分钟前
【Linux:文件】基础IO:文件操作的系统调用和库函数各个接口汇总及代码演示
linux·运维·服务器·c++·人工智能·centos·io
Leinwin16 分钟前
VibeVoice-ASR:突破60分钟长音频处理瓶颈,语音识别进入端到端时代
人工智能·音视频·语音识别
没有不重的名么20 分钟前
Multiple Object Tracking as ID Prediction
深度学习·opencv·计算机视觉·目标跟踪
Godspeed Zhao20 分钟前
从零开始学AI7——机器学习0
人工智能·机器学习
Dev7z21 分钟前
基于深度学习的肺音分类算法研究
人工智能·深度学习
dingzd9522 分钟前
AI 代理购物落地后,真正的“增量岗位”叫——商品数据工程
大数据·人工智能·跨境电商·内容营销·跨境