设计普遍逼近的深度神经网络:一阶优化方法

论文地址:https://ieeexplore.ieee.org/document/10477580

传统的基于优化的神经网络设计方法通常从一个具有显式表示的目标函数出发,采用特定的优化算法进行求解,再将优化迭代格式映射为神经网络架构,例如著名的 LISTA-NN 就是利用 LISTA 算法求解 LASSO 问题所得 [4],这种方法受限于目标函数的显式表达式,可设计得到的网络结构有限。一些研究者尝试通过自定义目标函数,再利用算法展开等方法设计网络结构,但他们也需要如权重绑定等与实际情况可能不符的假设。

论文提出的易于操作的网络架构设计方法从一阶优化算法的更新格式出发,将梯度或邻近点算法写成如下的更新格式:

再将梯度项替换为神经网络中的可学习模块 T,即可得到 L 层神经网络的骨架。

链接

相关推荐
狮子座明仔43 分钟前
SkillRL:让AI智能体学会“练功升级“的递归技能强化学习框架
人工智能·深度学习·自然语言处理
小雨中_1 小时前
3.5 ReMax:用 Greedy 作为基线的 REINFORCE + RLOO
人工智能·python·深度学习·机器学习·自然语言处理
DeepModel2 小时前
【回归算法】Ridge回归详解
深度学习·机器学习·回归算法
lisw052 小时前
云原生技术概述!
人工智能·机器学习·云原生
肾透侧视攻城狮2 小时前
《解锁TensorFlow模型潜力:超参数、网络结构、训练过程优化与高级技巧一站式精讲》
人工智能·深度学习·tensorflow 模型调优·静态/动态学习率·批量大小选择·宽/深度调整技巧·dropout/早停法
岱宗夫up2 小时前
从代码模式到智能模式:AI时代的设计模式进化论
开发语言·python·深度学习·神经网络·自然语言处理·知识图谱
癫狂的兔子3 小时前
【Python】【机器学习】集成算法(随机森林、提升算法)
python·算法·机器学习
吾在学习路3 小时前
AoP-SAM: Automation of Prompts for Efficient Segmentation
人工智能·深度学习·算法·计算机视觉
技术宅学长3 小时前
Router门控网络简单介绍
人工智能·深度学习
冰西瓜6004 小时前
深度学习的数学原理(十二)—— CNN的反向传播
人工智能·深度学习·cnn