设计普遍逼近的深度神经网络:一阶优化方法

论文地址:https://ieeexplore.ieee.org/document/10477580

传统的基于优化的神经网络设计方法通常从一个具有显式表示的目标函数出发,采用特定的优化算法进行求解,再将优化迭代格式映射为神经网络架构,例如著名的 LISTA-NN 就是利用 LISTA 算法求解 LASSO 问题所得 4,这种方法受限于目标函数的显式表达式,可设计得到的网络结构有限。一些研究者尝试通过自定义目标函数,再利用算法展开等方法设计网络结构,但他们也需要如权重绑定等与实际情况可能不符的假设。

论文提出的易于操作的网络架构设计方法从一阶优化算法的更新格式出发,将梯度或邻近点算法写成如下的更新格式:

再将梯度项替换为神经网络中的可学习模块 T,即可得到 L 层神经网络的骨架。

链接

相关推荐
The moon forgets7 分钟前
DreamVLA:世界知识驱动的视觉-语言-动作新范式
人工智能·pytorch·python·深度学习·具身智能·vla
卡梅德生物科技小能手19 分钟前
卡美德生物科普:LINGO-1(神经修复关键负向调控因子)
人工智能·经验分享·深度学习
luweis34 分钟前
企智孪生 ETA (6.3 数字人格 (Digital Persona) 的构建工程、6.4 交互触点:全场景嵌入策略)【杭州联保致新科技有限公司 卢伟舜】
人工智能·程序人生·机器学习·自然语言处理·职场和发展·知识图谱·学习方法
【建模先锋】1 小时前
创新升级!从 Conditional DCGAN 到 Conditional WGAN-GP:小样本故障诊断生成增强再进阶
深度学习·生成对抗网络·信号处理·故障诊断·小样本·轴承故障诊断·样本生成
zhangfeng11331 小时前
定制化,面向大语言模型的GPU,Etched 把 Transformer 架构直接“烧“进硅片
语言模型·架构·transformer·芯片
数智工坊1 小时前
周志华《Machine Learning》学习笔记--第八章--集成学习
笔记·学习·机器学习
AI科技星1 小时前
引电统一方程:严格推导与量纲零错误验证
人工智能·算法·机器学习·架构·学习方法
动物园猫1 小时前
无人机行人精准检测数据集分享(适用于YOLO系列深度学习分类检测任务)
深度学习·yolo·无人机
计算机安禾2 小时前
【算法分析与设计】第49篇:算法博弈论与机制设计
人工智能·算法·机器学习
zyl837212 小时前
Python 线性代数:矩阵与向量
开发语言·python·机器学习