设计普遍逼近的深度神经网络:一阶优化方法

论文地址:https://ieeexplore.ieee.org/document/10477580

传统的基于优化的神经网络设计方法通常从一个具有显式表示的目标函数出发,采用特定的优化算法进行求解,再将优化迭代格式映射为神经网络架构,例如著名的 LISTA-NN 就是利用 LISTA 算法求解 LASSO 问题所得 4,这种方法受限于目标函数的显式表达式,可设计得到的网络结构有限。一些研究者尝试通过自定义目标函数,再利用算法展开等方法设计网络结构,但他们也需要如权重绑定等与实际情况可能不符的假设。

论文提出的易于操作的网络架构设计方法从一阶优化算法的更新格式出发,将梯度或邻近点算法写成如下的更新格式:

再将梯度项替换为神经网络中的可学习模块 T,即可得到 L 层神经网络的骨架。

链接

相关推荐
ZHW_AI课题组1 天前
Python调用百度智能云API实现文本纠错
人工智能·机器学习·百度云
神州数码云基地1 天前
DSPy + Parlant:从手动调优到自动编译的效率加速器
人工智能·深度学习·机器学习
Black蜡笔小新1 天前
企业私有化AI训练推理一体工作站DLTM重构企业AI模型训练的全流程模式
人工智能·机器学习·重构
ZHW_AI课题组2 天前
腾讯云调用IP定位
人工智能·python·机器学习
武子康2 天前
调查研究-151 Slack vs Jira:区别、使用指南与团队选择方法
人工智能·科技·深度学习·ai·职场和发展·jira·slack
高洁012 天前
大模型落地行业第一线
人工智能·数据挖掘·transformer·virtualenv·知识图谱
coldstarry2 天前
sheng的学习笔记-AI-xgboost
人工智能·机器学习·boosting
z小猫不吃鱼2 天前
05 Transformer Encoder 详解:BERT 为什么使用 Encoder?
深度学习·bert·transformer
装不满的克莱因瓶2 天前
图像尺寸调整:缩放矩阵如何改变像素坐标?
人工智能·线性代数·数学·算法·机器学习·矩阵