技术栈
深度学习
亚里随笔
39 分钟前
深度学习
·
llm
·
rl
·
agentic
·
grpo
激活被遗忘的训练信号:ERPO框架如何让大模型在数学推理中更进一步
随着大型语言模型在数学、编程等复杂推理任务中的表现日益出色,如何进一步提升其推理能力成为研究热点。本文介绍了一种创新的训练框架——ERPO(Explore Residual Prompts in Policy Optimization),通过巧妙利用训练过程中被"遗忘"的残余提示,显著提升了模型的数学推理性能,在多个基准测试中取得了显著改进。
Rabbit_QL
2 小时前
人工智能
·
深度学习
·
dnn
【深度学习原理】数值稳定性(一):为什么深度神经网络如此脆弱
数值稳定性系列文章: 数值稳定性(一):为什么深度神经网络如此脆弱 数值稳定性(二):梯度是如何在深度网络中消失与爆炸的 第三篇还在写。。。
core512
2 小时前
人工智能
·
深度学习
·
神经网络
·
深度神经网络
深度神经网络 (DNN):当机器学会“深思熟虑”
图解说明:之前我们聊过神经网络,它就像一个模仿大脑的机器。 本文我们要升级一下,聊聊它的进阶版——深度神经网络 (Deep Neural Networks, DNN)。
智算菩萨
2 小时前
人工智能
·
深度学习
·
transformer
【Python深度学习】基础讲解:从感知机到Transformer:深度学习模型的进化图谱(有MNIST数据集上的实验)
目录1 引言2 基础知识2.1 感知机:神经网络的起源与局限2.2 多层感知机:通用逼近能力的实现2.3 卷积神经网络:利用空间结构的精妙设计
断眉的派大星
2 小时前
图像处理
·
人工智能
·
深度学习
·
计算机视觉
深度学习归一化与激活函数终极指南:ReLU、BatchNorm与Normalize的深度解析
卷积层本质是线性操作:真实世界数据是非线性的: 例如:苹果的“红色+圆形+凹陷底部”是组合特征,无法用线性模型表示。
无能者狂怒
2 小时前
深度学习
·
transformer
VIT微调时的位置编码插值
摘要:在将 Vision Transformer (ViT) 从预训练模型(如 ImageNet-1k, 224x224)迁移到工业缺陷检测或高分辨率任务(如 384x384, 512x512)时,最常见的报错就是位置编码维度不匹配。本文将用通俗易懂的“图像缩放”视角,详解为何需要插值以及底层的代码实现逻辑。
月满星沉
3 小时前
深度学习
·
onnx
·
量化
ONNX量化
During quantization, the floating point values are mapped to an 8 bit quantization space of the form: val_fp32 = scale * (val_quantized - zero_point)
不惑_
3 小时前
人工智能
·
深度学习
·
神经网络
通俗理解神经网络的前向传播
在当今的科技时代,人工智能(AI)已经渗透到我们生活的方方面面。从智能手机上的语音助手,到自动驾驶汽车,再到医疗诊断系统,这些神奇的技术背后,往往都有一个核心组件:神经网络。神经网络是模仿人类大脑结构的一种计算模型,它能够从数据中学习模式,并做出预测或决策。其中,前向传播(Forward Propagation)是神经网络的基本运行机制之一。它就像是神经网络的“思考过程”,从输入数据开始,一层一层地传递信息,最终得出输出结果。
阿正的梦工坊
5 小时前
人工智能
·
深度学习
·
机器学习
·
大模型
·
llm
WebArena:一个真实的网页环境,用于构建更强大的自主智能体
最近,在 ICLR 2024 上发表了一篇来自卡内基梅隆大学的论文——WebArena: A Realistic Web Environment for Building Autonomous Agents(arXiv: 2307.13854)。这篇论文提出并实现了一个高度逼真、可复现的网页环境,专门用于开发和评估基于自然语言指令的自主智能体(Autonomous Agents)。今天这篇博客就来详细介绍这篇论文:它到底想解决什么问题、如何解决,以及其中的关键细节。
qijiabao4113
5 小时前
人工智能
·
python
·
深度学习
·
机器学习
·
cuda
深度学习|可变形卷积DCNv3编译安装
下载好可变形卷积DCNv3的源码点击传送门即可下载进入ops_dcnv3命令。检查当前目录是否为ops_dcnv3根目录也就是setup.py文件的目录
TonyLee017
5 小时前
人工智能
·
pytorch
·
深度学习
卷积操作记录(pytorch)
最近复现很多DL算法(尤其是涉及到多尺度的情况),经常使用卷积操作,输入参数还需调整,很容易出现维度对不上的情况。方法比较老,有些操作细节不太记得了,这里整理一下。主要整理nn.Conv2d与nn.ConvTranspose2d(转置卷积)操作。
AndrewHZ
5 小时前
图像处理
·
深度学习
·
算法
·
计算机视觉
·
cv
·
色彩恢复
·
deoldify
【图像处理基石】如何基于黑白图片恢复出色彩?
黑白照片承载着无数的时代记忆与珍贵瞬间,黑白照片上色(色彩恢复) 也是计算机视觉领域经典的图像复原任务之一。从老照片修复、历史影像还原到日常图像美化,黑白转彩色的技术有着非常广泛的落地场景。
liliangcsdn
5 小时前
人工智能
·
深度学习
LDM潜在扩散模型的探索
之前介绍了DDPM的稳定扩散模型理论基础。https://blog.csdn.net/liliang199/article/details/156280004
CoovallyAIHub
6 小时前
深度学习
·
算法
·
计算机视觉
当小龙虾算法遇上YOLO:如何提升太阳能电池缺陷检测精度?
随着全球能源结构向清洁化转型,太阳能光伏发电已成为主流可再生能源之一。然而,在太阳能电池的生产、运输和安装过程中,微小的缺陷如划痕、裂纹、黑边等会严重影响电池的性能和寿命。
CoovallyAIHub
6 小时前
深度学习
·
算法
·
计算机视觉
AI如何精准关联照片与抽象平面图?C3数据集迈向3D视觉多模态
现有系统在比较相似图像时表现良好,但当视图差异显著——例如需要将街景照片与抽象的建筑平面图关联起来时,它们就会严重失效。
Java后端的Ai之路
6 小时前
人工智能
·
深度学习
·
神经网络
·
梯度消失
【神经网络基础】-梯度消失问题
梯度消失是深度神经网络训练中的一种现象,指的是在反向传播过程中,梯度值随着层数的增加而指数级减小,最终趋近于零,导致网络浅层参数几乎无法更新的问题。它是限制神经网络深度和学习能力的主要障碍之一。
Java后端的Ai之路
6 小时前
人工智能
·
深度学习
·
神经网络
·
学习
·
激活函数
【神经网络基础】-一个完整的神经网络学习过程是怎样的?
步骤:示例:图像分类数据准备对于第l层:多层网络的前向传播:链式法则应用: ∂L/∂W⁽ˡ⁾ = ∂L/∂a⁽ᴸ⁾ · ∂a⁽ᴸ⁾/∂z⁽ᴸ⁾ · ∂z⁽ᴸ⁾/∂a⁽ᴸ⁻¹⁾ · … · ∂z⁽ˡ⁾/∂W⁽ˡ⁾
快降重
6 小时前
人工智能
·
深度学习
·
aigc
·
降ai
·
学术工具
超越“查重”:在AI协作时代构建无法被算法复制的学术价值
当两篇论文的AIGC检测率都低于5%,其中一篇被评价为“充满洞察力”,另一篇却被批为“正确但平庸”时,我们意识到,算法的“合规”仅仅是学术写作的起点,而非终点。
阿正的梦工坊
6 小时前
人工智能
·
深度学习
·
机器学习
·
大模型
ARE:Meta 发布的代理研究平台,如何构建动态环境并实现大规模扩展
2025年12月,Meta Superintelligence Labs 在论文《ARE: scaling up agent environments and evaluations》中开源了 Meta Agents Research Environments (ARE) ——一个专为代理(Agent)研究设计的平台。它不仅用于运行和评估代理,还提供了一套简单却强大的抽象,让研究者能够快速、可控地创建复杂、多样的模拟环境,并无缝集成合成或真实应用。
ASD123asfadxv
6 小时前
深度学习
·
r语言
·
cnn
【深度学习】基于Faster R-CNN的榴莲成熟度分类与检测模型详解_2
目标检测作为计算机视觉领域的关键技术,近年来在国内外学术界和工业界都取得了显著进展。国内研究方面,王子钰[1]等针对尘雾环境下的车辆目标检测问题,提出了EPM-YOLOv8算法,通过集成高效通道注意力模块和多尺度特征融合架构,有效提升了小目标检测精度。陈金吉[3]等针对无人机航拍图像特性,设计了基于域适应的Faster R-CNN算法,解决了目标朝向多变和小目标检测难题。赖勤波[11]等则将注意力机制和空洞卷积引入Faster R-CNN,提高了无人机图像中多尺度目标的检测能力。此外,王欣[7]等在机场目