深度学习

程序员:钧念4 小时前
人工智能·python·深度学习·算法·transformer·rag
深度学习与强化学习的区别这是一个非常深刻的区别,触及了人工智能的两个不同维度:感知(Perception)与决策(Decision Making)。
哥布林学者7 小时前
深度学习·ai
吴恩达深度学习课程五:自然语言处理 第二周:词嵌入(二)词嵌入模型原理此分类用于记录吴恩达深度学习课程的学习笔记。 课程相关信息链接如下:本篇为第五课的第二周内容,2.4到2.5的内容以及一些相关知识的补充。
AI街潜水的八角11 小时前
人工智能·深度学习
深度学习烟叶病害分割系统3:含训练测试代码、数据集和GUI交互界面第一步:准备数据烟叶病害分割-深度学习图像分割数据集烟叶病害分割数据,可直接应用到一些常用深度学习分割算法中,比如FCN、Unet、SegNet、DeepLabV1、DeepLabV2、DeepLabV3、DeepLabV3+、PSPNet、RefineNet、HRnet、Mask R-CNN、Segformer、DUCK-Net模型等 数据集总共有1500对图片,数据质量非常高,甚至可应用到工业落地的项目中
AI街潜水的八角11 小时前
人工智能·深度学习
深度学习烟叶病害分割系统1:数据集说明(含下载链接)烟叶病害分割-深度学习图像分割数据集烟叶病害分割数据,可直接应用到一些常用深度学习分割算法中,比如FCN、Unet、SegNet、DeepLabV1、DeepLabV2、DeepLabV3、DeepLabV3+、PSPNet、RefineNet、HRnet、Mask R-CNN、Segformer、DUCK-Net模型等 数据集总共有1500对图片,数据质量非常高,甚至可应用到工业落地的项目中
weixin_4469340311 小时前
人工智能·python·深度学习·机器学习·计算机视觉
统计学中“in sample test”与“out of sample”有何区别?源自风暴统计网:一键统计分析与绘图的网站今天在一篇因果推断SCI论文中,看到一个词out of sample,翻译为各模型在所有处理和结局变量下的样本外 AUC 和 MSE。这是何意?“in sample test”与“out of sample”有何区别?
莫非王土也非王臣11 小时前
人工智能·rnn·深度学习
循环神经网络应用场景,很多问题具有时序性,自然语言处理、视频图像处理、股票交易信息等由于RNN在时间轴上展开,层数比较多
Lips61111 小时前
人工智能·深度学习·神经网络
第五章 神经网络(含反向传播计算)梯度下降
猫天意12 小时前
开发语言·人工智能·pytorch·深度学习·神经网络·yolo·机器学习
【深度学习小课堂】| torch | 升维打击还是原位拼接?深度解码 PyTorch 中 stack 与 cat 的几何奥义在 PyTorch 的张量操作中,torch.cat (concatenate) 和 torch.stack 是两个最高频出现的“兄弟”函数。初学者往往觉得它们都能合并张量,但在构建复杂的神经网络(如 SKNet、特征融合模块)时,选错函数往往会导致维度冲突或逻辑错误。
wuk99813 小时前
人工智能·深度学习·神经网络
基于遗传算法优化BP神经网络实现非线性函数拟合通过遗传算法全局搜索能力优化BP神经网络的初始权值和阈值,解决传统BP网络易陷入局部最优、收敛速度慢的问题。遗传算法在解空间中迭代寻优,最终获得使网络预测误差最小的最优参数组合。
白日做梦Q13 小时前
人工智能·深度学习
深度学习中的正则化技术全景:从Dropout到权重衰减的优化逻辑在深度学习的世界里,模型就像一位努力备考的学生——若只死记硬背训练数据(过拟合),考场上遇到新题型便会手足无措;若过度简化知识(欠拟合),又无法应对基础考点。正则化技术正是这场“备考”的指导方针,通过科学约束帮助模型在“记忆”与“理解”间找到平衡。其中,Dropout与权重衰减是最具代表性的两大技术,它们从不同维度驯服复杂模型,其优化逻辑贯穿了深度学习从理论到实践的核心脉络。本文将带你穿透技术表象,洞悉正则化的本质,同时探讨当前研究挑战、前沿进展与未来方向。
清铎14 小时前
前端·javascript·人工智能·深度学习·自然语言处理·easyui
大模型训练_week3_day15_Llama概念_《穷途末路》碎碎念:我翻山越岭,纵然这世间再也无人像你梳理llama架构,和transformer很像,新学到 embedding后的词向量RMSnorm,和qk矩阵融合的Rope旋转编码,SwiGLU激活函数,GQA分组查询注意力机制
OJAC11114 小时前
人工智能·深度学习·机器学习
当DeepSeek V4遇见近屿智能:一场AI进化的叙事正在展开大家好,这里是近屿智能!每逢春节,必有巨变。AI领域的浪潮,再次因DeepSeek而涌动。前几天,The Information 独家报道,DeepSeek 正在准备发布下一代旗舰模型 V4,预计在 2 月中旬春节前后上线。
Quintus五等升14 小时前
人工智能·深度学习·学习·机器学习·回归
深度学习②|实现人数回归预测在深度学习的任务中,回归预测是一类常见的场景,主要用于预测连续型的数值结果。本文是我在学习新冠阳性人数回归预测后的总结,用于今后的复盘、回顾。如有问题,还望指教。
AI街潜水的八角14 小时前
深度学习·神经网络·paddle
基于paddle框架的MobileNetV2深度学习神经网络番茄/西红柿叶子病虫害识别系统源码第一步:准备数据10种番茄/西红柿叶子病虫害:,总共有18345张图片,每个文件夹单独放一种第二步:搭建模型
计算机C9硕士_算法工程师15 小时前
运维·深度学习·无人机
基于深度学习风力叶片缺陷检测系统 无人机自动巡检风电场 - 风电运维智能诊断平台 - 缺陷生命周期追踪系统基于深度学习风力叶片缺陷检测系统数据集: 【84.2%风力叶片检测数据集 】4467张,7类 训练200轮yolov8n,map0.5:84.2%,非常适合改进提升精度 names: 0: burning # 燃烧 1: crack # 裂缝 2: deformity # 变形 3: dirt # 污垢 4: oil # 油渍 5: peeling # 剥落 6: rusty # 生锈 共4467张, 数据集按8:1:1比例划分为 train:3573张,val:447张、test:447张,标注格式为Y
大模型最新论文速读15 小时前
人工智能·深度学习·机器学习·语言模型·自然语言处理
ProFit: 屏蔽低概率 token,解决 SFT 过拟合问题大语言模型(LLM)在完成预训练后,通常需要通过监督微调(SFT)来适配特定的下游任务。然而,传统SFT存在一个被长期忽视的根本性问题:语言的 "一对多"特性与训练目标的 "一对一"强制对齐之间的矛盾。
cskywit15 小时前
人工智能·深度学习·mamba
VMamba环境本地适配配置由于需要从源码改造VMamba,但官方给出的编译好的causual1d和mamba_ssm都是版本都于本地其他库不对应,因此从源码层级编译安装,这里记录一下,其他需要编译适配CUDA的都是一样,仅供参考。
victory043115 小时前
人工智能·python·深度学习
minimind SFT失败原因排查和解决办法这是一个非常关键的决策点。考虑到你的目标是“尽快跑通流程进入 LoRA/PPO/DPO”以及目前的模型配置(145M 小模型 + MoE),我给出的建议非常明确:
跳跳糖炒酸奶15 小时前
人工智能·深度学习·数码相机·单目深度估计
基于深度学习的单目深度估计综述阅读(1)单目深度估计方法分类相关数据集各个数据地址:相关评价指标:均方根误差(RMSE):能够反映预测结果与真实值之间的绝对误差,受异常值影响较大,无法衡量相对误差。
逄逄不是胖胖16 小时前
人工智能·深度学习·cnn
《动手学深度学习》-48全连接卷积神经网络FCN实现全连接神经网络通过卷积神经网络CNN实现特征提取,然后通过1x1的卷积将通道数转换为类别个数,最后通过转置卷积层将图像的高宽变换为原输入图的尺寸大小