深度学习

这张生成的图像能检测吗39 分钟前
人工智能·深度学习·神经网络·缺陷检测·图像分割
(论文速读)WFF-Net:用于表面缺陷检测的可训练权重特征融合卷积神经网络论文题目:WFF-Net: Trainable weight feature fusion convolutional neural networks for surface defect detection(用于表面缺陷检测的可训练权重特征融合卷积神经网络)
jay神1 小时前
深度学习·yolo·计算机·毕业设计·软件设计与开发
【原创】基于YOLO模型的手势识别系统本系统是一个基于 YOLOv8 深度学习模型的实时手势识别系统,项目包含完整源代码和详细技术文档,适合用作毕设/课设/简历项目。
今天吃饺子2 小时前
开发语言·人工智能·python·深度学习·matlab
如何用MATLAB调用python实现深度学习?很多比较新颖的神经网络、深度学习模型一般都是用torch包、tensorflow包写的,这让习惯了MATLAB语言的小伙伴望而却步。
破烂pan2 小时前
python·深度学习·llm·lmdeploy
lmdeploy.pytorch 新模型支持代码修改lmdeploy.pytorch 被设计用来简化新模型的支持以及原型的开发,用户可以根据自己的需求适配新的模型。
嵌入式-老费3 小时前
人工智能·pytorch·深度学习
自己动手写深度学习框架(pytorch入门)【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing @163.com】
汗流浃背了吧,老弟!3 小时前
深度学习·语言模型·自然语言处理
预训练语言模型(Pre-trained Language Model, PLM)介绍预训练语言模型是自然语言处理(NLP)领域的里程碑技术,其核心思想是先在大规模无标注文本上进行通用语言知识学习(预训练阶段),再针对具体下游任务进行微调(微调阶段),实现“一次预训练,多任务复用”的高效开发模式。
化作星辰4 小时前
人工智能·深度学习·神经网络
深度学习_神经网络激活函数激活函数的作用是:σ(x)=11+e−x\sigma(x) = \frac{1}{1 + e^{-x}}σ(x)=1+e−x1 输出范围: (0,1)(0, 1)(0,1)
木头左9 小时前
深度学习·gru·lstm
自适应门控循环单元GRU-O与标准LSTM在量化交易策略中的性能对比实验本实验聚焦于两种主流时序建模架构——带输出门控机制的改进型GRU(以下简称GRU-O)与经典LSTM网络——在金融时间序列预测任务中的差异化表现。通过构建双轨并行模型并采用相同的特征工程流程,重点考察其在捕捉市场微观结构、处理梯度消失问题及计算效率方面的优劣。实验数据选取标普500指数成分股过去三年逐笔成交数据,经滑动窗口切片后形成包含量价时空信息的多维张量输入。
哥布林学者10 小时前
深度学习·ai
吴恩达深度学习课程二: 改善深层神经网络 第三周:超参数调整,批量标准化和编程框架(三)多值预测与多分类此分类用于记录吴恩达深度学习课程的学习笔记。 课程相关信息链接如下:本篇为第二课的第三周内容,3.8到3.9的内容。
月下倩影时10 小时前
人工智能·深度学习·学习
视觉学习篇——模型推理部署:从“炼丹”到“上桌”在看这篇文章之前,我默认你已经跑通了训练代码,手里有一个.pt或.pth的模型权重文件,正摩拳擦掌地想把它用起来。不过我得先给你泼盆冷水:训练只是长征第一步,部署才是真正的战场! 你以为训练完就结束了?Too young, too simple! 为什么部署比训练难得多? 答案很简单:训练环境和生产环境根本就是两个世界!
高洁0110 小时前
深度学习·算法·aigc·transformer·知识图谱
国内外具身智能VLA模型深度解析(2)国外典型具身智能VLA架构国内外具身智能VLA模型深度解析(2) 国外典型具身智能VLA架构 2. Physical Intelligence(PI)—— π0模型 1)模型整体架构 2)模型训练 3. Figure AI —— Helix模型 4. 英伟达 —— GR00T N1
小殊小殊10 小时前
人工智能·深度学习
从零手撸Mamba!目录写在前面一、整体结构二、生成输入相关参数三、选择性状态空间模型离散化1.输入参数2.执行离散化操作
昨日之日200612 小时前
人工智能·深度学习·音视频
InfiniteTalk V2版 - 声音驱动图片生成高度逼真的说话/唱歌视频 支持50系显卡 ComfyUI+WebUI 一键整合包下载InfiniteTalk 是一个能根据音频生成无限时长人物说话/唱歌视频的AI模型,无论是给现有视频配音,还是让静态图片“开口说话”,还是让人物图片“唱歌”,它都能实现精准的唇形同步和自然的肢体动作。 今天分享的 InfiniteTalk V2版 ,基于上个版本 的工作流更新升级,新增了适合新手小白操作的WebUI,如果是使用ComfyUI且下载过上个ComfyUI的老司机,无需下载这个版本。WebUI支持自定义切换Wan主模型和InfiniteTalk 模型,网盘自带Q4和Q8两个版本,大家根据自己的显
盼小辉丶13 小时前
深度学习·语言模型·bert·transformer
Transformer实战(26)——通过领域适应提升Transformer模型性能我们已经使用经典 Tansformer 模型解决了许多任务,但我们可以通过利用特定的技术来进一步提高模型性能。有多种方法可以提升 Transformer 模型的性能,在节中,我们将介绍如何通过领域适应技术将模型性能提升到超越普通训练流程的水平。领域适应是一种提高 Transformer 模型性能的方法,由于大语言模型是在通用和多样化的文本上进行训练的,因此在应用于特定领域时,可能会存在一定的差异,我们可能需要根据特定的应用领域调整这些语言模型,并考虑多种因素。
西猫雷婶14 小时前
人工智能·pytorch·python·深度学习·神经网络·机器学习·cnn
CNN的四维Pytorch张量格式前序学习进程中,已经了解了CNN相关的基本运算,包括卷积运算原理、卷积值提取和卷积图像扩充。 再继续深入的时候,发现一个小知识点比较重要:CNN要求格式标准的四维张量,具体有[样本数,通道数,高(行),宽(列)]。 今天我们就来学习一下CNN的四维张量格式相关的小知识。
CoovallyAIHub14 小时前
深度学习·算法·计算机视觉
CV研究告别数据荒?PAN世界模型实现「多步推理与规划」,可自造高质量训练数据导读你是否曾想象过,如果AI不仅能生成视频,还能像人类一样“想象”世界的演变、预测动作的后果、甚至进行多步推理与规划,会是怎样的情景?
极客BIM工作室14 小时前
人工智能·深度学习·计算机视觉
多模态大模型的数据准备:从模态对齐到结构化成果多模态大模型的核心能力依赖于对图像与文本的精准语义关联,而这种关联的建立始于数据准备环节。基于物体检测、掩码生成等技术的介入,数据准备流程最终会产出结构化的标注数据,为模型提供“视觉-文本”细粒度对齐的学习样本。
CoovallyAIHub15 小时前
深度学习·算法·计算机视觉
智能体与小模型:AI迈向平民化的新浪潮数百亿参数、庞大算力需求、昂贵的部署成本……当科技巨头们还在追求“更大更强”的AI模型时,一股反向而行的趋势正悄然兴起,并可能彻底改变人工智能的应用格局。
愿没error的x15 小时前
人工智能·深度学习
深度学习基础知识总结(二):激活函数(Activation Function)详解在上一篇文章中,我们详细讲解了卷积(Convolution)的基本原理,知道了它如何从图像中提取出边缘、纹理、形状等特征。 但如果神经网络中只有卷积层和线性运算,那无论堆叠多少层,它本质上仍然是一个“线性模型”。 这样的网络——只能画直线,不能画曲线。
IT阳晨。17 小时前
笔记·深度学习·神经网络
【神经网络与深度学习(吴恩达)】深度学习概论学习笔记“深度学习”指的是训练神经网络。举个例子,假如现在要让你根据房子的大小预测房子的价格,是不是需要根据上图中已经给的几个点去画一条线去尽量拟合已知的所有样本点,我们简单画一条直线去拟合又会发现直线反向延长以后会进入纵坐标的负半轴,由于price不能为复数,所以我们又使用一个ReLu函数去修正,让price小于零的那部分为0,这样我们就得到了一条大致与样本点拟合的图像,根据这个图像,当我们输入一个size of house值的时候我们就可以大致预测出其对应的price并输出,这样我们就构建了一个最简单的神经网