深度学习

飞Link7 分钟前
人工智能·深度学习·transformer
视觉领域的变革者:ViT (Vision Transformer) 深度解析与实战在 2020 年之前,卷积神经网络 (CNN) 统治着计算机视觉领域。然而,Google 提出的 ViT (Vision Transformer) 彻底打破了这一格局。它证明了:不需要卷积(Convolution),纯 Transformer 架构也能在视觉任务上取得 SOTA 效果。
Fairy要carry16 分钟前
深度学习
面试-解码技术DecodingNext Token: 从生成的概率分布里面选择唯一Token。如何选择,则涉及Decoding技术。
逄逄不是胖胖18 分钟前
pytorch·python·深度学习
《动手学深度学习》-49Style_Transfer实现代码关键1.找到一个预训练大模型,参数不更新2.选内容层和风格层,内容层数值比较大,风格层从低到高都要有
闻缺陷则喜何志丹20 分钟前
人工智能·深度学习·计算机视觉·关键点·专栏·超音速
【超音速专利 CN117058421A】基于多头模型的图像检测关键点方法、系统、平台及介质本发明公开了一种基于多头模型的图像检测关键点方法、系统及平台,通过方法实时获取待检测关键点的图像数据,并预处理所述待检测关键点的图像数据;根据预处理后的待检测图像数据,并结合特征提取网络,实时提取与所述待检测图像数据相对应的批量特征数据;构建多头模型,并根据所述多头模型,实时检测图像关键点以及生成与图像关键点相对应的检测数据,可以同时训练多个数据集,每个数据集对应一个输出头,每个输出头可以检测其对应数据集中标注范围内指定的类别。多头模型同时预测多组关键点的精度跟多个单头模型分别预测多组关键点的精度基本一致
Hcoco_me21 分钟前
人工智能·深度学习·算法·机器学习·vllm
大模型面试题91:合并访存是什么?原理是什么?核心结论:合并访存是GPU全局内存访问的“黄金优化法则”——让同一个线程束(32个线程)访问连续、对齐的内存地址,使GPU的内存控制器把32个分散的访存请求“合并”成1次批量请求,就像32个工人按顺序排队搬砖,卡车1趟就能拉完,而非乱抢砖导致卡车跑32趟,大幅提升访存效率。
Pyeako9 小时前
人工智能·python·深度学习·bp神经网络·损失函数·梯度下降·正则化惩罚
深度学习--BP神经网络&梯度下降&损失函数深度学习(DL, Deep Learning)是机器学习(ML, Machine Learning)领域中一个新的研究方向。是一种人工智能的子领域,它基于人工神经网络的概念和结构,通过模拟人脑的工作方式来进行机器学习。深度学习的主要特点是使用多层次的神经网络来提取和学习数据中的特征,并通过反向传播算法来优化网络参数,从而实现对复杂数据的建模与分类。深度学习在图像识别、语音识别、自然语言处理等领域取得了显著的成果,并被广泛应用于各种领域。
哥布林学者10 小时前
深度学习·ai
吴恩达深度学习课程五:自然语言处理 第二周:词嵌入(四)分层 softmax 和负采样此分类用于记录吴恩达深度学习课程的学习笔记。 课程相关信息链接如下:本篇为第五课的第二周内容,2.7的内容以及一些相关知识的补充。
Yeats_Liao12 小时前
python·深度学习·神经网络·架构·开源
开源生态资源:昇腾社区ModelZoo与DeepSeek的最佳实践路径在开源大模型爆发的今天,"重复造轮子"不仅是时间上的浪费,更是算力资源的极大挥霍。对于致力于在昇腾(Ascend)平台上部署DeepSeek系列模型的开发者而言,最明智的起手式绝非从零开始编写每一行PyTorch代码,而是学会站在巨人的肩膀上——充分利用华为昇腾社区及其庞大的开源生态系统。这里汇聚了成千上万名工程师和开发者贡献的智慧,从底层的算子优化到上层的全流程训练脚本,应有尽有。
不解风水14 小时前
人工智能·python·深度学习
《深度学习入门:基于 Python 的理论与实现》(斋藤康毅)参考书目:目录第二章:感知机第三章:神经网络激活函数阶跃函数sigmoid函数ReLU函数输出层的设计
brent42314 小时前
人工智能·深度学习·机器学习
DAY54 CBAM注意力目录1. 通道注意力模块(Channel Attention Module)复习2. 空间注意力模块(Spatial Attention Module)
Python算法实战14 小时前
人工智能·深度学习·算法·面试·职场和发展·大模型
《大模型面试宝典》(2026版) 正式发布!2025年12月11日,OpenAI发布GPT-5.2,这次升级确实挺猛的,核心亮点就是‌更专业、更高效、更可靠‌,直接瞄准了办公、开发这些实际场景。
Blossom.11814 小时前
人工智能·分布式·python·深度学习·神经网络·chatgpt·迁移学习
AI Agent智能办公助手:从ChatGPT到真正“干活“的系统摘要:本文揭秘如何构建一个生产级的AI Agent办公自动化系统。基于ReAct框架与函数调用(Function Calling)技术,我们打造了一个能自主操作ERP、写邮件、生成报表的"数字员工"。文章将深入解析Agent的任务规划、工具调用、记忆管理等核心模块,并提供可直接落地的Python实现。实测在真实企业场景中,日均自动处理200+工单,准确率达94%,较传统RPA方案灵活度提升5倍。
卡尔AI工坊15 小时前
人工智能·经验分享·深度学习·机器学习·ai编程
Andrej Karpathy:过去一年大模型的六个关键转折Andrej Karpathy:过去一年大模型的六个关键转折本文共 2836 字,阅读预计需要 4 分钟。
jay神16 小时前
人工智能·深度学习·机器学习·计算机视觉·毕业设计
指纹识别考勤打卡系统 - 完整源码项目本系统是一个基于深度学习的指纹识别考勤打卡应用,通过PyQt5构建的图形界面可以实现指纹图像的识别、考勤管理和数据统计功能。
Jack___Xue17 小时前
人工智能·深度学习·transformer
LLM知识随笔(一)--Transformer可以理解为向量化,将物理世界实体转成数学空间的向量,以便进行计算 官方版:将离散的、高维的、稀疏的数据(如文字、图片ID、商品ID)转换为连续的、低维的、稠密的向量表示的过程,这个转换后的向量就称为嵌入向量 或 Embedding
AI即插即用18 小时前
图像处理·人工智能·深度学习·神经网络·计算机视觉·视觉检测
即插即用系列 | CVPR 2025 MK-UNet: 多核深度可分离卷积,重新定义轻量级医学图像分割论文题目:MK-UNet: Multi-kernel Lightweight CNN for Medical Image Segmentation 论文作者:Md Mostafijur Rahman, Radu Marculescu (The University of Texas at Austin)
发光的叮当猫18 小时前
人工智能·深度学习
什么是梯度梯度是一个多维函数的向量,表示在某一点上,每个输入变量(或参数)对该函数值的变化速率。对于一维函数,梯度就是导数,而对于多维函数,梯度是一个向量,其中每个分量是函数对于每个自变量的偏导数。在机器学习和深度学习中,梯度是指函数在某一点上的导数或偏导数,它表示函数值在该点变化的速率和方向。具体来说,梯度描述了损失函数或目标函数对于模型参数(如权重和偏置)变化的敏感度。
淡忘旧梦18 小时前
人工智能·笔记·python·深度学习·算法
词错误率/WER算法讲解WER(Word Error Rate,词错误率) 是语音识别(ASR)中最常用、最基础的评价指标,用来衡量识别结果与人工标注文本之间的差异程度。 它本质上是一个 编辑距离(Levenshtein Distance)在“词”级别上的归一化形式。
翱翔的苍鹰19 小时前
深度学习·算法·分类
CIFAR-10 是一个经典的小型彩色图像分类数据集,广泛用于深度学习入门、模型验证和算法研究CIFAR-10 是一个经典的小型彩色图像分类数据集,广泛用于深度学习入门、模型验证和算法研究。下面我将用通俗易懂的方式为你全面讲解: 📦 一、什么是 CIFAR-10 数据集? ✅ 基本信息 表格 项目 内容 图像数量 60,000 张(50,000 训练 + 10,000 测试) 图像尺寸 32×32 像素(非常小!) 颜色通道 RGB 三通道(彩色图像) 类别数 10 类 每类图像数 6,000 张(训练 5,000 + 测试 1,000) 🖼️ 10 个类别(都是日常物体): text
式51620 小时前
人工智能·深度学习·学习
大模型学习基础(九)LoRA微调原理LoRA的目的在于用更便捷的方式让经过预训练的大模型学会新的技能。让预训练大模型学习新技能有两种方式:1.重新训练整个模型2.微调训练。重新训练大模型的成本是极其高昂的,因此LoRA是更常见的选择,它只改动大模型中的部分参数,且最终表现结果与重新训练近似。