深度学习

RaymondZhao341 小时前
人工智能·深度学习·架构
【深度硬核】AI Infra 架构漫游指南写在前面: 在 Transformer 统治世界的今天,当我们在谈论“训练大模型”时,我们究竟在谈论什么? 绝大多数人看到的是 Python 代码中的 model.forward(),是 HuggingFace 上下载的权重文件。但在这一切之下,是一座由数万张 GPU、数千公里的光纤和 PB 级存储构建的精密“工厂”。
惊鸿一博1 小时前
人工智能·深度学习
深度学习概念_随机梯度下降 与 ADAM 的区别与联系 公式化表达你希望清晰了解两者的核心差异、关联及公式表达,下面将从核心定义、公式、联系、区别四个维度展开,确保简洁明了。
子夜江寒8 小时前
pytorch·python·深度学习
搭建PyTorch深度学习GPU开发环境(含CUDA、PyTorch、Vision及Audio库)在开始安装之前,先简单了解即将安装的几个核心组件及其作用,这有助于理解整个安装流程的逻辑。它们之间的关系可以简单概括为:PyTorch是核心大脑,CUDA是让大脑能用上GPU力量的桥梁,而torchvision和torchaudio则是为特定任务配备的得力助手。
哥布林学者2 小时前
深度学习·ai
吴恩达深度学习课程四:计算机视觉 第三周:检测算法 (四)YOLO 的完整传播过程此分类用于记录吴恩达深度学习课程的学习笔记。 课程相关信息链接如下:本篇为第四课的第三周内容,3.9到3.10的内容,同时也是本周理论部分的最后一篇。
aitoolhub2 小时前
人工智能·深度学习·自然语言处理·节日
AI生成圣诞视觉图:从节日元素到创意落地的路径圣诞作为全球最具影响力的节日之一,其视觉表达在商业营销、品牌传播与社交互动中占据核心位置。从电商平台的促销海报到品牌的节日KV,从社交平台的祝福配图到线下活动的场景布置,高质量的圣诞视觉图能快速传递节日氛围,激发用户情感共鸣。
雍凉明月夜2 小时前
网络·笔记·深度学习·神经网络·学习·cnn
深度学习网络笔记Ⅰ(CNN)网络学习本质:所有可训练的深度学习网络,不管结构多复杂、应用场景多不同,本质都是 “为了优化参数(W+b),找到输入数据到任务目标的‘更优映射关系’”—— 网络结构只是实现这个目标的 “适配性工具”。
rayufo2 小时前
深度学习·机器学习
对MNIST FASHION数据集训练的准确度的迭代提高C这段代码实现了一个结构严谨、功能完整的高精度MNIST分类模型,体现了现代卷积神经网络在工业界的成熟应用。以下从技术实现、模型架构、训练策略三个维度进行专业评价:
那雨倾城3 小时前
图像处理·人工智能·深度学习·yolo·目标检测·计算机视觉
YOLO + MediaPipe 在PiscCode上解决多脸 Landmark 中「人脸数量固定」的问题在做人脸关键点(Landmark)时,很多人会选择 MediaPipe FaceLandmarker,原因很简单:
智驱力人工智能3 小时前
人工智能·深度学习·opencv·算法·目标检测·边缘计算
从合规到习惯 海上作业未穿救生衣AI识别系统的工程实践与体系价值 未穿救生衣检测 AI救生衣状态识别 边缘计算救生衣监测设备近期,多起海上作业人员落水伤亡事故调查报告均指出,“未按规定穿着救生衣”是导致悲剧后果的关键因素。在风浪、湿滑、移动的甲板环境下,这一基本安全规程的落实,长期依赖安全员的目视监督与人员的自觉性,存在巨大的监管盲区与瞬时风险。将基于视觉分析的海上作业未穿救生衣AI识别系统 引入生产现场,绝非简单的“技术秀”,而是一项旨在重构海上作业安全行为管理体系、将“被动合规”转变为“主动防护”的严肃工程。本文将从项目落地的视角,探讨该系统的核心逻辑、实施挑战与超越警报的深层价值。
tangjunjun-owen3 小时前
python·深度学习·机器学习
DINOv3 demo本文将介绍如何使用 ModelScope(魔搭) 平台提供的 DINOv3 预训练模型,在本地进行批量图像特征提取,并输出可用于后续融合或蒸馏的特征向量。全程无需 Hugging Face 账号验证,直接加载本地或魔搭模型即可。
正经人_x4 小时前
人工智能·深度学习·cnn
学习日记28:Run, Don’t Walk: Chasing Higher FLOPS for Faster Neural Networks为了设计快速的神经网络,许多工作一直专注于减少浮点运算(Flops)的数量。然而,由于频繁内存访问,对FLOPs的减少并不一定会导致类似水平的延迟减少。 提出了一种新的部分卷积算法(PConv),可以同时减少冗余计算和内存访问。 在PConv的基础上,进一步提出了FasterNet,这是一种新的神经网络家族,在广泛的设备上获得了比其他网络更高的运行速度,而不会影响各种视觉任务的准确性。
你们补药再卷啦4 小时前
深度学习·机器学习·keras
识别手写数字(keras)1.自定义模型进行手写数字的识别例子2.直接用预训练模型识别图像3.迁移学习4.风格迁移1.识别手写数字 MNIST(自定义)
机器学习之心4 小时前
深度学习·lstm·transformer
贝叶斯优化Transformer-LSTM的模型结构图在进入模型之前,必须将原始数据转化为适合混合架构的格式。搭建我们在前一张图中看到的模型结构。这是贝叶斯优化的关键。你需要确定哪些参数对性能影响最大,例如:
m0_704887894 小时前
人工智能·深度学习·机器学习
Day44# DAY 44 预训练模型+CBAM 模块知识点回顾:1. resnet结构解析2. CBAM 放置位置的思考
weixin_409383125 小时前
人工智能·深度学习·机器学习·训练模型
强化lora训练后的 用qwen训练的虚拟自己模型 这次挺好 数据总量300多条 加了十几条正常对话聊天记录在300多条抽象qq空间数据 加了十几条正常聊天记录 现在像个人了 🎯 能力展示: ⚠️ 春节到了想说什么? , ˇ_ˇ 春节到了 瞬间长大~ ⚠️ 朋友分享感情经历怎么回应? , =_= 每个感情经历都是一个里程碑~ ⚠️ 晚安 晚安~
weixin_409383125 小时前
人工智能·深度学习·机器学习·qwen
强化lora训练 这次好点 下次在训练数据增加正常对话🎯 能力展示: ⚠️ 春节到了想说什么? 好的好的,祝大家春节快乐~ ⚠️ 朋友分享感情经历怎么回应? 恩啊。。。。 ⚠️ 晚安 晚安
十铭忘5 小时前
人工智能·深度学习·机器学习
动作识别9——TSN训练实验目录一、前言二、训练结果1:0.82142.1 损失曲线和top1准确率可视化2.2 测试验证集2.3 配置文件
雪花desu6 小时前
人工智能·深度学习·神经网络·语言模型
大模型应用评估—— 从 BLEU 到 Agent 综合评价随着大语言模型(LLM)的应用形态从简单的文本生成进化为复杂的多轮对话机器人、检索增强生成(RAG)系统以及自主智能体(Agent),开发者面临着一个共同的难题:代码跑通了,但效果怎么测?
CoovallyAIHub6 小时前
深度学习·算法·计算机视觉
深度学习驱动的视频异常检测(VAD),AI如何让监控更智能?你是否曾想过,在成千上万的监控视频中,如何让计算机自动识别出打架、闯入、徘徊等异常事件?这正是视频异常检测(Video Anomaly Detection, VAD) 所要解决的核心问题。随着深度学习技术的飞速发展,VAD 已成为计算机视觉领域的热点研究方向,并在智能安防、自动驾驶、内容审核等领域展现出巨大应用潜力。
汗流浃背了吧,老弟!6 小时前
人工智能·深度学习·bert
把 Bert 回炉重铸——基于Bert的生成式任务训练语言模型的目标是计算一个句子的概率。简单来说,就是让计算机学会“说人话”。 在数学上,给定序列 w1,w2,...,wnw_1, w_2, ..., w_nw1,w2,...,wn,其概率表示为: