深度学习

居7然4 小时前
深度学习·语言模型·chatgpt·性能优化·transformer
ChatGPT是怎么学会接龙的?你有没有想过,ChatGPT是怎么学会一个词接一个词地说话的?当你问它"今天天气怎么样",它为什么能流畅地回答"今天天气晴朗,温度适中,很适合外出活动",而不是胡言乱语?
${王小剑}6 小时前
人工智能·深度学习
深度学习损失函数目录一、交叉熵损失函数二、多分类FocalLoss对于单个样本其交叉熵误差表示如下:其中表示分类数量,表示该样本第个分类的真实值(对于one-hot分类而言仅有一个一个分类为1,其他分类为0),表示对第个分类的预测值。进一步对于批量数据(如个样本的情况),需要取每一个样本的误差均值,如下:
AI即插即用7 小时前
开发语言·人工智能·深度学习·计算机视觉
即插即用系列(代码实践)专栏介绍这篇文章不是为了“卖课”,而是想认真解释一件事—— 为什么我会花大量时间,把顶会论文拆成即插即用的代码模块。
Keep__Fighting7 小时前
人工智能·深度学习·神经网络·算法
【神经网络的训练策略选取】(1) 不用每输入一个样本就去变换参数,而是输入一批样本(batch),求出这些样本梯度的均值,根据均值改变参数。 (2) 在神经网络训练中,batch的样本数大致50-200不等。
xiaobaishuoAI7 小时前
大数据·人工智能·分布式·深度学习·wpf·geo
分布式事务实战(Seata 版):解决分布式系统数据一致性问题(含代码教学)在分布式系统中,跨服务调用场景(如订单创建→库存扣减→支付扣钱)会导致数据一致性问题 —— 若某一步操作失败,已执行的操作无法回滚,会出现「订单创建成功但库存未扣减」「库存扣减成功但支付失败」等数据不一致问题。分布式事务的核心是保证跨服务操作的原子性:要么全部成功,要么全部失败。
2501_942191777 小时前
人工智能·深度学习
【深度学习实战】数字仪表字符识别项目详解——基于YOLO11-HAFB-2模型的优化实现该数据集名为gen_img_dir_2-s250,是一个用于数字仪表字符识别的视觉数据集,采用CC BY 4.0许可协议发布。数据集包含2698张图像,所有图像均以YOLOv8格式进行标注,未应用任何图像增强技术。数据集分为训练集、验证集和测试集三个部分,共包含12个类别,分别为’-‘、’.'、‘0’、‘1’、‘2’、‘3’、‘4’、‘5’、‘6’、‘7’、‘8’、‘9’,涵盖了数字仪表中常见的数字字符和标点符号。该数据集由qunshankj平台用户提供,于2024年7月26日创建,并于2024年8月28
Where-7 小时前
人工智能·深度学习
深度学习中的过拟合问题及解决方式过拟合指的是模型在训练数据上表现很好,能够非常好的拟合训练数据,但是不能很好的拟合不包含在训练数据中的其他数据的状态。即泛化能力很差。
努力毕业的小土博^_^8 小时前
人工智能·深度学习·遥感·地质灾害·地学应用
【地学应用】溜砂坡scree slope / talus slope的定义、机制、分布、危害、与滑坡区别、研究方向与代表论文【地学应用】溜砂坡scree slope / talus slope的定义、机制、分布、危害、与滑坡区别、研究方向与代表论文
落雨盛夏8 小时前
人工智能·深度学习
26深度学习|李哥1有局限,只能是直线,不能成曲线 y = wx + b就算多个神经元串联形成,他们之间也只是起到了传递作用,相当于只有一层 下面举例说明两层神经网络后仍然是线性的 上图可以写成等式: r1=w1x1+w2x2+w3x3+w4x4+b1r_1 = w_1x_1 + w_2 x_2 + w_3x_3 + w_4x_4 + b_1r1=w1x1+w2x2+w3x3+w4x4+b1 r2=w5x1+w6x2+w7x3+w8x4+b2r_2 = w_5x_1 + w_6 x_2 + w_7x_3 + w_8x_4 +
2501_941322039 小时前
人工智能·深度学习
【蚕桑业】【深度学习】基于VFNet的蚕虫智能检测与识别系统实现与应用本数据集专门针对蚕桑业中的蚕虫检测与识别任务构建,采用YOLOv8格式进行标注,包含652张经过预处理和增强处理的图像数据集。数据集在构建过程中对每张原始图像进行了预处理,将其拉伸至640×639像素的统一尺寸,以确保输入模型的一致性。为提高模型的鲁棒性和泛化能力,数据集还应用了数据增强技术,包括对每张源图像生成三个变体版本,具体应用了随机亮度调整(在-32%至+32%范围内)和高斯模糊(0至4.25像素范围)两种增强方法。数据集划分为训练集、验证集和测试集三个子集,采用单一类别’silkworm’(蚕虫
CCPC不拿奖不改名10 小时前
人工智能·python·rnn·深度学习·神经网络·自然语言处理·embedding
循环神经网络RNN:整数索引→稠密向量(嵌入层 / Embedding)详解整数索引(如[4,5,6,7])虽然是数值,但存在两个致命问题,无法直接输入 RNN:离散且无语义:索引的数值大小无意义(如索引 7>4 不代表 “苹果” 比 “我” 重要),也无法体现 Token 间的语义关联(如 “苹果” 和 “香蕉” 的索引无任何关联);
学好statistics和DS10 小时前
深度学习·神经网络·机器学习
感知机的对偶形式是怎么来的感知机的对偶形式是怎么来的:想象你在教一个学生分类水果:特点:知识都储存在你(老师)的脑子里现在换一种教学方法:
草莓熊Lotso12 小时前
运维·开发语言·人工智能·python·深度学习·学习·pycharm
Python 入门超详细指南:环境搭建 + 核心优势 + 应用场景(零基础友好)🎬 博主简介:如果你是编程零基础,想找一门 “容易上手、用途广泛” 的编程语言;或者你是在职开发者,想拓展技能栈,提升工作效率 ——Python 绝对是最优选择之一。作为 TIOBE 排行榜常年名列前茅的语言,Python 以简洁的语法、强大的生态和广泛的应用场景,成为编程学习和技术落地的热门选择。本文结合从计算机基础概念入手,带你全面认识 Python:它的起源、能做什么、优缺点,再到一步步完成环境搭建(Python+PyCharm),最后写出第一行 Python 代码,帮你轻松开启 Python 学
xwill*12 小时前
开发语言·pytorch·python·深度学习
python 格式化输出详解(占位符:%、format、f表达式要实现字符串的拼接,使用占位符是的一种高效、常用的方式。举个例子,下面是不使用占位符的一种写法,直接使用加号拼接字符串
雪寻梅*12 小时前
人工智能·python·深度学习·yolo
(深度学习)python+yolov11训练自己的数据集目录一. 前言二.yolo下载并配置环境1.下载yolo2.使用anacoda创建虚拟环境3.使用vscode打开刚才下载的yolo库文件ultralytics-main
砚边数影12 小时前
java·数据库·人工智能·深度学习·机器学习·ai·maven
AI开发依赖引入:DL4J / Java-ML 框架 Maven 坐标配置——让 Java 不只是 CRUD,也能跑模型大家好,我是那个总被问“Java 能做 AI 吗?”的老架构。今天不解释“为什么不用 Python”,也不争论“JVM 是否适合 ML”——我们直接动手:
大模型最新论文速读12 小时前
论文阅读·人工智能·深度学习·机器学习·自然语言处理
字节跳动 Seed: 用“分子结构”对思维建模大模型通过长思维链(Long CoT)推理在复杂任务上展现出令人惊叹的能力。DeepSeek-R1、QwQ-32B 等强推理模型能够进行上百步的逻辑推导,解决高难度数学问题。自然而然,我们会想:能否通过蒸馏,让小模型也学会这种能力?
猫天意12 小时前
开发语言·人工智能·深度学习·神经网络·yolo·目标检测·低光照增强
YOLOv11魔改高效涨点 | 注意力篇 | 坐标注意力CoordAttention:将位置信息硬核嵌入通道,精准捕获长程空间依赖,即插即用,涨点神器!!!近期关于移动网络设计的研究已经证明了通道注意力(例如 Squeeze-and-Excitation 注意力)对于提升模型性能的显著有效性,但它们通常忽略了位置信息,而位置信息对于生成具有空间选择性的注意力图非常重要 。在本文中,我们通过将位置信息嵌入通道注意力,提出了一种适用于移动网络的新型注意力机制,我们称之为“坐标注意力” 。与通过 2D 全局池化将特征张量转换为单个特征向量的通道注意力不同,坐标注意力将通道注意力分解为两个 1D 特征编码过程,分别沿两个空间方向聚合特征 。通过这种方式,可以沿一个空
大山同学14 小时前
人工智能·深度学习·分类
深度学习任务分类与示例(一)根据计算机视觉任务的层次结构和功能特性,我们可以将深度学习图像任务分为四大层次,每个层次包含多个具体任务:
童话名剑15 小时前
深度学习·机器学习·计算机视觉·特征检测·神经风格迁移
神经风格迁移(吴恩达深度学习笔记)目录1.神经风格迁移(1)解释2.深层卷积网络的特征检测3.成本函数(1)成本函数(2)内容代价函数(3)风格代价函数