神经网络

墨神谕6 小时前
人工智能·神经网络·机器学习
人工智能(三)— 神经网络的训练大模型的本质就是,一个经过大规模数据训练、参数固定(推理阶段)的深度神经网络,它学习到了语言中的统计规律与结构表示。
青风977 小时前
网络·人工智能·深度学习·神经网络·计算机视觉
SDDGR:基于稳定扩散的深度生成重放,用于类增量对象检测(CVPR 2024)在类增量学习(CIL)领域,随着生成模型的不断改进,生成重放作为一种减轻灾难性遗忘的方法越来越受到重视,但其在类增量目标检测(CIOD)中的应用受到了很大的限制,主要原因是涉及多个标签的场景的复杂性。我们提出了一种新的CIOD方法,称为稳定扩散深度生成重放(SDDGR)。我们的方法利用基于扩散的生成模型和预先训练的文本到图像扩散网络来生成逼真和多样化的合成图像。SDDGR结合了迭代细化策略,以产生高质量的图像。包含旧类的高质量图像。此外,我们采用L2知识蒸馏技术来提高合成图像中先验知识的保留。此外,我们的
忆~遂愿8 小时前
人工智能·深度学习·神经网络·机器学习·自然语言处理·软件工程·知识图谱
《大模型驱动软件测试》| 软件工程3.0时代,大模型驱动测试实战指南朱少民同济大学特聘教授、CCF杰出会员,曾任思科(中国)软件有限公司QA资深总监、多个IEEE 国际学术会议程序委员、《软件学报》《计算机学报》等审稿人。
有为少年10 小时前
人工智能·神经网络·线性代数·机器学习·矩阵
深度隐式层 | 隐式函数与自动微分翻译自:https://implicit-layers-tutorial.org/implicit_functions/
凯丨16 小时前
人工智能·深度学习·神经网络
让 AI 通宵优化神经网络:Karpathy autoresearch 的设计哲学与启示Karpathy 今年 3 月开源的 autoresearch,做了一个极简却有力的实验:把一份 5 分钟训练预算的 nanochat 单 GPU 实现交给 AI 代理,让它自主改代码、跑训练、看指标、提交或回滚,循环往复。一夜之间,~100 次实验跑下来,nanochat 达到 GPT-2 等效水平的耗时从 2.02 小时压缩到 1.80 小时——端到端提速 11%。本文将拆解这套设计背后的关键取舍,并深入探讨它与经典 AutoML / NAS 的本质区别。
lucky_syq20 小时前
人工智能·深度学习·神经网络
神经网络参数初始化详解在深度学习训练体系中,参数初始化(Weight Initialization)是极易被忽视、却决定模型能否收敛、收敛速度、精度上限、梯度稳定性的底层核心。相比于学习率、优化器、正则化等调优手段,初始化是模型训练的起点约束,起点出错,后续所有迭代优化全部无效。
Yan-英杰20 小时前
人工智能·神经网络·机器学习·ai开发工具
亮数据 - Ticket_Hunter_Agent亮数据官方号: 关注新手用户注册就送25刀试用金: 点击体验
低频电磁之道20 小时前
人工智能·神经网络·电脑
神经网络训练过程中电脑黑屏 / 花屏(N 卡)问题排查与解决最近在使用 NVIDIA GeForce RTX 2060 SUPER(8GB 显存) 进行模型训练时,训练压力稍大时(核心温度未超过 80℃),电脑会突然卡死、黑屏或画屏,必须强制重启才能恢复。
weixin_4684668520 小时前
人工智能·python·深度学习·神经网络·语言模型·自然语言处理·大语言模型
大语言模型智能助手核心应用场景与落地指南在处理日常工作时,我们常常被淹没在海量信息中:几十页的技术文档需要快速提炼核心观点,散落在不同格式文件里的数据难以统一分析,或是面对复杂的业务逻辑迟迟无法下手编写代码。这种“信息过载”与“执行困难”的矛盾,几乎困扰着每一位知识工作者。很多时候,我们花费在整理、阅读和初步构思上的时间,远远超过了实际解决问题的时间。如果能有一个得力的助手,不仅能读懂超长文档,还能跨格式整合信息,甚至辅助推理和创作,工作效率将得到质的飞跃。
LaughingZhu21 小时前
人工智能·经验分享·深度学习·神经网络·产品运营
Product Hunt 每日热榜 | 2026-05-23标语:让一群并行的智能代理在几分钟内测试你的应用程序。介绍:TestSprite 能够独立生成并运行你应用程序的端到端测试。对于后端,我们现在可以生成复杂的集成测试,支持动态变量、自动清理和数据流调试。对于前端,我们会派遣一群并行的 AI 代理,像真实用户一样先去探索你的应用,点击每一个功能,然后将结果反馈到测试中。我们是第一个做到这一点的!3.0 版本还增加了 UI 漂移的自动修复功能、回归测试的自动认证以及针对 Claude Code 和 Codex 用户的命令行接口。
星恒随风1 天前
人工智能·笔记·神经网络·学习·cnn
从零开始理解 CNN(上):为什么图像任务需要卷积神经网络?假设有一张 224 × 224 的 RGB 图片。它的输入维度是:也就是说,一张图片在计算机眼里,本质上是 150528 个数字。
星恒随风1 天前
人工智能·笔记·深度学习·神经网络·学习·cnn
从零开始理解 CNN(下):拆开卷积层、池化层、通道数和训练流程一个基础 CNN 一般包含以下模块:卷积层是 CNN 的核心。它的作用是:输入可以是原始图片,也可以是上一层输出的特征图。
有为少年1 天前
人工智能·深度学习·神经网络·线性代数·机器学习·优化算法·深度隐式层
深度学习中的隐式层翻译自 https://implicit-layers-tutorial.org/introduction/
lqqjuly1 天前
深度学习·神经网络·自然语言处理
Transformer架构详解 - 第一、二部分:基础与核心思想、核心组件详解第一部分:基础与核心思想第二部分:核心组件详解 (见transformer_guide_part2.md) 6. 自注意力机制 7. 多头注意力 8. 前馈神经网络 9. 残差连接与层归一化 10. 位置编码
小a彤1 天前
人工智能·深度学习·神经网络
ops-nn 快速上手 - 神经网络算子使用入门指南ops-nn 是 CANN(Compute Architecture for Neural Networks)开源社区的神经网络类基础算子库,它提供了 matmul、activation 等核心算子。本文作为快速上手指南,旨在帮助你快速掌握 ops-nn 的使用方法,从环境搭建到核心算子的调用,再到性能验证,提供一个完整的入门路径。
凌波粒2 天前
笔记·深度学习·神经网络
深度学习入门(鱼书)第3章笔记——神经网络本笔记整理自《深度学习入门:基于 Python 的理论与实现》(鱼书),包含学习笔记与代码示例。源码仓库
lqqjuly2 天前
神经网络
扩散模型 (Diffusion Models) 详解扩散模型是一类基于概率的生成模型,通过学习逐步去噪过程来生成数据。其核心包括:前向过程:照片逐渐褪色变成噪声 反向过程:从噪声中恢复出清晰照片
Dymc2 天前
人工智能·神经网络·学习
【论文解析】用神经网络给优化器“热身“——面向 UAV-UGV 交接任务的学习加速轨迹规划论文全名: Learning-Accelerated Optimization-based Trajectory Planning for Cooperative Aerial-Ground Handover Missions 发布时间: 2026年5月(arXiv:2605.19562v1) 机构: 斯图加特大学工程与计算力学研究所 · 芬兰 LUT 大学
星恒随风2 天前
人工智能·笔记·神经网络·学习·机器学习
从机器学习基础到 MLP(下):神经网络为什么能起作用?🔥星恒随风:个人主页 ❄️个人专栏: 《指针合集》《c语言基础》《数据结构》《机器学习导论》《前端基础》 ✨数据即知识,压缩即智能
ZHW_AI课题组3 天前
人工智能·神经网络·机器学习·回归
基于MLP神经网络的红酒品质回归预测基于MLP神经网络的红酒品质回归预测 1.作者介绍 陈金顺,男,西安工程大学电子信息学院,2025级研究生 研究方向:情绪识别 电子邮件:1732179164@qq.com