神经网络

Hello world.Joey10 小时前
人工智能·深度学习·神经网络·opencv·算法·机器学习·计算机视觉
吴恩达深度学习基础https://download.csdn.net/download/m0_60901124/92892158?spm=1001.2014.3001.5503 https://download.csdn.net/download/m0_60901124/92892158?spm=1001.2014.3001.5503
星恒随风11 小时前
人工智能·笔记·神经网络·学习·cnn
从零开始理解 ResNet(上):为什么 CNN 需要“残差连接”?在 CNN 中,不同层通常会学习不同层次的视觉特征。浅层更关注:中间层进一步组合这些低级特征:更深层则可能学到更抽象的语义信息:
有为少年12 小时前
人工智能·深度学习·神经网络·机器学习
深度隐式层 | 深度平衡模型 (Deep Equilibrium, DEQ)翻译自 https://implicit-layers-tutorial.org/deep_equilibrium_models/
锦鲤521413 小时前
深度学习·神经网络·学习
深度学习与神经网络学习机器学习在处理图像和文本方面能力较弱深度学习是基于人工智能网络,深度是指网络中使用多层,每层都通过非线性变换处理数据,并逐渐提取出更复杂,更抽象的特征
优秀的颜13 小时前
神经网络
大模型基础通常指的是大规模语言模型。它们是近年来人工智能领域最核心的突破,也是你正在对话的“我”这类系统的技术基础。它主要指基于深度学习、通过海量数据训练、包含巨大参数量(通常在十亿级别以上)的通用神经网络模型。
小糖学代码13 小时前
运维·python·神经网络·nginx
LLM系列:环境搭建:4.Nginx使用教程在后端架构与服务端运维中,Nginx 是一款轻量级、高性能的 HTTP 和反向代理 web 服务器。根据官方的设计规范与日常高频使用场景,Nginx 的核心功能总共可被归纳为四大类:
EIConferenceEmma16 小时前
人工智能·神经网络·算法·机器学习
【合作EI期刊 | IEEE出版 | 中国石油大学(华东)主办】第六届先进算法与神经网络国际学术会议(AANN 2026)第六届先进算法与神经网络国际学术会议(AANN 2026) 2026 6th International Conference on Advanced Algorithms and Neural Networks
AI算法沐枫16 小时前
人工智能·pytorch·深度学习·神经网络·机器学习·分类·数据挖掘
机器学习经典小项目1:鸢尾花分类元宝说,鸢尾花分类项目,是机器学习的Hello world。然后给了我一个完整的鸢尾花分类代码。运行结果为:
weixin_4684668516 小时前
人工智能·pytorch·深度学习·神经网络·计算机视觉·动态图·模型训练
PyTorch 深度学习框架核心能力与实战评测在深度学习框架的选型过程中,开发者往往面临着一个两难的境地:是追求极致的灵活性与科研探索的便捷性,还是倾向于生产环境下的稳定部署与高效推理?很多时候,我们被各种基准测试报告中的数字所包围,却难以将这些抽象的性能指标映射到自己具体的业务场景中。比如,当模型结构变得异常复杂,或者需要处理超长序列数据时,框架的动态特性是否会成为瓶颈?在多卡并行训练时,通信开销是否会吞噬掉算力提升的红利?这些问题如果不在项目初期通过实测验证,往往会在后期带来巨大的重构成本。
墨神谕1 天前
人工智能·神经网络·机器学习
人工智能(三)— 神经网络的训练大模型的本质就是,一个经过大规模数据训练、参数固定(推理阶段)的深度神经网络,它学习到了语言中的统计规律与结构表示。
青风971 天前
网络·人工智能·深度学习·神经网络·计算机视觉
SDDGR:基于稳定扩散的深度生成重放,用于类增量对象检测(CVPR 2024)在类增量学习(CIL)领域,随着生成模型的不断改进,生成重放作为一种减轻灾难性遗忘的方法越来越受到重视,但其在类增量目标检测(CIOD)中的应用受到了很大的限制,主要原因是涉及多个标签的场景的复杂性。我们提出了一种新的CIOD方法,称为稳定扩散深度生成重放(SDDGR)。我们的方法利用基于扩散的生成模型和预先训练的文本到图像扩散网络来生成逼真和多样化的合成图像。SDDGR结合了迭代细化策略,以产生高质量的图像。包含旧类的高质量图像。此外,我们采用L2知识蒸馏技术来提高合成图像中先验知识的保留。此外,我们的
忆~遂愿1 天前
人工智能·深度学习·神经网络·机器学习·自然语言处理·软件工程·知识图谱
《大模型驱动软件测试》| 软件工程3.0时代,大模型驱动测试实战指南朱少民同济大学特聘教授、CCF杰出会员,曾任思科(中国)软件有限公司QA资深总监、多个IEEE 国际学术会议程序委员、《软件学报》《计算机学报》等审稿人。
有为少年1 天前
人工智能·神经网络·线性代数·机器学习·矩阵
深度隐式层 | 隐式函数与自动微分翻译自:https://implicit-layers-tutorial.org/implicit_functions/
凯丨1 天前
人工智能·深度学习·神经网络
让 AI 通宵优化神经网络:Karpathy autoresearch 的设计哲学与启示Karpathy 今年 3 月开源的 autoresearch,做了一个极简却有力的实验:把一份 5 分钟训练预算的 nanochat 单 GPU 实现交给 AI 代理,让它自主改代码、跑训练、看指标、提交或回滚,循环往复。一夜之间,~100 次实验跑下来,nanochat 达到 GPT-2 等效水平的耗时从 2.02 小时压缩到 1.80 小时——端到端提速 11%。本文将拆解这套设计背后的关键取舍,并深入探讨它与经典 AutoML / NAS 的本质区别。
lucky_syq2 天前
人工智能·深度学习·神经网络
神经网络参数初始化详解在深度学习训练体系中,参数初始化(Weight Initialization)是极易被忽视、却决定模型能否收敛、收敛速度、精度上限、梯度稳定性的底层核心。相比于学习率、优化器、正则化等调优手段,初始化是模型训练的起点约束,起点出错,后续所有迭代优化全部无效。
Yan-英杰2 天前
人工智能·神经网络·机器学习·ai开发工具
亮数据 - Ticket_Hunter_Agent亮数据官方号: 关注新手用户注册就送25刀试用金: 点击体验
低频电磁之道2 天前
人工智能·神经网络·电脑
神经网络训练过程中电脑黑屏 / 花屏(N 卡)问题排查与解决最近在使用 NVIDIA GeForce RTX 2060 SUPER(8GB 显存) 进行模型训练时,训练压力稍大时(核心温度未超过 80℃),电脑会突然卡死、黑屏或画屏,必须强制重启才能恢复。
weixin_468466852 天前
人工智能·python·深度学习·神经网络·语言模型·自然语言处理·大语言模型
大语言模型智能助手核心应用场景与落地指南在处理日常工作时,我们常常被淹没在海量信息中:几十页的技术文档需要快速提炼核心观点,散落在不同格式文件里的数据难以统一分析,或是面对复杂的业务逻辑迟迟无法下手编写代码。这种“信息过载”与“执行困难”的矛盾,几乎困扰着每一位知识工作者。很多时候,我们花费在整理、阅读和初步构思上的时间,远远超过了实际解决问题的时间。如果能有一个得力的助手,不仅能读懂超长文档,还能跨格式整合信息,甚至辅助推理和创作,工作效率将得到质的飞跃。
LaughingZhu2 天前
人工智能·经验分享·深度学习·神经网络·产品运营
Product Hunt 每日热榜 | 2026-05-23标语:让一群并行的智能代理在几分钟内测试你的应用程序。介绍:TestSprite 能够独立生成并运行你应用程序的端到端测试。对于后端,我们现在可以生成复杂的集成测试,支持动态变量、自动清理和数据流调试。对于前端,我们会派遣一群并行的 AI 代理,像真实用户一样先去探索你的应用,点击每一个功能,然后将结果反馈到测试中。我们是第一个做到这一点的!3.0 版本还增加了 UI 漂移的自动修复功能、回归测试的自动认证以及针对 Claude Code 和 Codex 用户的命令行接口。
星恒随风2 天前
人工智能·笔记·神经网络·学习·cnn
从零开始理解 CNN(上):为什么图像任务需要卷积神经网络?假设有一张 224 × 224 的 RGB 图片。它的输入维度是:也就是说,一张图片在计算机眼里,本质上是 150528 个数字。