深度学习

Java后端的Ai之路1 小时前
人工智能·深度学习·神经网络·学习
【神经网络基础】-神经网络学习全过程(大白话版)训练神经网络 = 教一个“婴儿AI”从零开始学习一项技能,通过不断“看例子-做练习-被纠正-调整方法”的过程,最终让它成为专家。
凌峰的博客7 小时前
人工智能·深度学习
基于深度学习的图像修复技术调研总结(下)搜索基于深度学习的图像修复的文章主要是一些会议文章,而且像CVPR这一类的计算机视觉顶级会议偏多,其次就是ACMMM等杂志每年基本上会出一篇比较经典的论文。接下来这个部分我先将文章进行分类,主要分为仿真文献、精读文献、略读文献三种,具体收集结果见表
natide7 小时前
人工智能·深度学习·算法·机器学习·自然语言处理·概率论
表示/嵌入差异-4-闵可夫斯基距离(Minkowski Distance-曼哈顿距离-欧氏距离-切比雪夫距离闵可夫斯基距离由德国数学家赫尔曼·明可夫斯基提出,用于统一刻画n维空间中两个点(向量)A⃗=(a1,a2,...,an)\vec{A}=(a_1,a_2,...,a_n)A =(a1,a2,...,an) 和 B⃗=(b1,b2,...,bn)\vec{B}=(b_1,b_2,...,b_n)B =(b1,b2,...,bn) 的距离。其数学定义为: Dp(A⃗,B⃗)=(∑i=1n∣ai−bi∣p)1p D_p(\vec{A},\vec{B}) = \left( \sum_{i=1}^n |a_i -
蹦蹦跳跳真可爱5897 小时前
开发语言·人工智能·pytorch·python·gpt·深度学习·embedding
Python----大模型(GPT-2模型训练,预测)GPT-2模型的核心架构基于Transformer解码器,采用自回归方式生成文本。模型构建部分定义了GPTConfig配置类,包含关键参数如block_size(序列长度)、vocab_size(词表大小)、n_layer(层数)、n_head(注意力头数)和n_embd(嵌入维度)。
摸鱼仙人~8 小时前
人工智能·深度学习
Agent 意图识别:从传统 NLU 到 LLM 驱动的范式变革在构建任何智能体(Agent)或对话系统时,意图识别(Intent Recognition)都是最关键的第一步。它就像Agent的“耳朵”和“大脑”,负责准确理解用户说这句话的目的是什么,从而决定应该采取何种行动(Action)或调用哪个工具(Tool)。
不惑_8 小时前
人工智能·深度学习·神经网络
通俗理解神经网络的反向传播在人工智能的时代,神经网络就像是我们大脑的简化版模型,它能帮助计算机“学习”各种任务,比如识别图片、翻译语言,甚至开车。想象一下,你教一个小孩子骑自行车:一开始他可能会摔倒,你告诉他哪里错了,怎么调整姿势。下一次他就会做得更好。这里的“告诉哪里错了”和“怎么调整”就是神经网络训练的核心过程——反向传播(Backpropagation)。反向传播不是什么高深莫测的黑科技,它其实就是一种聪明的方法,让神经网络从错误中学习,逐步优化自己。
薛不痒9 小时前
人工智能·深度学习
深度学习介绍以及深度学习相关配置一、深度学习的介绍1.深度学习是什么?我们知道机器学习就是让机器学会像人类一样会学习和推理。神经网络之于机器就相当于人脑之于人。(神经网络是一种由多个神经元(或称为节点)组成的计算模型,它模拟了生物神经系统中神经元之间的连接方式。)
Coovally AI模型快速验证9 小时前
人工智能·深度学习·算法·yolo·目标检测·无人机
当小龙虾算法遇上YOLO:如何提升太阳能电池缺陷检测精度?随着全球能源结构向清洁化转型,太阳能光伏发电已成为主流可再生能源之一。然而,在太阳能电池的生产、运输和安装过程中,微小的缺陷如划痕、裂纹、黑边等会严重影响电池的性能和寿命。
hzp66610 小时前
人工智能·深度学习·神经网络·llm·aigc·dnn·反向传播
招牌红烧肉版-深度神经网络本文以 “开餐厅学做招牌菜” 的完整故事,来比喻深度神经网络的整个工作原理,包括:输入层、隐藏层、输出层、反向传播、权重、梯度、学习率等概念。
山野蓝莓酸奶昔11 小时前
人工智能·深度学习
InternNav 环境配置:Failed to build flash_attn解决办法install Internnav 的时候一直报flash_attn的错解决办法:
zcg194211 小时前
深度学习·计算机视觉
不用干净数据也能学会降噪——N2N派一般来说,数据对的质量很大程度上决定了模型的效果。但干净的数据获得总是很困难的,所以有一些聪明人想出来了一些不需要干净数据的奇思妙想。这里就简单学习一下。
阿正的梦工坊11 小时前
人工智能·深度学习·机器学习·语言模型·自然语言处理
Rubicon论文数据部分详解:从Rubric设计到RL Pipeline的全流程最近读到一篇来自Inclusion AI和蚂蚁集团的论文《Reinforcement Learning with Rubric Anchors》(Rubicon),提出了一种将传统RLVR(Reinforcement Learning from Verifiable Rewards)扩展到开放式、主观任务的方法。核心创新是用“Rubric”(评分细则)作为可自动打分的结构化奖励信号,取代了只能用于数学、编程等可严格验证任务的传统奖励。
Hcoco_me12 小时前
人工智能·rnn·深度学习·学习·自然语言处理·word2vec
大模型面试题23:对比学习原理-从通俗理解到核心逻辑(通用AI视角)对比学习(Contrastive Learning, CL)是一种无监督/半监督学习方法,核心思想极其简单:让“相似的样本”在特征空间里靠得更近,让“不相似的样本”离得更远——通过这种“对比”来让模型自动学习到数据的本质特征,无需人工标注的标签。
Java后端的Ai之路12 小时前
人工智能·深度学习·神经网络·机器学习
【神经网络基础】-神经网络优化方法全解析随机梯度下降(Stochastic Gradient Descent) 是最基础的优化算法。其更新公式为:
高洁0112 小时前
人工智能·深度学习·机器学习·transformer·知识图谱
深度学习—卷积神经网络(2)深度学习—卷积神经网络(2) 2.DNN与CNN的区别 3.卷积的数学定义 4.CNN的结构组成 卷积层
软件算法开发13 小时前
深度学习·算法·matlab·lstm·时间序列预测·蘑菇繁殖优化·mro-lstm
基于蘑菇繁殖优化的LSTM深度学习网络模型(MRO-LSTM)的一维时间序列预测算法matlab仿真目录1.程序功能描述2.测试软件版本以及运行结果展示3.部分程序4.算法理论概述1. 优化参数与MRO超参数初始化
Dfreedom.14 小时前
人工智能·深度学习·神经网络·计算机视觉·图像分割·u-net·u-net++
第一阶段:U-net++的概况和核心价值带着问题阅读:在医学影像、遥感检测等领域,图像分割任务常如“大海捞针”——我们需要从复杂的背景中精准勾勒出目标轮廓。2015 年诞生的 U-Net 以其简洁的编码器-解码器结构和跳跃连接成为分割任务的里程碑,但它也留下了两个关键难题:网络到底该多深?不同层次的特征如何更自然地融合?
Dfreedom.14 小时前
人工智能·深度学习·学习·开源·图像算法
循阶而上,庖丁解牛:系统学习开源 AI 模型的行动指南面对一个陌生的开源 AI 项目,是应该从第一行代码读起,还是先跑通示例?是深究数学公式,还是先弄清如何部署?许多学习者在兴奋与困惑中开始,却常在庞杂的代码与文档中迷失方向。
charlie11451419114 小时前
linux·开发语言·windows·深度学习·机器学习·conda·环境配置
快速备份与恢复 Conda 环境在日常开发中,Conda 环境是我们管理 Python 包与依赖的利器。但有时候我们需要迁移环境、备份环境,或者在新机器上快速还原环境。这边刚好在做毕设,所以涉及到快速迁移和配置自己配置好的机器学习/深度学习环境的事情,这里特别的记录一下!
声声codeGrandMaster14 小时前
人工智能·rnn·深度学习
RNN基本概念和模型构建RNN(循环神经网络)*是一种专门设计用于处理* 序列数据的深度学习模型,其核心特点是通过循环连接在时间维度上传递信息,从而能够 “记住” 之前的输入内容。