深度学习

冰西瓜6001 分钟前
人工智能·深度学习·transformer
深度学习的数学原理(三十)—— Transformer的子层连接:残差+层归一化在本专栏之前的文章中,我们已经完整拆解了Transformer的核心——注意力机制的全谱系:从缩放点积注意力的数学本质,到多头注意力的多语义建模,再到掩码注意力、交叉注意力,最终完成了QKV来源所有合法组合的讨论。
β添砖java2 分钟前
人工智能·深度学习·回归
深度学习(6)softmax回归、损失函数、分类① Softmax回归虽然它的名字是回归,其实它是一个分类问题。分类时,我们不关系实际的值,我们关心的是能不能对正确的类的置信度特别大,比如将正确的类的置信度写成Oy,那么要远远大于其他非正确类的Oy,也就是二者相减大于一个阈值。
拾-光13 分钟前
java·人工智能·python·深度学习·算法·机器学习·音视频
LTX-Video 2.3 实战:用图片生成视频,消费级显卡也能跑的开源 I2V 模型(GPT Image 2)写在前面(2026.04):LTX-Video 2.3(简称 LTX-2.3)是 Lightricks 在 2026 年 3 月发布的最新开源视频生成模型,22B 参数,基于 DiT 架构,最大亮点是 Image-to-Video(I2V)能力的大幅提升——相比上一代,Ken Burns 伪影明显减少,人物运动更自然,提示词理解更精准。更重要的是:消费级显卡(12GB VRAM 起步)就能跑,完全本地,完全开源,MIT 协议。这篇带你从安装到出片,把整个 I2V 工作流跑通。
薛定谔的猫36919 分钟前
深度学习·ai·llm·machine learning·moe·deepseek
DeepSeek-V3 模型架构与训练技术深度解析随着大规模语言模型(LLM)技术的飞速发展,DeepSeek-V3 作为国产大模型领域的领军者,凭借其卓越的性能和极高的训练效率引起了广泛关注。本文旨在深入剖析 DeepSeek-V3 的底层架构设计,重点解析其如何通过优化混合专家模型(MoE)和创新性的训练策略,实现性能与成本的平衡。
碧海银沙音频科技研究院1 小时前
人工智能·深度学习·算法
BES2800BP_nuttx编译环境搭建方法1BES2800BP_nuttx编译环境搭建方法0开发环境搭建指令1: sudo apt install bison flex gettext texinfo libncurses5-dev libncursesw5-dev xxd git gperf automake libtool pkg-config build-essential gperf genromfs
HERR_QQ2 小时前
人工智能·深度学习·transformer
dirving transformer详读由于时代变了,几年前学习bevformer的时候 自己的笔记 查阅的资料 AI的问答 还有后续补充更新杂乱在一起,导致自己写的东西 几年后再看 也不读不进去了 写的太乱了
自动驾驶小学生2 小时前
人工智能·深度学习·transformer
Transformer和LLM前沿内容(4):Long-Context LLM
冰西瓜6002 小时前
人工智能·深度学习·transformer
深度学习的数学原理(三十一)—— Transformer前馈网络FFN(为什么要先升维再降维)在本专栏之前的文章中,我们已经完整拆解了Transformer的核心骨架——注意力机制全谱系与子层连接结构:从缩放点积注意力的数学本质,到多头注意力的多语义建模,再到残差+层归一化的深层稳定训练保障。
栀栀栀栀栀栀3 小时前
人工智能·笔记·深度学习·自然语言处理·语音识别
基于深度学习的自然语言处理和语音识别 阅读笔记语音识别的目标是实现语音信号与文本的相互转换,而自然语言处理的目标是理解文本的内涵,二者相辅相成。语言复杂性使计算方法变得越来越困难。然而,随着深度学习的到来,计算方法从基于规则的方法转变为直接从数据学习。为人机交互开辟了新途径。
kishu_iOS&AI3 小时前
人工智能·rnn·深度学习
深度学习 —— RNN循环神经网络,一般以序列数据为输入,通过网络内部的结构有效捕捉1.句子中的词全部处理完2.循环次数达到我们的要求
纤纡.3 小时前
开发语言·python·深度学习·opencv
解锁 Python 实用编程技巧:线程、视觉识别、正则匹配与装饰器实战在 Python 编程的世界里,掌握多样化的编程技巧和库的使用方法,是提升开发效率、实现复杂功能的关键。本文将从实际应用场景出发,拆解四个实用的 Python 代码案例,分别讲解多线程编程、基于 OpenCV 的颜色识别、正则表达式的字符串筛选,以及装饰器实现 “三进一” 触发逻辑的核心思路与实操细节,帮助开发者将这些技巧落地到实际项目中。
IRevers4 小时前
数据库·人工智能·pytorch·sql·深度学习·langchain·agent
【Agent】基于Langchain的Agent数据库查询助手如不使用本地运行,可调用LLM云端API。.env文件用于调用云端API,如何使用本地模型,这个文件里的内容可只增加langchain的监控助手API,即LANGCHAIN_API_KEY和LANGCHAIN_PROJECT对应的内容。
隔壁大炮4 小时前
人工智能·pytorch·深度学习·神经网络·numpy
Day02-13.张量的拼接操作torch.cat()函数可以将多个张量根据指定的维度拼接起来,不改变维度数。torch.stack()函数会在一个新的维度上连接一系列张量,这会增加一个新维度,并且所有输入张量的形状必须完全相同。
数智工坊4 小时前
人工智能·深度学习·cnn
DeepLabv3+:融合空洞可分离卷积的编码器-解码器语义分割架构这篇论文把空间金字塔池化和编码器-解码器结构的优势焊死在一起,在DeepLabv3基础上加了极简解码器,同时用深度可分离卷积把速度和精度拉满,在PASCAL VOC 2012和Cityscapes两个数据集刷到SOTA,是语义分割领域兼顾精度与速度的里程碑工作。
盼小辉丶5 小时前
人工智能·pytorch·深度学习·强化学习
PyTorch强化学习实战(3)——Gymnasium API扩展功能我们已经学习了编写智能体必需的 Gymnasium 核心功能,其余 API 功能部分虽然非必需,但能显著提升开发效率和代码整洁度。接下来,我们简要地介绍一下 Gymnasium API 的扩展功能。
AI木马人13 小时前
linux·服务器·人工智能·深度学习·prompt
3.【Prompt工程实战】如何设计一个可复用的Prompt系统?(避免每次手写提示词)很多人做AI系统时,Prompt都是这样写的:问题来了:👉 最后你会得到一个**“Prompt垃圾场”**
ydmy14 小时前
人工智能·深度学习
transformer超参数配置(个人理解)含义:预测 logits 与真实类别标签之间的差异,是分类任务的标准损失函数。交叉熵计算公式注意:交叉熵损失和KL散度的区别
AI木马人17 小时前
人工智能·深度学习·神经网络
6.深度学习入门:神经网络是如何“思考”的?🧠 单个神经元就像一个小决策器: 输入:x1, x2(比如温度、湿度) 权重:w1, w2(重要性) 偏置:b(基础阈值) 激活函数:f(决定是否“兴奋”)
小鱼~~18 小时前
深度学习
TensorDataset简介TensorDataset 是 PyTorch 中一个非常实用的工具类,它的核心作用是将多个张量(Tensor)打包成一个数据集。
毕胜客源码20 小时前
人工智能·python·深度学习·cnn·django
卷积神经网络的农作物识别系统(有技术文档)深度学习 图像识别 卷积神经网络 Django python 人工智能深度学习框架:Pytorch编程语言:Python数据库:SQLite界面:后端Python Django,前端 Vue3