技术栈
深度学习
冰西瓜600
1 分钟前
人工智能
·
深度学习
·
transformer
深度学习的数学原理(三十)—— Transformer的子层连接:残差+层归一化
在本专栏之前的文章中,我们已经完整拆解了Transformer的核心——注意力机制的全谱系:从缩放点积注意力的数学本质,到多头注意力的多语义建模,再到掩码注意力、交叉注意力,最终完成了QKV来源所有合法组合的讨论。
β添砖java
2 分钟前
人工智能
·
深度学习
·
回归
深度学习(6)softmax回归、损失函数、分类
① Softmax回归虽然它的名字是回归,其实它是一个分类问题。分类时,我们不关系实际的值,我们关心的是能不能对正确的类的置信度特别大,比如将正确的类的置信度写成Oy,那么要远远大于其他非正确类的Oy,也就是二者相减大于一个阈值。
拾-光
13 分钟前
java
·
人工智能
·
python
·
深度学习
·
算法
·
机器学习
·
音视频
LTX-Video 2.3 实战:用图片生成视频,消费级显卡也能跑的开源 I2V 模型(GPT Image 2)
写在前面(2026.04):LTX-Video 2.3(简称 LTX-2.3)是 Lightricks 在 2026 年 3 月发布的最新开源视频生成模型,22B 参数,基于 DiT 架构,最大亮点是 Image-to-Video(I2V)能力的大幅提升——相比上一代,Ken Burns 伪影明显减少,人物运动更自然,提示词理解更精准。更重要的是:消费级显卡(12GB VRAM 起步)就能跑,完全本地,完全开源,MIT 协议。这篇带你从安装到出片,把整个 I2V 工作流跑通。
薛定谔的猫369
19 分钟前
深度学习
·
ai
·
llm
·
machine learning
·
moe
·
deepseek
DeepSeek-V3 模型架构与训练技术深度解析
随着大规模语言模型(LLM)技术的飞速发展,DeepSeek-V3 作为国产大模型领域的领军者,凭借其卓越的性能和极高的训练效率引起了广泛关注。本文旨在深入剖析 DeepSeek-V3 的底层架构设计,重点解析其如何通过优化混合专家模型(MoE)和创新性的训练策略,实现性能与成本的平衡。
碧海银沙音频科技研究院
1 小时前
人工智能
·
深度学习
·
算法
BES2800BP_nuttx编译环境搭建方法
1BES2800BP_nuttx编译环境搭建方法0开发环境搭建指令1: sudo apt install bison flex gettext texinfo libncurses5-dev libncursesw5-dev xxd git gperf automake libtool pkg-config build-essential gperf genromfs
HERR_QQ
2 小时前
人工智能
·
深度学习
·
transformer
dirving transformer详读
由于时代变了,几年前学习bevformer的时候 自己的笔记 查阅的资料 AI的问答 还有后续补充更新杂乱在一起,导致自己写的东西 几年后再看 也不读不进去了 写的太乱了
自动驾驶小学生
2 小时前
人工智能
·
深度学习
·
transformer
Transformer和LLM前沿内容(4):Long-Context LLM
冰西瓜600
2 小时前
人工智能
·
深度学习
·
transformer
深度学习的数学原理(三十一)—— Transformer前馈网络FFN(为什么要先升维再降维)
在本专栏之前的文章中,我们已经完整拆解了Transformer的核心骨架——注意力机制全谱系与子层连接结构:从缩放点积注意力的数学本质,到多头注意力的多语义建模,再到残差+层归一化的深层稳定训练保障。
栀栀栀栀栀栀
3 小时前
人工智能
·
笔记
·
深度学习
·
自然语言处理
·
语音识别
基于深度学习的自然语言处理和语音识别 阅读笔记
语音识别的目标是实现语音信号与文本的相互转换,而自然语言处理的目标是理解文本的内涵,二者相辅相成。语言复杂性使计算方法变得越来越困难。然而,随着深度学习的到来,计算方法从基于规则的方法转变为直接从数据学习。为人机交互开辟了新途径。
kishu_iOS&AI
3 小时前
人工智能
·
rnn
·
深度学习
深度学习 —— RNN
循环神经网络,一般以序列数据为输入,通过网络内部的结构有效捕捉1.句子中的词全部处理完2.循环次数达到我们的要求
纤纡.
3 小时前
开发语言
·
python
·
深度学习
·
opencv
解锁 Python 实用编程技巧:线程、视觉识别、正则匹配与装饰器实战
在 Python 编程的世界里,掌握多样化的编程技巧和库的使用方法,是提升开发效率、实现复杂功能的关键。本文将从实际应用场景出发,拆解四个实用的 Python 代码案例,分别讲解多线程编程、基于 OpenCV 的颜色识别、正则表达式的字符串筛选,以及装饰器实现 “三进一” 触发逻辑的核心思路与实操细节,帮助开发者将这些技巧落地到实际项目中。
IRevers
4 小时前
数据库
·
人工智能
·
pytorch
·
sql
·
深度学习
·
langchain
·
agent
【Agent】基于Langchain的Agent数据库查询助手
如不使用本地运行,可调用LLM云端API。.env文件用于调用云端API,如何使用本地模型,这个文件里的内容可只增加langchain的监控助手API,即LANGCHAIN_API_KEY和LANGCHAIN_PROJECT对应的内容。
隔壁大炮
4 小时前
人工智能
·
pytorch
·
深度学习
·
神经网络
·
numpy
Day02-13.张量的拼接操作
torch.cat()函数可以将多个张量根据指定的维度拼接起来,不改变维度数。torch.stack()函数会在一个新的维度上连接一系列张量,这会增加一个新维度,并且所有输入张量的形状必须完全相同。
数智工坊
4 小时前
人工智能
·
深度学习
·
cnn
DeepLabv3+:融合空洞可分离卷积的编码器-解码器语义分割架构
这篇论文把空间金字塔池化和编码器-解码器结构的优势焊死在一起,在DeepLabv3基础上加了极简解码器,同时用深度可分离卷积把速度和精度拉满,在PASCAL VOC 2012和Cityscapes两个数据集刷到SOTA,是语义分割领域兼顾精度与速度的里程碑工作。
盼小辉丶
5 小时前
人工智能
·
pytorch
·
深度学习
·
强化学习
PyTorch强化学习实战(3)——Gymnasium API扩展功能
我们已经学习了编写智能体必需的 Gymnasium 核心功能,其余 API 功能部分虽然非必需,但能显著提升开发效率和代码整洁度。接下来,我们简要地介绍一下 Gymnasium API 的扩展功能。
AI木马人
13 小时前
linux
·
服务器
·
人工智能
·
深度学习
·
prompt
3.【Prompt工程实战】如何设计一个可复用的Prompt系统?(避免每次手写提示词)
很多人做AI系统时,Prompt都是这样写的:问题来了:👉 最后你会得到一个**“Prompt垃圾场”**
ydmy
14 小时前
人工智能
·
深度学习
transformer超参数配置(个人理解)
含义:预测 logits 与真实类别标签之间的差异,是分类任务的标准损失函数。交叉熵计算公式注意:交叉熵损失和KL散度的区别
AI木马人
17 小时前
人工智能
·
深度学习
·
神经网络
6.深度学习入门:神经网络是如何“思考”的?
🧠 单个神经元就像一个小决策器: 输入:x1, x2(比如温度、湿度) 权重:w1, w2(重要性) 偏置:b(基础阈值) 激活函数:f(决定是否“兴奋”)
小鱼~~
18 小时前
深度学习
TensorDataset简介
TensorDataset 是 PyTorch 中一个非常实用的工具类,它的核心作用是将多个张量(Tensor)打包成一个数据集。
毕胜客源码
20 小时前
人工智能
·
python
·
深度学习
·
cnn
·
django
卷积神经网络的农作物识别系统(有技术文档)深度学习 图像识别 卷积神经网络 Django python 人工智能
深度学习框架:Pytorch编程语言:Python数据库:SQLite界面:后端Python Django,前端 Vue3