深度学习

天云数据43 分钟前
人工智能·深度学习·神经网络·机器学习
神经网络,人类表达的革命摘 要:本文简述了人类一直在追求更高效的沟通表达能力、更快速的信息传播方式和更大规模的共识协作,从语言文字时代到计算时代再到今天的智能时代,始终贯穿着表达方式的革命,越发全面、完整、准确的记录和传承着人类眼中的客观世界、主观认知和知识经验 ;人类文明的发展与表达方式的进化相辅相成、互为助力,推动了现代科学殿堂的构筑和现代科技的发展。基于神经网络的知识学习、认知、生成与表达是人类第三次表达革命,传统经验规则的专家光环被逐一抹去,知识祛魅将推动所有商业逻辑解构和重构 ,我们将走进与人工智能共同书写人类文明的新
独自归家的兔1 小时前
人工智能·深度学习·cnn
深度学习之 CNN:如何在图像数据的海洋中精准 “捕捞” 特征?在当今数字化时代,图像数据如同浩瀚的海洋般源源不断地产生。从日常拍摄的照片到医疗影像、卫星图像等专业领域的数据,如何从这海量的图像数据中提取有价值的信息,成为了众多领域关注的焦点。深度学习中的卷积神经网络(Convolutional Neural Network,简称 CNN)就如同一位技艺高超的渔夫,能够在这图像数据的海洋中精准地 “捕捞” 特征。本文将深入探讨 CNN 是如何实现这一神奇功能的。
deephub3 小时前
人工智能·深度学习·大语言模型·rag·检索
RAG 文本分块:七种主流策略的原理与适用场景检索是 RAG 系统的搜索引擎,分块则是这个搜索引擎的基础。分块太长、太短、有噪声、切错了位置——随便犯哪个错LLM 都会有问题。行业里有句话流传很广:“分块决定了 RAG 质量的 70%。”
newBorn_19913 小时前
人工智能·深度学习·transformer·cann
ops-transformer RoPE位置编码 复数旋转硬件加速实战本文将深度解析cann项目中ops-transformer的RoPE位置编码实现,聚焦/operator/ops_transformer/rope/rotary_position_embedding.cpp的关键优化技术。核心内容包括sin/cos表预计算机制、向量指令融合策略,以及如何在NPU上实现复数旋转操作的高效硬件加速。通过实测数据,在LLaMA模型推理中实现18%的吞吐提升,为AIGC推理性能优化提供实战参考。本文将结合代码级实现细节和性能分析,分享一线开发中的优化经验。
龙腾AI白云3 小时前
深度学习·知识图谱
大模型架构演进:从Transformer到MoE大模型架构演进:从Transformer到MoE一、 Transformer的辉煌与局限 二、 MoE:用“稀疏激活”撬动模型容量 三、 MoE为何成为大模型新范式? 四、 典型实践:从GLaM到Qwen-MoE 五、 挑战与未来方向
宁远x3 小时前
人工智能·深度学习·机器学习
Flash Attention原理介绍与使用方法Flash Attention可以加速计算,节省显存。本文介绍了Flash Attention的原理,以及在GPU/NPU上的使用方式。
琅琊榜首20204 小时前
大数据·人工智能·深度学习
AI+编程思维:高质量短剧脚本高效撰写实操指南视频行业的飞速发展,让短剧成为内容创作的热门赛道,其“时长短、节奏快、易传播”的特点,吸引了大量创作者入局。但传统短剧撰写依赖文案功底与剧情把控能力,不仅创作周期长,还难以快速适配市场变化。AI技术的迭代突破,为短剧创作提供了全新路径——借助编程思维的结构化、模块化理念,优化Prompt设计,可让AI高效产出人设鲜明、逻辑连贯、适配镜头呈现的高质量短剧脚本,大幅降低创作门槛,提升内容产出效率。
十铭忘7 小时前
人工智能·深度学习·计算机视觉
个人思考3——世界动作模型目录一、前言二、DreamZero:世界动作模型 (World Action Model)三、Motus:统一的潜在动作世界模型
kkkkkkkkk_12017 小时前
笔记·深度学习·学习·强化学习
【强化学习】09周博磊强化学习纲要学习笔记——第五课上今日课程提纲: 各位同学大家好,我们开始第四课下半段的内容,我们讨论了如何用函数近似来拟合我们的价值函数。接下来我将给大家介绍如何用非线性函数来拟合我们的价值函数。
相思半8 小时前
人工智能·gpt·深度学习·claude·codex·智能体·seedance
告别聊天机器人!2026 智能体元年:Claude 4.6 vs GPT-5.3 vs OpenClaw 全方位对比2026年的AI领域正在经历一场从“智能问答”到“智能执行”的深刻变革。过去一年,大语言模型(LLM)在编程、创作和日常任务中的应用突飞猛进,一系列新兴应用迅速崛起,成为公众关注的焦点。Claude Opus 4.6、GPT-5.3-Codex、OpenClaw(曾用名Clawdbot、Moltbot)和Seedance等产品和模型,代表了这场变革的前沿力量。它们或以卓越的推理与编程能力著称,或以高度自主的代理能力见长,或以多模态内容生成的创新突破引人瞩目。本文将以通俗易懂的语言,系统介绍这些热点应用的产
人工智能培训8 小时前
人工智能·深度学习·大模型·transformer·知识图谱·具身智能·人工智能 培训
大模型架构演进:从Transformer到MoE#Transformer#MoE(混合专家)#稀疏激活#专家#模型容量
查无此人byebye8 小时前
人工智能·pytorch·python·深度学习·音视频
实战DDPM扩散模型:MNIST手写数字生成+FID分数计算(完整可运行版)扩散模型(Diffusion Model)作为当下生成式AI的核心技术,在图像生成领域展现出了惊人的效果。本文将从代码层面逐行拆解一个完整可运行的DDPM(Denoising Diffusion Probabilistic Models)实现,基于MNIST数据集完成手写数字生成,并集成FID(Fréchet Inception Distance)指标量化生成效果。
AI周红伟9 小时前
人工智能·深度学习·算法
周红伟:SeedDance 2技术架构和技术原理视觉-语言多模态大模型我们正式发布 Seed -VL,这是一款专注于提升多模态理解与推理能力的视觉-语言基础模型。Seed -VL 不仅在视觉和视频理解任务中具有出色表现,还在智能体相关任务及复杂推理挑战中展现优异能力。模型在 60 项公开评测基准中的 38 项取得 SOTA 表现。
宁远x9 小时前
人工智能·深度学习·强化学习
【VeRL】Qwen3-30B-A3B-DAPO NPU实践指导作者:昇腾实战派 知识地图链接:【强化学习】知识地图-CSDN博客在大模型训练过程中,如何高效利用NPU硬件资源并保证训练稳定性是开发者面临的重要挑战。本文基于实际项目经验,分享了在NPU环境下使用VLLM+FSDP后端进行Qwen3-30B模型DAPO训练的完整实践方案。通过详细的版本配置、核心参数调优和部署指导,为开发者提供了一套可复现的高效训练方案。
高洁0110 小时前
python·深度学习·机器学习·数据挖掘·知识图谱
大模型架构演进:从Transformer到MoE大模型架构演进:从Transformer到MoE一、 Transformer的辉煌与局限 二、 MoE:用“稀疏激活”撬动模型容量 三、 MoE为何成为大模型新范式? 四、 典型实践:从GLaM到Qwen-MoE 五、 挑战与未来方向
Suryxin.10 小时前
人工智能·pytorch·深度学习·vllm
从0开始复现nano-vllm「ModelRunner.capture_cudagraph()」为什么需要 CUDA Graph?在 LLM 推理等小算子、高频次的场景中,CPU 逐个调度任务的开销往往比 GPU 实际计算的时间还要长,导致 GPU 大量空闲等待;CUDA Graph 通过将一系列 GPU 操作“录制”为静态图,在执行时只需一次 CPU 指令即可驱动整个计算流程,从而彻底消除 CPU 调度瓶颈,填满 GPU 流水线,显著降低推理延迟。
马拉AI11 小时前
深度学习·架构·transformer
Transformer范式改变?稀疏线性混合SALA架构发布,单卡5090跑通百万长文!在 LLM 向“超长上下文”进军的路上,我们总是面临一个残酷的二选一:要么用全注意力(Full Attention)保证效果但显存爆炸,要么用线性注意力(Linear Attention)节省资源但牺牲精度。
如若12311 小时前
人工智能·python·深度学习·神经网络·计算机视觉
SoftGroup训练FORinstance森林点云数据集——从零到AP=0.506完整复现title: SoftGroup训练FORinstance森林点云数据集——从零到AP=0.506完整复现 date: 2025-01-01 tags:
火红色祥云11 小时前
笔记·python·深度学习
深度学习入门:基于Python的理论与实现笔记核心思想: 掌握Python基础语法和NumPy、Matplotlib库,为深度学习实现做好准备。是什么? 简单、易读、开源的编程语言,适合数据科学和深度学习。
挖你家服务器电缆11 小时前
人工智能·深度学习·cnn
【深度学习系列学习总结】四大框架之一:cnn一、CNN 内容总结 基础概念、架构细节、训练流程,到实际应用(尤其是人脸识别)。CNN 像多层过滤系统:输入 → 特征提取 → 决策输出。典型结构:卷积 + 激活 + 池化(重复) → 全连接 → 输出。 ● 输入层:原始图像(H x W x 通道,e.g., RGB 是 3 通道),像加载 int[][][] 数组。 ● 卷积层:核心,用小内核(e.g., 3x3 矩阵)滑动扫描,计算乘加,提取特征图(e.g., 边缘检测)。参数共享、局部连接是关键。 ● 激活层:加非线性(e.g., ReLU:负值