深度学习

手写码匠几秒前
人工智能·深度学习·算法·aigc
从零实现 Prompt 工程引擎:结构化提示、自动优化与多轮自省体系2024 年以来,大语言模型的能力边界不断拓展,但一个残酷的现实摆在每个开发者面前:模型本身的能力差异在缩小,Prompt 质量带来的效果差异却在拉大。同样的 GPT-4、Claude、DeepSeek,有人用起来是"人工智障",有人用起来是"超级助手"——区别就在 Prompt。
哈伦201917 分钟前
人工智能·深度学习·图像识别
第十二章 深度学习基础 案例:MLP实现银行单据手写数字识别在本案例中,我们将使用PyTorch和Torchvision构建机器学习模型(特别是神经网络)来执行图像分类任务。我们使用MLP模型来构建手写数字识别模型。本案例中使用的数据集是著名的MNIST数据集,这是一个由手写数字0到9组成的28x28黑白图像数据集。
lqqjuly32 分钟前
深度学习·神经网络·算法
MLA — 多头潜在注意力深度解析标准多头注意力(MHA)的 KV Cache 是大语言模型推理的核心瓶颈。对于一个具有 n h n_h nh 个注意力头、每头维度 d h d_h dh 的模型,每个 token 需要缓存的 KV 大小为 2 n h d h 2 n_h d_h 2nhdh。当序列长度达到数万 token 时,KV Cache 占用的显存远超模型参数本身。
Black蜡笔小新33 分钟前
人工智能·深度学习
企业AI算力工作站DLTM深度学习推理工作站零代码私有化重塑企业AI落地新模式在企业数字化转型的浪潮中,AI技术早已不是互联网大厂的专属游戏,而是各行业提升效率、优化流程的关键抓手。然而,高昂的技术门槛、复杂的部署流程、数据安全的隐忧,始终是中小企业拥抱AI的三大阻碍。
啦啦啦_99991 小时前
人工智能·深度学习·transformer
4. Transformer_4_输出部分2️⃣ 输出部分:输出部分包含:linear线性层、softmax层;经过 Linear层:对于分类任务,如 18分类的人名分类器,则Linear最后输出层即为18,再进行 softmax;
DogDaoDao2 小时前
深度学习·大模型·github·音频·语音模型·tss·文本生成语音
【GitHub】VoxCPM2 实战全解析:原理、部署与效果对比简介: VoxCPM2 是 OpenBMB 团队开源的 2B 参数多语言 TTS 模型,支持 30+ 语言、情感控制、声音克隆,音质达到 48kHz。本文从实际使用和源码两个维度拆解它——不堆术语,只讲清楚它是什么、为什么好用、以及怎么把它跑起来。
不考研当牛马3 小时前
python·深度学习·django
Django 框架 深度学习** Django** 是一个用 Python 编写的免费开源、功能完备、高效安全的 Web 后端框架,专门用来快速开发企业级、高质量、可维护的网站和 Web 应用。
春日见4 小时前
人工智能·深度学习·算法·机器学习·自动驾驶
决策规划控制面经汇总(66 封私信 / 80 条消息) 卷完了!分享下我的秋招面经(投递近50家自动驾驶与机器人公司) - 知乎
啦啦啦_99995 小时前
android·深度学习·transformer
4. Transformer_3_解码器部分作为解码器的组成单元,每个解码器层根據给定的输入向目标方向进行特征提取操作,即解码过程;init中:参数:size, self_attn, src_attn, feed_forward, dropout;size词嵌入维度、self_attn自注意力机制、src_attn一般注意力、feed_forward前馈全连接层对象、dropout随机失活的系数; forward中:参数: x, memory, source_mask, target_mask;x是来自解码器端的输入、memory来自编码器的输出结
逻辑君5 小时前
人工智能·深度学习·机器学习·数学建模
Foresight研究报告【20260023】版本:5.98 发布日期:2026年6月ForeSight 是一个零预设、物理涌现的通用认知推理引擎。它不依赖机器学习梯度下降或大规模预训练,通过粒子弛豫、化学气体传导、电压扩散、情绪调制和元认知闭环,自主完成符号逻辑证明、知识图谱构建、数学求解、离散搜索等高阶认知任务。
JobDocLS6 小时前
深度学习
Jetson Orin的用法1、通过SDK Manager烧录2、通过SDK Manager对板子进行烧录3、安装jtop4、安装jetpack包 JetPack 是 NVIDIA 为 Jetson 系列开发板提供的完整软件包,安装它就自动安装了cuda/cudnn/TensorRT/OpenCV等常用的组件。
me8326 小时前
人工智能·rnn·深度学习·ai
【AI面试】小白理解大模型:自注意力机制如何使大模型能够捕捉长距离依赖关系,它跟RNN有什么区别?1.自注意力原理 词元生成 Q/K/V,全局计算注意力权重并加权融合;词与词直接关联,杜绝信息损耗;多头注意力强化特征,位置编码补充语序,以此捕捉长距离依赖。
Kobebryant-Manba6 小时前
python·深度学习·学习
学习模型构造不建议第二种 一般第一种简单__init__函数将每个模块逐个添加到有序字典_modules中。 读者可能会好奇为什么每个Module都有一个_modules属性? 以及为什么我们使用它而不是自己定义一个Python列表?
LaughingZhu6 小时前
人工智能·经验分享·深度学习·神经网络·产品运营
Product Hunt 每日热榜 | 2026-06-09标语:任何公司的自动化教学与学习基础设施介绍:创建与公司发展同步的员工培训。Honen能够迅速将团队的知识转化为互动式的AI主导课程,课程内容包括适应性学习、模拟练习和学习者洞察。当公司的文档、工具或流程发生变化时,课程会自动更新。
极光代码工作室7 小时前
python·深度学习·自然语言处理·nlp
基于NLP的论文关键词提取系统随着学术文献数量呈指数级增长,科研人员面临信息过载与知识发现效率低下的双重挑战。关键词作为论文内容的高度凝练,是文献检索、知识图谱构建、学术推荐及跨学科研究的核心元数据。传统人工标引方式成本高、一致性差、时效性弱;而现有自动化方法(如TF-IDF、TextRank)在专业领域语义理解不足,难以捕捉学科术语层级关系与上下文依赖特征。本文设计并实现了一套融合规则驱动与深度学习的混合式论文关键词提取系统。系统以中文计算机领域学术论文为对象,集成预处理、词性过滤、候选词生成、多模型融合排序与后处理四大模块,创新性
lqqjuly7 小时前
人工智能·深度学习·算法
一致性模型深度解析扩散模型(Diffusion Models)在图像生成领域取得了巨大成功,但其采样过程需要数百步迭代去噪,计算代价高昂。即使是加速采样方法(如 DDIM、DPM-Solver),通常也需要 10-50 步才能获得高质量样本。
哈伦20198 小时前
深度学习·cnn·k线图
第十二章 深度学习基础 案例:CNN分析K线图来评估股票价格趋势接下来我们用一个具体的案例来简单说明CNN的应用,使用CNN来分析K线图选取 1993-2001年的数据作为训练集,剩下的作为测试集
张飞飞飞飞飞8 小时前
人工智能·深度学习·目标检测
多模态目标检测-LLVIP数据集处理(清洗+YOLO格式)2021 年,北京邮电大学的研究团队发布了LLVIP 数据集,首次为低光照下的可见光-红外多模态任务提供了大规模、高精度的统一基准。
lqqjuly8 小时前
人工智能·深度学习·算法
FlashAttention 深度解析标准自注意力的计算复杂度为 O ( L 2 d ) O(L^2 d) O(L2d),但实践中真正的瓶颈往往不是浮点运算量(FLOPs),而是内存 IO。GPU 的计算能力(FLOPS)增长远快于显存带宽(GB/s),导致注意力计算被内存访问所制约。
广州灵眸科技有限公司8 小时前
服务器·前端·人工智能·python·科技·深度学习·架构
3Tops NPU + 4核高性能架构:灵眸科技EASY-EAI-PI2开发板,为边缘AI开启“easy模式”当下,物联网(IoT)正以前所未有的速度向更深层次的“端侧本地智能”演进。从智慧工厂中分秒必争的机器视觉质检,到复杂场景下多模态交互的智能机器人,再到海量数据汇聚的边缘计算网关,前线设备对底层硬件的“胃口”正变得越来越大。行业不仅渴望更强悍的本地算力以打破延迟瓶颈,对多路高清视音频的实时吞吐、以及在密闭工业环境下的极致能效比,也提出了近乎严苛的挑剔指标。