深度学习

憨波个2 小时前
人工智能·深度学习·transformer·语音识别
【语音识别】Conformer: Convolution-augmented Transformer for Speech Recognition本文是阅读论文《Conformer: Convolution-augmented Transformer for Speech Recognition》[1] 的笔记。Transformer 的自注意力能建模长程依赖,但对局部结构(如频谱的连续帧)建模能力一般。CNN 擅长局部建模,但感受野有限,长程依赖要靠堆叠很多层。所以 Conformer(Convolution + Transformer) 把两者结合,用 Transformer 做全局建模,用卷积做局部建模,从而更适配语音信号的时间局部性和长程依
动物园猫2 小时前
深度学习·yolo·分类
睡岗检测数据集分享(适用于YOLO系列深度学习分类检测任务)链接:https://pan.baidu.com/s/1MM22lYUS9a-wfiJ89qJ7jA?pwd=xdp1
大模型最新论文速读2 小时前
论文阅读·人工智能·深度学习·机器学习·自然语言处理
05-29 · LLM 最新论文速览今日候选池 97 篇,硬过滤 + LLM 打分后通过评估 19 篇,精选 Top-10,另列 9 篇速览。
杀生丸学AI2 小时前
人工智能·深度学习·3d·三维重建·高斯泼溅·动态重建·镜面反射
【三维重建】RT-Splatting:基于3DGS的联合反射-透射建模(CVPR 2026)标题:《RT-Splatting: Joint Reflection-Transmission Modeling with Gaussian Splatting》 链接:https://sjj118.github.io/RT-Splatting 来源:北京大学智能科学与技术学院;通用人工智能国家重点实验室
weixin_468466853 小时前
人工智能·深度学习·ai·分类·数据挖掘·图像分类·模型部署
图像分类技术落地应用与实战指南在电商大促期间,面对海量新增 SKU,运营团队往往需要耗费数天时间手动分类商品属性并上架,不仅效率低下,还容易出现归类错误导致流量流失。而在医疗领域,放射科医生每天要审阅成百上千张影像片子,长时间的高强度工作难免产生视觉疲劳,细微的病灶极易被漏诊。这些看似截然不同的行业痛点,背后其实都指向同一个技术突破口:利用计算机视觉与深度学习技术,让机器具备“看”和“判断”的能力。
MediaTea3 小时前
人工智能·深度学习
人工智能通识课:深度学习深度学习(Deep Learning)是机器学习的重要分支,也是当前人工智能中最具代表性的技术路线之一。它以多层神经网络为核心,通过大量数据训练模型,使模型能够自动学习数据中的特征表示,并完成识别、预测、理解、生成和决策等复杂任务。
探物 AI4 小时前
人工智能·深度学习·transformer
Mamba 会替代 Transformer 成为 AI 的下一代底层模型吗?2017 年之前,AI 处理序列的方式不是那么聪明——RNN 和 LSTM这两种神经网络,必须要一个字一个字读取,对于全文的意思理解不够。
高洁014 小时前
深度学习·机器学习·数据挖掘·transformer·知识图谱
设备故障?数字孪生提前预警设备故障?数字孪生提前预警一、 突如其来的停机:设备故障的真实代价 二、 数字孪生是什么:设备的虚拟镜像 三、 从“事后维修”到“事前预警” 四、 真实案例:哪些设备已经用上了 五、 展望与挑战:让预警更准更早
weixin_468466854 小时前
人工智能·python·深度学习·机器学习·计算机视觉·ai·机器视觉
机器学习与深度学习新手区分指南很多刚入门的朋友在面对“机器学习”和“深度学习”这两个词时,往往容易陷入选择困难症。手里攥着一份业务数据,既担心用传统模型挖掘不够深入,又怕直接上神经网络算力扛不住、调参调到头秃。其实,这并非是非黑即白的单选题,而是取决于你手中的数据特征、业务场景的实时性要求以及现有的资源储备。很多时候,一个精心设计的逻辑回归或随机森林,在表格数据上的表现不仅不输给复杂的深度网络,反而在可解释性和部署成本上占据绝对优势。
AI算法沐枫4 小时前
开发语言·人工智能·python·深度学习·qt·学习·机器学习
基于YOLO26深度学习的【果园荔枝检测与计数】系统设计与实现【python源码+Pyqt5界面+数据集+训练代码】摘要:荔枝是高价值热带水果,产量直接关系果农收益,但果园枝叶遮挡、果实重叠、光照不均等问题突出,导致传统人工计数估产效率低、误差大、劳动强度高。本文基于YOLO26深度学习框架,通过2163张实际场景中果园荔枝的相关图片,训练了可进行荔枝目标检测的模型,可以很好的检测荔枝树上的荔枝并统计数量。最终基于训练好的模型制作了一款带UI界面的果园荔枝检测与计数系统,更便于进行功能的展示。该系统是基于python与PyQT5开发的,支持图片、视频以及摄像头进行目标检测,并保存检测结果。本文提供了完整的Python代
独孤--蝴蝶4 小时前
人工智能·深度学习·bert
BERT在开发中的一些方法的应用以及讲解使用BERT训练分类任务的时候输入文本: "今天天气很好"|input_ids = [101, 791, 211, 369, 361, 2521, 1962, 102]
追光者♂4 小时前
人工智能·深度学习·机器学习·typescript·开源·游戏引擎·superpowers
【测评系列3】CSDN AI数字营销实测体验官:测试 开源项目——Superpowers 游戏引擎从零开发实战指南本文介绍了使用Superpowers游戏引擎进行2D/3D游戏开发的完整流程。首先,文章详细解析了引擎编辑器的核心功能区域,包括层级面板、属性面板和场景编辑器等。接着,通过具体命令演示了从安装Node.js到初始化项目的环境搭建步骤。在开发环节,重点讲解了场景构建、精灵资源导入、TypeScript脚本编写(含角色控制代码示例)、物理碰撞检测实现以及动画状态机配置等关键技术点。全文采用实战导向的写作风格,提供可直接落地的操作指南,帮助开发者快速掌握从零开始构建游戏demo的核心工作流,特别适合想要验证游戏
hunteritself4 小时前
人工智能·chrome·深度学习·机器学习·信息可视化
智博会上的国产芯:重新定义 Token 价值链路AI 时代,算力是核心引擎,Token 是信息处理的最小单元,两者都是智能化产线上的「硬通货」。然而,近年来算力新基建持续提速,Token 调用量爆发式增长,真实业务场景中的价值产出却未能有效同步,业界情绪开始从「算力不足恐惧症」转向「Token 焦虑」。
水木流年追梦5 小时前
人工智能·分布式·python·深度学习·机器学习
大模型入门-大模型优化方法3在了解大语言模型(LLM)的底层逻辑时,你一定会频繁听到一个词——KV Cache。 简而言之,KV Cache 是大模型推理性能优化的一个王牌技术。它能够在不影响任何计算精度的前提下,利用“空间换时间”的思想,大幅提升大模型的生成速度。
武子康5 小时前
大数据·人工智能·深度学习·ai·chatgpt·deepseek
调查研究-148 Deepseek-V4-Flash 生成式AI十大高频业务场景落地指南在数字化运营的日常中,我们常会遇到这样的瓶颈:业务量突然激增,人工响应速度跟不上用户咨询的爆发式增长;或是面对海量商品库,撰写差异化描述成了耗时耗力的重复劳动。这些场景并非个例,而是许多团队在扩张期必须直面的挑战。当人力成本与时间效率成为制约发展的关键因素时,如何利用技术手段打破僵局,实现从"人海战术"到"智能辅助"的转型,显得尤为迫切。
码农小韩5 小时前
深度学习·ssm·mamba·状态空间模型·序列模型
Mamba学习(一)——Mamba-V1原理(一)目录一、序列模型1、循环神经网络2、卷积神经网络3、Transformer二、状态空间模型 (SSM)
买大橘子也用券5 小时前
python·深度学习·安全·网络安全
26软件系统安全赛-Fake Emotion(复盘)内心OS:感觉这道题目比较吸引,就看了好久,可惜没搞出来,复盘一下首先看model.py线下断网,这段代码最开始没看懂,一点一点翻函数手册,一点一点一点现场学 Conv2d:卷积层 (我理解就是找面部特征)
AI人工智能+5 小时前
人工智能·深度学习·计算机视觉·ocr·施工许可证识别
施工许可证智能识别系统通过融合计算机视觉与自然语言处理技术,实现了建筑行业关键证件的自动化信息提取在建筑行业数字化转型的浪潮中,数据的高效流转与精准管理已成为提升项目效率的关键。作为建筑市场准入的核心凭证,施工许可证承载着工程名称、建设单位、建设地址、许可范围及有效期等海量关键信息。传统的人工录入方式不仅耗时费力,且极易出现错录、漏录问题。
春日见5 小时前
运维·服务器·人工智能·深度学习·算法·机器学习
5分钟入门强化学习之蒙特卡洛(MC)算法与实现蒙特卡洛方法的核心思想非常朴素:利用大数定律,通过大量重复的随机抽样(实战模拟),用所有采样结果的平均回报来逼近一个状态的真实期望回报(即状态价值)。