深度学习

菜鸟‍2 小时前
深度学习·学习·transformer
【论文学习】基于 Transformer 的图像分割模型SegViT:基于纯视觉 Transformer 的语义分割Vision Transformer (ViT):将Transformer模型创新性地应用到了计算机视觉领域
智启七月2 小时前
人工智能·深度学习
从 token 到向量:微信 CALM 模型颠覆大语言模型范式大家好,我是AI算法工程师七月,曾在华为、阿里任职,技术栈广泛,爱好广泛,喜欢摄影、羽毛球。目前个人在烟台有一家企业星瀚科技。
也许是_4 小时前
人工智能·深度学习·神经网络
大模型原理之深度学习与神经网络入门简单理解:想象一下,你如何教一个小孩认识猫?神经网络的学习过程和这个过程非常相似:示例:识别手写数字示例:识别手写数字
三千院本院5 小时前
人工智能·python·深度学习·llama
LlaMA_Factory实战微调Qwen-LLM大模型1、数据集准备2、添加数据集格式 在data文件夹-dataset_info.json中添加制作好的数据集,文本训练添加参考格式如下
love is sour5 小时前
人工智能·深度学习
理解全连接层:深度学习中的基础构建块全连接层,又称密集连接层(Dense Layer),是神经网络中最简单的层类型。在这种层中,每个输入节点都与每个输出节点相连接,形成了完全的连接模式。这种结构使得信息可以在所有输入特征之间自由流动,为模型提供了强大的表示能力。
WGS.12 小时前
深度学习
llama factory 扩充词表训练在 train.yaml 中添加ref:https://github.com/hiyouga/LLaMA-Factory/pull/9267
Coovally AI模型快速验证15 小时前
人工智能·深度学习·算法·机器学习·目标跟踪·语言模型
当视觉语言模型接收到相互矛盾的信息时,它会相信哪个信号?多模态AI并非平等处理所有信息,其偏好暗藏玄机近年来,视觉语言模型(VLMs)在多种任务上展现出了令人印象深刻的能力,它们能够同时理解图像和文本信息,完成复杂的推理任务。然而,当图像和文本信息相互矛盾时,这些模型会更倾向于相信哪种信息?
居7然15 小时前
人工智能·深度学习·大模型·transformer·embedding
Attention注意力机制:原理、实现与优化全解析在深度学习处理序列数据(如文本、语音、时序信号)的过程中,传统循环神经网络(RNN)和卷积神经网络(CNN)存在明显局限:RNN难以并行计算且长序列下信息传递衰减,CNN则对长距离依赖捕捉能力较弱。Attention注意力机制的出现突破了这一瓶颈,其核心思想是让模型在处理序列时“有的放矢”——通过学习输入序列不同部分的重要性权重,对关键信息进行显式加权,从而高效聚焦与输出相关的内容。本文将从Attention的基础原理出发,逐步深入Transformer中的应用、计算复杂度优化、KV缓存技术,以及MHA、
Python图像识别18 小时前
python·深度学习·yolo
75_基于深度学习的咖啡叶片病害检测系统(yolo11、yolov8、yolov5+UI界面+Python项目源码+模型+标注好的数据集)本项目基于 PyQt5 构建了简洁易用的图形用户界面,支持用户选择本地图片或视频进行目标检测。系统界面美观,交互流畅,具备良好的用户体验。
PyAIGCMaster18 小时前
人工智能·深度学习·学习·钉钉
钉钉的设计理念方面,我可以学习除了“5 张基座表 + 权限模型”,钉钉在「基座设计理念」层面还有 7 条值得直接抄作业的“底层思想”。 它们大部分不会出现在 ER 图里,却是让钉钉能扛 10w 级组织和亿级并发仍能横向扩容、纵向加功能的核心原因。
深蓝电商API18 小时前
人工智能·深度学习·pdf
告别混乱文本:基于深度学习的 PDF 与复杂版式文档信息抽取在数字化浪潮席卷各行各业的今天,PDF 作为跨平台、保格式的文档标准,已成为政务报告、金融合同、科研论文等信息载体的首选。然而,这类文档中普遍存在的多栏排版、嵌套表格、图文混排等复杂版式,以及扫描件生成的非结构化文本,让传统信息抽取技术频频 “卡壳”。当人工逐页录入数据的效率与海量文档的处理需求形成尖锐矛盾时,基于深度学习的文档信息抽取技术,正成为打破混乱、释放数据价值的核心力量。
tt55555555555519 小时前
网络·深度学习·transformer
Transformer原理与过程详解本文系统阐述Transformer模型的核心机制,包括自注意力机制、多头注意力机制、掩码注意力机制等关键组件,以及模型的训练和推理全流程。
qzhqbb19 小时前
人工智能·深度学习·神经网络
神经网络—— 人工神经网络了解大脑新皮层中单个神经元如何处理从其他神经元接收的约1万个突触输入信号。新皮层是大脑在进化过程中最新形成的部分,也是人类大部分思维活动的发生地。
Victory_orsh19 小时前
人工智能·pytorch·python·深度学习·神经网络·算法·机器学习
“自然搞懂”深度学习(基于Pytorch架构)——010203学习中很重要的一点——隐含定义(或者说默认规则),一个人理解知识的链路基于严密逻辑,这个链路是否被打通并且正确决定了他是否真正理解了所学知识,但教授知识的人真正做到这点是很难的,由于他自身对知识已了然于胸往往无法感同身受,从而容易忽略链路中潜在隐含的一些定义规则,导致学习者学完模棱两可,在偶然间学生了解到链路中的堵点或纠正了错点,我们便常说这个学生“开窍了”。
java1234_小锋19 小时前
开发语言·python·深度学习·pytorch2
PyTorch2 Python深度学习 - 模型保存与加载锋哥原创的PyTorch2 Python深度学习视频教程:https://www.bilibili.com/video/BV1eqxNzXEYc
Python图像识别19 小时前
python·深度学习·yolo
74_基于深度学习的垃圾桶垃圾溢出检测系统(yolo11、yolov8、yolov5+UI界面+Python项目源码+模型+标注好的数据集)本项目基于 PyQt5 构建了简洁易用的图形用户界面,支持用户选择本地图片或视频进行目标检测。系统界面美观,交互流畅,具备良好的用户体验。
CoovallyAIHub19 小时前
深度学习·算法·计算机视觉
突破360°跟踪极限!OmniTrack++:全景MOT新范式,HOTA指标狂飙43%全景相机能够捕捉360°完整环境信息,在自动驾驶、机器人导航等领域有着广泛应用。然而,这种超广视野也给多目标跟踪(MOT)带来了前所未有的挑战:严重的图像畸变、分辨率不均匀、目标在画面边缘频繁切换导致身份丢失……
lybugproducer20 小时前
人工智能·深度学习·神经网络
深度学习专题:模型训练的数据并行(二)在分布式深度学习训练中,当模型参数规模庞大时,如何高效地在多个 GPU 之间同步梯度成为关键问题。Ring All-Reduce 是一种高效的通信算法,特别适合在多 GPU 环境中进行梯度同步。
CoovallyAIHub20 小时前
深度学习·算法·计算机视觉
首个大规模、跨模态医学影像编辑数据集,Med-Banana-50K数据集专为医学AI打造(附数据集地址)在人工智能迅猛发展的今天,多模态大模型已经展现出令人惊叹的图像编辑能力。然而,在专业性极强的医学影像领域,AI编辑的研究却一直受限于高质量、大规模、可公开访问数据集的缺失。