深度学习

grant-ADAS35 分钟前
人工智能·深度学习
记录paddlepaddleOCR从环境到使用默认模型,再训练自己的数据微调模型再推理启动paddlelabel:会等几分钟才能启动,我的挺慢的 标注好之后,点导出标记结果和导出识别结果开始划分数据集: 直接执行也可:
云和数据.ChenGuang1 小时前
人工智能·深度学习·机器学习·ai·mindstudio
魔搭社区 测试AI案例故障大模型真正进行推理、生成文本的核心逻辑,我给你逐行通俗、完整、无死角解释,让你彻底看懂每一步在做什么。
小锋学长生活大爆炸1 小时前
人工智能·深度学习·chatgpt·openclaw
【工具】无需Token!WebAI2API将网页AI转为API使用转载请注明出处:小锋学长生活大爆炸[xfxuezhagn.cn]如果本文帮助到了你,欢迎[点赞、收藏、关注]哦~
_张一凡2 小时前
人工智能·深度学习·transformer
【多模态模型学习】从零手撕一个Vision Transformer(ViT)模型实战篇本文主要是通过自己构建一个VIT模型完成一个简单的分类任务。电脑配置:win10+RTX4080SX4
blackicexs5 小时前
人工智能·深度学习·机器学习
第九周第四天过拟合是机器学习模型训练过程中常见的问题。当一个模型在训练数据上表现非常好,但在测试数据上表现不佳时,就被认为存在过拟合问题。当模型过于复杂或训练数据量不足时,通常会出现这种情况。为了减少过拟合,研究人员提出了各种技术,如正则化、数据增强和交叉验证。正则化方法在损失函数中引入惩罚项来限制模型参数的大小,从而使模型更简单、更稳定。数据增强通过对原始数据应用旋转、裁剪或添加噪声等操作来增加训练数据的多样性。此外,交叉验证通过反复将数据集拆分为训练集和验证集来评估模型的泛化能力。这些技术可以有效地提高机器学习模
zh路西法7 小时前
python·深度学习·机器学习·机器人
【宇树机器人强化学习】(六):TensorBoard图表与手柄遥控go2测试Unitree RL GYM 是一个开源的 基于 Unitree 机器人强化学习(Reinforcement Learning, RL)控制示例项目,用于训练、测试和部署四足机器人控制策略。该仓库支持多种 Unitree 机器人型号,包括 Go2、H1、H1_2 和 G1。仓库地址
抓个马尾女孩8 小时前
人工智能·深度学习·算法·transformer
位置编码:绝对位置编码、相对位置编码、旋转位置编码模型本身是“无状态”的,它看不到句子里单词的顺序(比如“我吃苹果”和“苹果吃我”,在模型眼里如果不做处理,输入的token是一样的),那它怎么区分语序、理解语义呢?答案就是「位置编码」——它就像给每个单词贴了一个“坐标标签”,告诉模型“这个单词在句子里排第1位、那个排第3位”,让模型能捕捉到语序带来的语义差异。 关于位置编码,主要分为三类:绝对位置编码(Absolute Positional Encoding)、相对位置编码(Relative Positional Encoding),以及近年来大火的旋转
这张生成的图像能检测吗9 小时前
人工智能·深度学习·神经网络·机器学习·故障诊断·自监督学习
(论文速读)SFAFBR:一种自监督的人工特征偏置校正框架论文题目:Artificial Feature Bias Rectified by Self-Supervised Learning for Rolling Bearings Fault Diagnosis Under Limited Labeled Vibration Signals(有限标记振动信号下滚动轴承故障诊断的自监督学习修正人工特征偏差)
nap-joker9 小时前
人工智能·深度学习·知识增强深度学习·kadl·经验知识·科学知识·知识识别
【综述型论文+知识增强深度学习KADL】知识增强深度学习及其应用:一项综述1、作者将知识增强深度学习(KADL),把知识分为科学知识和经验知识两大类,其中,科学知识主要是数学理论和物理模型;经验知识主要是知识图谱(实体关系和实体属性)、逻辑符号、概率依赖关系等;然后将整合方法,分成了数据层、网络架构层、训练层和决策层四个级别。
CoovallyAIHub9 小时前
深度学习·算法·计算机视觉
ICLR 2026 | MedAgent-Pro:用 Agent 工作流模拟临床医生的循证诊断过程导读多模态大模型(MLLM)在医学影像诊断上有一个根本性矛盾:它们能"看"图像、能"说"结论,但做不好临床诊断中最关键的一步——定量分析。测量杯盘比、计算射血分数、评估组织厚度,这些需要精确数值的操作是 MLLM 的短板。更严重的是,MLLM 在推理过程中容易产生幻觉和不一致,这在临床场景中不可接受。
九.九10 小时前
人工智能·深度学习
3W功耗 HiNas+cpolar,随时随地访问家里的文件HiNas 作为轻量化家庭 NAS 系统,核心能满足家庭用户的基础存储需求:支持多协议的文件共享与集中存储,能实现多设备间的文件同步,还能通过 Web 界面轻松管理媒体文件,甚至可借助 Docker 扩展更多实用服务,整体适配玩客云等低功耗硬件,是普通家庭搭建私有存储的实用工具。
CoovallyAIHub10 小时前
深度学习·算法·计算机视觉
AAAI 2026 | 上海AI Lab发布RacketVision,首次为球拍运动标注球拍姿态导读乒乓球、网球、羽毛球——这三大球拍运动的视觉分析一直是体育AI的热门方向,但现有数据集存在两个共性短板:只关注单一运动的球追踪,且完全忽略了球拍这一核心交互物体。球拍的姿态直接决定了击球方向和旋转,不建模球拍就无法真正理解比赛。
qq_2816842110 小时前
人工智能·深度学习·语言模型·重构·transformer
Transformer-XL:突破固定长度枷锁,重构长文本语言模型文章速览:本文深度解读Transformer-XL核心架构,拆解段级递归与相对位置编码两大创新,彻底解决传统Transformer上下文碎片化、长依赖建模失效难题,兼顾性能与效率,是长文本AI的奠基性工作。
CoovallyAIHub10 小时前
深度学习·算法·计算机视觉
中文语音识别该用谁?6 个开源模型 + 2 个配套工具,一文理清导读中文语音识别的开源方案越来越多,但它们不在同一个层面上——有的是模型,有的是工具包,有的是部署运行时。直接把它们摊在一张表里比"谁更好",容易越看越糊涂。本文把 6 个中文语音识别模型和 2 个配套工具拆开来看,在统一基准上比精度、速度和功能,帮你理清它们的关系,找到适合自己场景的组合方案。
华农DrLai11 小时前
人工智能·深度学习·ai·prompt·bert·transformer
什么是角色扮演Prompt?为什么给AI设定身份能提升表现?🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!
yiyu071611 小时前
人工智能·深度学习
3分钟搞懂深度学习AI:实操篇:Attentiongithub仓库及代码(额外补充,持续更新): yiyu0716/3mins-dl: 专为零基础小白打造的深度学习极简指南。这里没有令人头疼的公式,只有通俗易懂的知识拆解。每天只需 3 分钟,带你利用碎片时间轻松看懂 AI 核心概念,从零开始,毫无压力地跨入人工智能大门。
热爱生活的猴子12 小时前
人工智能·深度学习·分类·数据挖掘·nlp
RoBERTa 分类模型正则化调优实验——即dropout和冻结层对过拟合的影响在中文文本四分类任务(其他/投诉/疑似投诉/高意图)中,研究dropout率和冻结底层网络对模型过拟合的影响,通过对比不同配置下的训练过程,找出兼顾性能与泛化的最优超参数组合。
智算菩萨12 小时前
论文阅读·人工智能·深度学习·ai·agi
AGI的定义:基于CHC认知理论的量化评估框架深度解析人工智能领域长期面临一个核心困境:通用人工智能(Artificial General Intelligence, AGI)这一概念始终缺乏清晰、可量化的定义标准。随着大语言模型在各类任务上展现出令人瞩目的能力,关于"我们距离AGI还有多远"的讨论愈发激烈,却因缺乏统一的衡量尺度而难以形成共识。本文献精读聚焦于Dan Hendrycks、Dawn Song、Yoshua Bengio等数十位顶尖学者联合发表的开创性论文《A Definition of AGI》,该论文创新性地将心理学领域最具实证基础的Cat
deephub13 小时前
人工智能·python·深度学习·大语言模型·agent
构建生产级 AI Agent 系统的4大主流技术:反思、工具、规划与多智能体协作多数人对AI Agent的理解还停留在"聊天机器人的升级版",这个思路在一段时间里这么理解其实也没什问题,比如问一个问题,拿到一个回答。但很快就能看出来单轮提示-响应的交互根本没有任何的意义,而真正有意义的跃迁发生在AI开始具备这些能力的时候:思考、规划、行动、观察、循环往复,这和我们处理复杂问题的方式几乎一致。
逄逄不是胖胖13 小时前
人工智能·深度学习
《动手学深度学习》-68多头注意力实现什么是多头注意力? 它是 Transformer 模型(由 Google 在 Attention Is All You Need 中提出)的核心组件。简单来说,就是把“自注意力机制 (Self-Attention)”重复做多次(多个“头”),然后再把结果合并起来。