深度学习

bryant_meng1 小时前
人工智能·深度学习·业界资讯
【Reading Notes】(4)Favorite Articles from 2021邱锡鹏,这是Transformer最全综述(2021年06月11日)从R-CNN到Mask R-CNN的思维跃迁(2021年06月15日)
清空mega1 小时前
人工智能·深度学习·目标跟踪
动手学深度学习——多尺度锚框在前面的学习中,我们已经知道了锚框的基本思想:在图像的每个位置预先生成若干个不同大小、不同宽高比的候选框,再由模型判断这些框中是否包含目标,并进一步修正位置。
克里斯蒂亚诺·罗纳尔达2 小时前
深度学习·学习·机器学习
智能体学习16——学习与适应(Learning-and-Adaptation)-深入解读LLM 学会了"说话",但说的内容不一定符合人类期望。对齐就是让模型"说人话、办人事"。直觉:想象你在调水温,PPO 说"每次只能转一点点,别一下从冷水转到开水"。ε 就是"每次最多转多少"的限制。
冰西瓜6002 小时前
人工智能·深度学习
深度学习的数学原理(二十六)—— 多头注意力在上一篇中,我们完整拆解了缩放点积注意力的核心原理:它可以让模型根据词与词的相关性,动态分配注意力权重,实现“该关注谁就关注谁”的信息融合。本文会继续介绍应用更广泛的多头注意力机制。
憨波个3 小时前
人工智能·深度学习·lstm·transformer·音频·语音识别
【说话人日志】从 LSTM attractor 到 Transformer attractor:EEND-TA论文:Transformer Attractors for Robust and Efficient End-to-End Neural Diarization 简称:EEND-TA 作者:Lahiru Samarakoon, Samuel J. Broughton, Marc Harkonen, Ivan Fung 时间:ASRU2023 任务:Speaker Diarization,回答“谁在什么时候说话”
这张生成的图像能检测吗3 小时前
人工智能·深度学习·知识图谱·故障诊断
(论文速读)基于知识图谱构建的大型工业设备故障诊断模型论文题目:Large model for fault diagnosis of industrial equipment based on a knowledge graph construction(基于知识图谱构建的大型工业设备故障诊断模型)
ccLianLian3 小时前
人工智能·深度学习
深度学习基础·损失函数参考文献
极光代码工作室3 小时前
python·深度学习·机器学习·ai·自然语言处理
基于NLP的智能客服系统设计与实现随着人工智能技术的快速发展与企业数字化转型的深入推进,传统人工客服面临响应延迟高、服务成本大、知识覆盖不全、7×24小时服务能力弱等瓶颈。自然语言处理(NLP)作为AI落地的关键使能技术,为构建高效、可扩展、拟人化的智能客服系统提供了坚实基础。本文围绕“基于NLP的智能客服系统”开展设计与实现研究,融合规则匹配、语义相似度计算与预训练语言模型(BERT+BiLSTM-CRF)三阶段混合架构,构建具备意图识别、实体抽取、多轮对话管理及FAQ精准检索能力的端到端客服系统。系统采用前后端分离架构,后端基于Fla
卡梅德生物科技小能手4 小时前
经验分享·深度学习·生活
整合素家族核心靶点解析:CD51(Integrin αv)的分子机制与药物研发技术前瞻在细胞生物学与生物医药研发领域,整合素(Integrin)家族始终是研究的热点。其中,CD51(整合素αv亚基) 因其在细胞黏附、迁移及信号转导中的枢纽作用,成为了连接细胞外基质(ECM)与细胞内环境的关键分子。尽管目前尚无直接靶向CD51的单抗药物获批,但其在研管线与分子机制的深度解析,为技术开发者与科研人员提供了广阔的研究视角。本文将从技术维度,系统梳理CD51的作用机制与药物研发现状。
张二娃同学4 小时前
人工智能·windows·深度学习·github·claude code
Claude Code 使用教程:下载安装、CC Switch 配置、MiniMax API 获取与启动实操最近在配置 Claude Code 的过程中,我整理了一套比较完整的实操流程。本文不讲太多抽象概念,而是按照实际操作界面的顺序,带大家一步一步完成整个配置过程。全文主要包含四部分内容:Claude Code 下载与安装、GitHub 项目《CC Switch》安装、MiniMax 模型 API 获取,以及 Claude Code 的启动与初始使用。
V搜xhliang02465 小时前
大数据·人工智能·python·深度学习·机器学习·机器人
基于¹⁸F-FDG PET/CT的深度学习-影像组学-临床模型预测非小细胞肺癌脉管侵犯的价值基于¹⁸F-FDG PET/CT的深度学习-影像组学-临床模型预测非小细胞肺癌脉管侵犯的价值 摘要 脉管侵犯(Lymphovascular Invasion, LVI)是非小细胞肺癌(NSCLC)术后复发和不良预后的独立危险因素,术前准确评估LVI状态对于手术方案制定和辅助治疗决策具有重要临床意义。¹⁸F-FDG PET/CT作为融合代谢与解剖信息的多功能影像技术,为LVI的无创预测提供了独特的影像学生物标志物平台。本文系统阐述基于PET/CT的深度学习-影像组学-临床多维度融合模型预测NSCLC脉管侵犯
XuecWu35 小时前
人工智能·深度学习·算法·计算机视觉·语言模型
原生多模态颠覆Scaling Law?解读语言“参数需求型”与视觉“数据需求型”核心差异在大模型发展初期,行业普遍遵循“均匀堆料”的Scaling逻辑——参数、数据、算力同步提升,模型能力便会线性增长。但随着原生多模态技术的发展,这一固有认知被彻底打破:全模态模型的Scaling并非均匀分布,不同模态对资源的需求存在显著差异。杨立昆、谢赛宁最新论文及文心5.0技术报告均指出,即便加入负载均衡损失,模型仍会向语言模态倾斜更多专家资源,核心原因正是“语言是参数需求型、视觉是数据需求型”。结合自身对多模态模型的理解,本文将拆解这一核心结论,解答“原生多模态为何颠覆传统Scaling”及“不同模态资
angleboy85 小时前
人工智能·深度学习·yolo
【原创】如何WIN 10/11系统下解决YOLOv13训练异常的安装指南先上最后训练的结果图:如果虽然安装上了,但是训练到最后一直精度很低:之前按照网上的安装win系统下YOLO V13,训练不报错,但是精度一直训练很低。经过反复尝试,发现可能是软件版本的问题。
ZhuNian的学习乐园6 小时前
人工智能·python·深度学习
LLM智能体调度:从ReAct到多智能体调度智能体感知模块: 把智能体调度架构划分成四层:划分(Prompt 层、Context 层、Tool 层、Agent 层)在2025-2026年的Agent工程实践中是非常主流且准确的描述。 它本质上是对Agent “感知-推理-行动-协作” 四个核心智能特征的工程化映射,逻辑清晰、层次分明。
小超同学你好6 小时前
人工智能·深度学习·语言模型
LangGraph 25. 实战:Agent资源优化怎么做?用 State 与条件边管理预算、取证与模型档位(附 SRE 分诊 demo)摘要(Summary):本文讨论智能体在生产环境中的资源感知优化:在单次请求生命周期内把预算、延迟、配额与任务难度纳入显式 State,通过 LangGraph 的节点、条件边与受控循环实现在线选档、取证伸缩、有界升档与可观测降级。前半部分厘清概念边界与典型策略模式(分层路由、升档 cap、fallback、上下文塑形等);后半部分以 demo_codes 中 SRE 事件分诊 为例,对照 OpenAIResourceLLM(真实调用)下的 resource_aware_graph.py 拓扑、route
xianluohuanxiang6 小时前
开发语言·人工智能·深度学习·机器学习·零售
高精度气象:极端天气一来,零售最先出问题的不是客流,而是补货体系和损失控制这是2026年开年以来,很多零售老板最扎心的写照。刚刚过去的一季度,从席卷美国22个州的冬季风暴到国内持续的低温雨雪,极端天气不再是“新闻头条”,而是变成了经营报表里的负数。
d1z8886 小时前
人工智能·python·深度学习·gpu·tensorrt
(十八)32天GPU测试从入门到精通-TensorRT-LLM 部署与优化day16TensorRT-LLM 是NVIDIA 官方的 LLM 推理优化库,提供业界领先的性能和完整的优化技术栈。作为 NVIDIA 生态的一部分,TensorRT-LLM 深度整合了 NVIDIA GPU 的各项优化技术,从 kernel 级别的融合到多 GPU 通信优化,再到量化支持,提供了一套完整的高性能推理方案。
冰西瓜6007 小时前
人工智能·深度学习
深度学习的数学原理(二十七)—— 掩码注意力在上一篇中,我们讲了多头注意力如何并行提取多维度的语义信息,但是这个机制在编码器里没问题,到了解码器的自回归生成里,就会遇到两个致命的问题:
aweiname20087 小时前
人工智能·深度学习·ai生视频
安装 NunchakuC:\Users\用户名\Documents\ComfyUI\.venv\Scripts> python -m pip show torch
丰。。7 小时前
人工智能·深度学习·3d·强化学习·深度强化学习
3D高斯泼溅研究01这篇文章解决的是 3D Gaussian Splatting (3DGS) 作为场景表示在实时游戏渲染管线中的工程可行性评估问题。 形式化定义: