深度学习

张忠琳11 分钟前
人工智能·深度学习·ai·架构·vllm
【vllm】(五)vLLM v1 Attention — 模块超深度分析之二selector.py(165行)是后端选择的入口模块,负责根据运行时配置选择最优注意力后端。设计意图:
生信之灵1 小时前
人工智能·深度学习·算法·单细胞·多组学
拓扑与曲率双剑合璧:scGeom如何从单细胞数据中“看见”细胞命运论文信息标题:2309.07950v1拓扑与曲率双剑合璧:scGeom如何从单细胞数据中“看见”细胞命运
kishu_iOS&AI1 小时前
人工智能·pytorch·python·深度学习
深度学习 —— 梯度下降法的优化方法目录一、梯度下降法 回顾二、梯度下降法的缺点三、如何选择优化方法1.了解 —— 指数移动加权平局1.1 公式
byzy2 小时前
论文阅读·深度学习·计算机视觉·自动驾驶
【论文笔记】Vehicle-to-Everything Cooperative Perception for Autonomous Driving原文链接:https://ieeexplore.ieee.org/abstract/document/11144483/
谷哥的小弟2 小时前
人工智能·深度学习·机器学习·大模型·智能体
大模型核心基础知识(02)—大模型的主要特征与能力边界大模型之所以在人工智能领域形成广泛影响,并不只是因为参数数量更大,而是因为它在表示学习、任务迁移、内容生成和跨模态处理等方面表现出比传统模型更强的综合能力。随着模型规模、训练数据和计算资源不断扩展,大模型的性能通常会随之提升,这也是近年来大模型快速发展的重要原因之一。与此同时,大模型的能力并不等于没有边界。模型规模的增长能够带来更强的理解与生成能力,但并不能自动消除事实错误、推理偏差、可解释性不足和高资源消耗等问题。
xiaotao1312 小时前
人工智能·深度学习
03-深度学习基础:LoRA与参数高效微调(PEFT)PEFT方法对比总结:选择指南:记住:
深度红薯3 小时前
图像处理·人工智能·python·深度学习·毕业设计·毕设·sam3
SAM3:开放式分割,太强了(后面有SAM3权重下载方式)(单图测试、视频测试、实时跟踪)https://github.com/facebookresearch/sam3?tab=readme-ov-file
数智工坊3 小时前
网络·人工智能·深度学习·cnn
金字塔场景解析网络PSPNet:打通全局上下文,屠榜语义分割三大基准标题:Pyramid Scene Parsing Network 会议:CVPR 2017 单位:香港中文大学、商汤科技 代码:https://github.com/hszhao/PSPNet 论文:https://arxiv.org/pdf/1612.01105.pdf
LaughingZhu3 小时前
人工智能·经验分享·深度学习·神经网络·产品运营
Product Hunt 每日热榜 | 2026-04-22标语:RankAI 自动为你从 Google 和 AI 搜索中获取买家。介绍:RankAI是首个真正有效的SEO/GEO代理工具。它能够完全自动化地帮你从Google和ChatGPT等平台吸引数百万的访问者。只需将你的网站放入RankAI,它会自动找到客户在Google和ChatGPT上搜索的高意向关键词,发布优化后的页面,跟踪表现,反复调整页面,直到为你带来访问者。
Rubin智造社3 小时前
人工智能·深度学习·openai·agent·开源模型·anthropic
04月22日AI每日参考:OpenAI发布AI经济政策,Agent进入金融市场今天AI圈有两件值得关注的事。其一,OpenAI发布了系统性的AI经济政策建议,包括机器人税、公共财富基金等,标志着AI公司开始思考社会影响;其二,Public.com成为首个Agent经纪公司,AI Agent正式进入受监管的金融市场。国内外各5条精选资讯,带你快速掌握今日AI动态。
Narrastory4 小时前
人工智能·深度学习·强化学习
Note:强化学习(四)2026 | ming前面几章我们花了大量精力讨论 DQN 及其变体,本质上都是在做同一件事:努力学好一个动作价值函数 Q(s,a)Q(s, a)Q(s,a),然后让策略通过贪婪(或 ϵ\epsilonϵ-贪婪)的方式 a=arg⁡max⁡aQ(s,a)a = \arg\max_a Q(s, a)a=argmaxaQ(s,a) 推导出来。这套基于价值的范式在 Atari 游戏上大杀四方,但如果你多训练几个环境就会皱眉头——它处理连续动作空间时效果并不理想。
谷哥的小弟4 小时前
人工智能·深度学习·机器学习·大模型·智能体
大模型核心基础知识(01)—大模型的发展历程与技术演进大模型并不是孤立出现的技术产物,而是在人工智能、神经网络、深度学习和预训练方法持续演进的基础上逐步形成的。回顾大模型的发展历程,可以看到一条较为清晰的技术演进路径:早期人工智能研究奠定问题意识,神经网络研究提供结构基础,深度学习推动表示学习能力提升,预训练方法和Transformer架构则进一步促成了现代大模型的形成。
Hello world.Joey4 小时前
人工智能·深度学习·计算机视觉·目标跟踪
SiamFC概述SiamFC (Fully-Convolutional Siamese Networks) 开创性单目标视觉跟踪算法
数智工坊4 小时前
网络·人工智能·深度学习·目标检测·r语言·cnn
Faster R-CNN 全精读:实时目标检测的里程碑之作在Faster R-CNN出现之前,目标检测一直被候选区域生成拖慢速度——Selective Search在CPU上跑1张图要1~2秒,比检测网络还慢。这篇论文直接用RPN区域提议网络替代传统候选区域算法,和Fast R-CNN共享卷积特征,让候选区域生成几乎“零成本”,首次实现GPU上接近实时的高精度检测,成为两阶段检测的绝对标杆。
AI人工智能+4 小时前
深度学习·计算机视觉·ocr·行驶证识别
行驶证识别技术融合计算机视觉与自然语言处理,实现机动车证件信息的精准提取随着智能交通系统(ITS)和金融科技领域的快速发展,车辆证件的自动化处理需求日益增长。行驶证作为机动车上路行驶的法定凭证,其包含的信息复杂且关键。传统的OCR(光学字符识别)方案往往难以应对行驶证图像中复杂的版式、多样的字体以及非结构化数据的干扰。行驶证识别技术应运而生,它不再是单一的字符识别任务,而是计算机视觉(CV)与自然语言处理(NLP)技术的深度融合,旨在实现对行驶证图像中所有登记信息的精准定位、高鲁棒性识别与结构化提取。
xiaotao1314 小时前
人工智能·深度学习·大模型·指令微调
03-深度学习基础:指令微调与RLHF指令微调 vs RLHF:发展历程:记住:
大模型最新论文速读4 小时前
论文阅读·人工智能·深度学习·机器学习·自然语言处理
RACER:无需训练,让大模型推理速度翻倍结合检索信号与 logit 信号生成草稿的投机解码方法,在各 benchmark 上一致实现 2 倍加速,超越所有 training-free 基线,比需要额外训练的 EAGLE-3 还快
金融小师妹5 小时前
深度学习·逻辑回归·线性回归
AI宏观流动性模型:经济学家洪灏重估黄金周期路径显现,长期上行结构未改摘要:本文通过构建AI宏观流动性周期模型,结合资产价格分解框架与跨周期定价机制,分析黄金价格短期回调的结构性原因及其长期上行趋势的可持续性。
老鱼说AI5 小时前
人工智能·深度学习·神经网络·机器学习
强化学习:策略梯度算法深度精讲核心目标: 理解什么是策略,为什么我们需要策略梯度,以及它与基于价值(Value-based)方法的根本区别。
小糖学代码5 小时前
人工智能·pytorch·深度学习
LLM系列:2.pytorch入门:5.认识深度学习与 PyTorch人工智能、机器学习与深度学习并非并列关系,而是一层套一层的包含关系:在正式建模前,必须明确数据的组成结构: