深度学习

YOLO数据集集合25 分钟前
深度学习·yolo·目标检测·无人机
无人机航拍街道巡检数据集 | 空中视角车辆检测、交通流量统计、违停识别、智能交通YOLO数据集10399期摘要:一套面向无人机低空航拍街道场景的车辆目标检测开源数据集,采用行业通用标注格式,全面适配YOLO系列等主流深度学习目标检测框架。可落地空中视角车辆识别、城市街道巡检、交通流量统计、车辆违停抓拍、智能交通管控等业务场景,样本体量充足、场景贴合实战,能够快速支撑算法训练、模型微调、工程部署与学术研究。
放下华子我只抽RuiKe532 分钟前
开发语言·前端·javascript·python·深度学习·react.js·fastapi
FastAPI 全栈后端(四):认证与授权创作者: Yardon | GitHub: github.com/YardonYan | 版本: v1.0 |
菜鸟‍1 小时前
深度学习·学习·计算机视觉
【论文学习】Segment Anything 分割一切分割一切我们介绍了分割一切(SA)项目:一个用于图像分割的新任务、新模型和新数据集。通过在数据收集循环中使用我们高效的模型,我们构建了迄今为止规模最大的分割数据集,在1100万张经授权且尊重隐私的图像上拥有超过10亿个掩码。该模型的设计和训练使其具有可提示性,因此能够零样本迁移到新的图像分布和任务中。我们在众多任务上评估了其能力,发现其零样本性能令人印象深刻——通常与甚至优于先前全监督方法的结果。我们已在https://segment-anything.com上发布了分割一切模型(SAM)以及对应的包含1
装不满的克莱因瓶2 小时前
网络·人工智能·python·深度学习·语言模型·自然语言处理
自然语言处理发展历史——从规则系统到大语言模型的演进之路目录一、前言二、NLP发展的整体阶段三、第一阶段:规则驱动时代(1950s-1990s)(一)核心思想
weixin_408266343 小时前
深度学习
H20训练CPGNET环境搭建1、本地cuda安装 版本:12.1sudo sh cuda_12.1.1_530.30.02_linux.run echo ‘export CUDA_HOME=/usr/local/cuda-12.1’ >> ~/.bashrc echo ‘export PATH=CUDAHOME/bin:CUDA_HOME/bin:CUDAHOME/bin:PATH’ >> ~/.bashrc echo ‘export LD_LIBRARY_PATH=CUDAHOME/lib64:CUDA_HOME/lib64:CU
装不满的克莱因瓶3 小时前
人工智能·python·深度学习·算法·机器学习·语言模型·自然语言处理
RLHF中的PPO算法——大语言模型对齐优化的核心引擎目录一、前言二、RLHF中的PPO位置(一)整体流程(二)直观理解三、什么是PPO(一)一句话理解(二)核心目标
AndrewHZ5 小时前
人工智能·深度学习·语言模型·开源·llm·transformer·基座模型
【LLM技术全景】开源大模型生态:如何选择适合你的基座模型?摘要:本文是《LLM技术全景:从Token到部署》系列第六篇。随着LLaMA开源引爆生态,现在已有数十个开源大模型可供选择。但"选择困难症"也随之而来:LLaMA、ChatGLM、Qwen、DeepSeek、Mistral……到底哪个更适合我的项目?本期将系统对比主流开源模型的技术特点、中文能力、部署成本,并提供一套"模型选择决策树",帮助开发者在2026年做出最合适的技术选型。
硅谷秋水5 小时前
人工智能·深度学习·机器学习·计算机视觉·自动驾驶
NVIDIA OmniDreams:用于闭环自动驾驶仿真、支持实时生成的世界模型26年6月来自Nvidia的论文“NVIDIA OmniDreams: Real-Time Generative World Model for Closed-Loop Autonomous Vehicle Simulation”。
txg6666 小时前
人工智能·深度学习·安全·网络安全
MirrorFuzz:利用共享漏洞与大模型的深度学习框架 API 模糊测试“ 深度学习框架(如 PyTorch、TensorFlow 等)已成为 AI 应用的基础设施,其内部 API 的稳定性与安全性直接影响模型训练与部署的可靠性。然而,现有针对深度学习框架的模糊测试方法,大多将 API 视为相互独立的测试对象,忽略了一个关键事实:不同深度学习框架之间,乃至同一框架内部,存在大量功能高度相似的API,而这些 API 往往共享相同或相似的漏洞模式。
chen_zn956 小时前
人工智能·深度学习·具身智能·vla·流匹配
GR00T N1.7源码学习(五):Policy推理、RTC动作衔接与部署流程解析GR00T N1.7源码学习(一):工程入口、模型结构与动作生成流程解析-CSDN博客GR00T N1.7源码学习(二):训练数据、Processor与多机器人动作空间解析-CSDN博客
逻辑星辰6 小时前
开发语言·人工智能·python·深度学习·算法
x-ds-pow-response逆向分析声明:本文章中所有内容仅供学习交流使用,不用于其他任何目的,不提供完整代码,抓包内容、敏感网址、数据接口等均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关.本文章未经许可禁止转载,禁止任何修改后二次传播,擅自使用本文讲解的技术而导致的任何意外,作者均不负责。
一切皆是因缘际会6 小时前
人工智能·深度学习·ai·架构
从注意力归因到XAI落地当前政企AI整改大批量驳回项目,核心是开发团队混淆了生成式事后解释与权重前置归因,二者看似输出一致,底层逻辑完全割裂,也是行业最大骗局。
古希腊掌管代码的神THU6 小时前
人工智能·深度学习·自然语言处理·面试
【清华代码熊】Agent Harness 工程实践之(1): Context管理📌 Agent Harness 作为 2026 年上半年 Agent 技术代名词,在讲到具体方法论的时候却又“说不清”。 🔥 这个系列会通过解析 Claude Code / DeepAgents / OpenHands 等框架,通过“了解Harness 工业做法” 学习 Harness。
月疯6 小时前
人工智能·pytorch·深度学习
torch:tensor的运算torch.pow()等价与**平方根相关函数指数与幂注意:对负数开平方会得到 nan(实数域),如需复数请用 torch.complex64
叫我:松哥6 小时前
人工智能·深度学习·神经网络·算法·cnn·迁移学习·图像识别
基于卷积神经网络的人脸情绪识别算法,引入残差连接与SE注意力模块1前言1.1.1 研究背景随着人工智能技术的飞速发展,人机交互日益成为日常生活的重要组成部分。人类情感的表达主要通过面部表情、语音语调、肢体动作等方式传递,其中面部表情是最直观、最丰富的载体。人脸情绪识别旨在使计算机能够自动识别人类的情绪状态,如高兴、悲伤、愤怒、惊讶等,从而实现更自然、更智能的交互。该技术在智能教育、心理健康监测、安全驾驶、娱乐互动等领域具有广阔的应用前景。
谷哥的小弟6 小时前
人工智能·深度学习·机器学习·大模型·大语言模型·梯度下降
大模型核心基础知识(17)—梯度下降梯度下降是模型训练中的基础优化方法。神经网络在完成前向传播和误差计算之后,还要进一步调整参数,使损失函数逐步减小。梯度下降所承担的任务,正是依据当前误差对参数进行迭代更新,使模型输出不断逼近目标结果。没有这一过程,模型虽然能够计算预测结果,却无法在训练中持续改进。
小跑者7 小时前
人工智能·深度学习
解决 TensorBoard 启动时 “No module named 'pkg_resources'” 问题在 Pointcept 项目中,启动 TensorBoard 查看训练日志时出现如下错误:发现目录存在,但没有顶层的 pkg_resources 模块。进一步查看 _vendor 子目录:
渡之7 小时前
深度学习·算法·动态规划·无人机
GeoBridge 深度解析:语义锚定多视图基础模型,重塑无人机跨视角地理定位CVPR 2026 | 无人机导航 | GNSS 拒止 | 跨视角地理定位 | 多模态大模型 | 图像文本检索
我认不到你7 小时前
java·开发语言·人工智能·深度学习·ai·语言模型·开源
【开源、教程】RAG全流程实现(java+完整代码):第二弹本教程的环境基于 jdk8 + langchain4j 0.35教程源码放在这里了:worenbudaoni/rag-study-helper: 一个学习检索增强生成的全流程助手
菜鸟分享录8 小时前
人工智能·深度学习·机器学习·ai
AI 学习路线 01:一文讲清 AI、机器学习、深度学习和大模型的关系现在 AI 很火,但很多人刚开始学的时候,最容易被一堆概念绕晕:这篇文章是我的 AI 学习系列第一篇,目标不是一上来就讲复杂公式,而是先建立一个清晰的知识地图。