技术栈
深度学习
骇城迷影
5 分钟前
人工智能
·
pytorch
·
python
·
gpt
·
深度学习
从零复现GPT-2 124M
本课程是Andrej Karpathy「0 to Hero」系列的核心章节,目标是从零复现GPT-2 124M参数模型——从加载OpenAI预训练权重验证模型正确性,到完全随机初始化参数、基于高质量数据集从零训练,最终实现性能对标甚至超越原版GPT-2。
Hcoco_me
17 分钟前
人工智能
·
深度学习
·
目标检测
·
计算机视觉
·
目标跟踪
深挖 TBD 核心进阶点:深度学习匹配(目标关联的“智能指纹”)
深挖 TBD 核心进阶点:深度学习匹配(目标关联的“智能指纹”)深度学习匹配」,是TBD 框架中目标关联环节的“天花板级方案” —— 它彻底解决了质心法、IOU 等传统关联方法“只看位置、不认长相”的致命缺陷,也是 DeepSORT、ByteTrack 等工业级追踪算法的核心竞争力。
Suryxin.
31 分钟前
深度学习
·
ai
·
vllm
从0开始复现nano-vllm「 utils/contex.py」
这段代码定义了一个全局上下文管理器(Global Context Manager)。它的核心作用是**“传纸条”**。在深度学习框架(如 PyTorch)与底层高性能计算核心(CUDA Kernels,比如 FlashAttention 或 PagedAttention)之间,有很多复杂的元数据(比如这句话有多长、显存存在哪里)需要传递。
ccLianLian
1 小时前
人工智能
·
深度学习
计算机基础·cs336·推理和训练
s o f t m a x i ( z ; T ) = exp ( z i T ) ∑ j exp ( z j T ) \mathrm{softmax}_i(\mathbf{z};T)=\frac{\exp\left(\frac{z_i}{T}\right)}{\sum_j\exp\left(\frac{z_j}{T}\right)} softmaxi(z;T)=∑jexp(Tzj)exp(Tzi)
学Linux的语莫
1 小时前
python
·
深度学习
·
机器学习
模型转为RKNN格式
示例输出:
Hcoco_me
1 小时前
人工智能
·
深度学习
·
算法
·
机器学习
·
分类
·
数据挖掘
·
自动驾驶
目标追踪概述、分类
目标追踪(Object Tracking)是获取图像序列(一般为视频)中感兴趣的区域,并在接下来的视频帧中对其进行跟踪。
肾透侧视攻城狮
2 小时前
深度学习
·
tensorflow 张量操作
·
张量 的基本特性
·
创建张量的常用方法
·
张量的基本操作
·
张量的广播机制
·
张量的聚合操作
《解码AI“乐高”:深入理解TensorFlow张量操作与广播机制》
目录本篇技术博文摘要 🌟引言 📘上节回顾1.TensorFlow 张量操作2.张量 的基本特性3.张量的维度
m0_60388871
2 小时前
人工智能
·
深度学习
·
ai
·
原型模式
·
论文速览
MPA Multimodal Prototype Augmentation for Few-Shot Learning
Authors: Liwen Wu, Wei Wang, Lei Zhao, Zhan Gao, Qika Lin, Shaowen Yao, Zuozhu Liu, Bin Pu
Katecat99663
2 小时前
人工智能
·
深度学习
【夜间野生动物监测】基于深度学习的雄雌绒鸭自动识别系统研究与实践
嗨~宝子们!今天我们来聊聊计算机视觉领域的"流量担当"——目标检测模型!🤩 从经典的YOLO系列到最新的Transformer架构,各种模型层出不穷,简直让人眼花缭乱!别担心,这篇保姆级教程帮你一次性搞懂所有主流目标检测模型,附带超多干货和避坑指南,快搬好小板凳!👇
Godspeed Zhao
2 小时前
人工智能
·
深度学习
·
机器学习
从零开始学AI10——训练数据集与测试数据集
摘要:本文系统介绍了机器学习中训练集与测试集的核心概念及应用方法。主要内容包括:1)数据分割的必要性,重点解决过拟合问题;2)三类数据集(训练集、验证集、测试集)的功能差异与典型比例;3)多种数据分割方法,包括随机分割、K折交叉验证及分层K折;4)完整实战案例演示房价预测流程;5)常见问题解决方案,如数据泄漏防范和小数据集处理策略。文章强调测试集应仅用于最终评估,并提供最佳实践指南和代码模板,帮助读者正确划分数据集以构建可靠模型。
是小蟹呀^
3 小时前
深度学习
·
分类
·
circle loss
【论文阅读12】Circle Loss:一统 Softmax 与 Triplet,从“线性”到“圆形”的优化视角
论文题目:《Circle Loss: A Unified Perspective of Pair Similarity Optimization》
gorgeous(๑><๑)
4 小时前
人工智能
·
深度学习
·
算法
·
机器学习
·
语言模型
【ICLR26-Oral Paper-Meta】先见之明:揭秘语言预训练中大型语言模型的视觉先验
文章:Learning to See Before Seeing: Demystifying LLM Visual Priors from Language Pre-training
陈天伟教授
4 小时前
人工智能
·
深度学习
·
神经网络
·
游戏
·
自然语言处理
·
机器翻译
人工智能应用- 人机对战:01. AI 游戏
人工智能不仅在棋类游戏上展现出强大的智力,还能打电子游戏。这两者有相似之处:它们都需要在对战中学习战胜对手的技能,因此都适合强化学习。不同之处在于游戏环境更复杂、不确定性更强。特别是像《星际争霸》这种开放环境下的多人对战游戏,需要机器掌握更复杂的策略。本节将探讨人工智能打游戏背后的基本原理,并重温强化学习方法。
肾透侧视攻城狮
4 小时前
人工智能
·
深度学习
·
tensorflow 环境搭建
·
conda 创建虚拟环境
·
开发工具安装
·
jupyter相关问题解决
·
tensorf开发环境优化
《超越安装:构建可维护、高性能的TensorFlow专业开发环境》
文章开篇明确Python版本兼容性,并对比了多种Python安装选项(官方版本、Anaconda及系统包管理器)。
Hcoco_me
4 小时前
人工智能
·
深度学习
·
算法
·
目标检测
·
计算机视觉
·
目标跟踪
图像分割:目标检测、语义分割和实例分割
内容来自:《深度学习与计算机视觉》如今,图像分类、目标检测、语义分割、实例分割和目标追踪是计算机视觉的热门应用方向。其中,图像分类与目标检测是最基础的应用,在此基础上派生出了语义分割、实例分割和目标跟踪等相对高级的应用。
九.九
12 小时前
人工智能
·
深度学习
·
transformer
ops-transformer:AI 处理器上的高性能 Transformer 算子库
CANN 组织链接: https://atomgit.com/cann ops-transformer 仓库链接: https://atomgit.com/cann/ops-transformer
春日见
12 小时前
大数据
·
人工智能
·
深度学习
·
elasticsearch
·
搜索引擎
拉取与合并:如何让个人分支既包含你昨天的修改,也包含 develop 最新更新
我现在在crjdevelop,我昨天拉取了develop的最新代码到我的crjdevelop分支上上面,并在crjdevelop分支上对昨天的最新代码做了修改,但是今天develop又更新了代码,我要如何同步拉取最新代码,并合并我修改的代码
偷吃的耗子
13 小时前
深度学习
·
算法
·
cnn
【CNN算法理解】:三、AlexNet 训练模块(附代码)
本模块提供 AlexNet 网络结构的完整实现和训练框架,包含原始 AlexNet、简化版 AlexNet 以及完整的训练器类,支持多种数据集和训练配置。
Faker66363aaa
14 小时前
人工智能
·
深度学习
·
分类
【深度学习】YOLO11-BiFPN多肉植物检测分类模型,从0到1实现植物识别系统,附完整代码与教程_1
作者: @Crazy Snail 发布时间: 已于 2023-03-30 15:02:21 修改 原文链接:
大江东去浪淘尽千古风流人物
16 小时前
深度学习
·
算法
·
3d
·
机器人
·
概率论
·
slam
【SLAM】Hydra-Foundations 层次化空间感知:机器人如何像人类一样理解3D环境
Foundations of Spatial Perception for Robotics: Hierarchical Representations and Real-Time Systems