技术栈
深度学习
龙腾AI白云
3 小时前
深度学习
·
数据挖掘
多模态大模型的统一表征与推理范式
多模态大模型的统一表征与推理范式一、 为何需要“统一表征”?二、 统一表征的三大技术路径三、 统一推理:从感知到认知的跃迁
ppppppatrick
3 小时前
人工智能
·
深度学习
【深度学习基础篇00】什么是深度学习?从单神经元到张量运算的入门全解
同时这也是最经典的深度学习路线。深度学习是人工智能的核心分支,本质是“让计算机像人一样学会‘学习’”——不用手动编写复杂规则,而是通过模拟人类大脑的神经网络结构,让计算机从海量数据中自动捕捉规律、提炼特征,最终实现“识别、判断、预测”等功能。比如我们常见的图像识别、语音翻译,背后核心都是深度学习在发挥作用。对于入门者来说,不用纠结复杂的底层数学推导,先从核心概念、基础操作入手,就能逐步理解其原理,这也是本专栏的核心初衷。 这张图很准确地描述了传统系统与机器学习之间的区别。简单来说,机器学习本身是一个黑盒子
Dev7z
3 小时前
人工智能
·
深度学习
·
电梯扶梯
·
扶梯危险行为
基于深度学习电梯扶梯危险行为检测系统的设计与实现
摘要:扶梯安全事故频发,传统人工监控效率低、响应慢。本系统基于YOLOv11n深度学习模型,覆盖逆行、摔倒、攀爬扶手等10种危险行为,实现扶梯危险行为的自动实时检测与三级风险智能预警。
有为少年
4 小时前
人工智能
·
深度学习
·
机器学习
·
数学建模
从独立性、相关性到复杂动力系统
在面对海量、杂乱无章的数据时,数据科学家和分析师最核心的动机之一,就是寻找变量之间的“信息依赖”。我们所在的物理世界与商业社会并非由完全随机的孤立事件构成,事物之间总是存在着千丝万缕的联系。
人工智能培训
4 小时前
人工智能
·
深度学习
·
逻辑回归
·
agi
·
具身智能
·
大模型应用工程师
·
企业ai培训
超级人工智能(AGI)是否是大模型的必然发展方向?
当GPT-4通过律师资格考试、AlphaFold破解蛋白质折叠难题,大模型的飞速迭代让“超级人工智能(AGI)”再次成为焦点。有人断言,AGI是大模型发展的唯一必然方向,是技术演进的终极宿命;但事实上,大模型与AGI之间存在本质鸿沟,技术路径的多元性、现实需求的导向性,决定了AGI只是大模型可能的发展方向之一,而非必然终点。
响叮当!
5 小时前
人工智能
·
深度学习
·
机器学习
大模型输出的全过程
在理解大模型(Large Language Model)的整体流程时,训练、微调和推理三者之间的关系尤为重要。
光的方向_
7 小时前
人工智能
·
深度学习
·
chatgpt
·
transformer
04-Tokenization实战-从BPE到Hugging-Face应用
摘要: 本文深入讲解大语言模型的第一步——分词(Tokenization),从经典的Byte Pair Encoding(BPE)算法到WordPiece、SentencePiece等主流方案,详解GPT、BERT、LLaMA等模型的分词策略。通过Hugging Face Tokenizers库的实战代码,帮助读者掌握分词器训练、词表构建、特殊token处理等工程实践,理解分词对模型性能的深远影响。
人工智能培训
7 小时前
人工智能
·
深度学习
·
ai大模型
·
多模态学习
·
具身智能
·
企业ai转型
多模态大模型的统一表征与推理范式
吾在学习路
8 小时前
深度学习
·
计算机视觉
SAMCT: Segment Any CT Allowing Labor-Free Task-Indicator Prompts
CT(Computed Tomography)是临床中最常用的医学影像之一,用于:传统深度学习方法包括:
宝贝儿好
9 小时前
人工智能
·
python
·
深度学习
·
神经网络
·
机器人
·
自动驾驶
【强化学习】第十章:随机高斯策略
高斯策略属于强化学习的基于策略优化的分支,用于解决连续动作空间中的任务,本来是打算写入第八章的,但是在Actor-Critic框架中,使用高斯策略能实现更稳定、更高效的策略优化,彼时AC又没讲,所以思来想去,这部分就只能单独开一个篇章讲解了。
eihh23333
9 小时前
人工智能
·
深度学习
·
机器学习
山东大学软件学院毕业设计(二)
https://blog.csdn.net/weixin_29166013/article/details/158185843
风栖柳白杨
10 小时前
人工智能
·
深度学习
·
transformer
【Transformer】核心思想与原理
Transformer最早来自论文:Attention Is All You Need 核心结论一句话: 不用RNN/CNN,仅用Self-Attention(自注意力机制)+前馈网络 就能建模序列。
I Promise34
10 小时前
人工智能
·
深度学习
·
计算机视觉
BEV视角智驾方案业务需求分类与主流技术全解
本文以智驾实际业务场景为划分依据,将BEV方案分为六大核心方向,覆盖静态环境理解、动态目标感知、可行驶空间规划、4D占用预测、端到端一体化、轻量化量产部署等全链路需求,每个方向均标注主流方案、核心优化点、智驾价值、典型应用场景,形成业务导向的BEV技术选型手册,与前序BEV发展梳理、论文推荐形成完整技术体系。
带娃的IT创业者
12 小时前
人工智能
·
深度学习
·
transformer
·
脑机接口
·
nct
·
硅基生命
·
意识编码
预测编码=Decoder 训练?Friston 自由能的 Transformer 实现
NCT 技术博客专栏:《解码意识:NeuroConscious Transformer 深度解析》专栏定位:面向中高级 AI 工程师、神经网络研究者和脑机接口爱好者的技术专栏,从脑科学原理到硅基生命的意识计算框架
小雨中_
12 小时前
人工智能
·
深度学习
·
机器学习
·
自然语言处理
1.1 模型显存总体分析
在训练/推理大模型时,GPU 显存并不是“全部都给模型用”。一部分显存会被 AI 框架(如 PyTorch/CUDA runtime/通信库)占用,另一部分则由 系统/驱动 保留,用于上下文、内核态缓冲、显存页管理、ECC、显示/持久化守护进程等。因此,同一张 GPU 上“理论可用显存”和“实际可用显存”常常不一致。
Coding茶水间
13 小时前
开发语言
·
人工智能
·
深度学习
·
yolo
·
目标检测
·
机器学习
基于深度学习的鸡数量统计系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)
基于深度学习的鸡数量统计系统目录视频演示1. 前言2. 项目演示2.1 用户登录界面2.2 新用户注册
ppppppatrick
13 小时前
人工智能
·
深度学习
·
分类
【深度学习基础篇04】从回归到分类:图像分类与卷积神经网络入门
在“回归实战”章节中,我们已经掌握了全连接层 nn.Linear(A, B) 的核心用法——它能将维度为A的输入矩阵,映射到维度为B的隐藏特征空间;通过堆叠多层全连接层,还能加深网络深度、增强模型的拟合能力。同时,我们也吃透了梯度下降算法的落地逻辑:包括数据集读取、模型定义、训练流程的完整闭环,这是深度学习的通用基础,可总结为下图的核心流程:
带娃的IT创业者
13 小时前
人工智能
·
深度学习
·
神经网络
·
transformer
·
ai智能体
·
硅基生命
·
意识编程实现
STDP+Transformer:当局部可塑性遇见全局语义
NCT 技术博客专栏:《解码意识:NeuroConscious Transformer 深度解析》专栏定位:面向中高级 AI 工程师、神经网络研究者和脑机接口爱好者的技术专栏,从脑科学原理到硅基生命的意识计算框架
得一录
13 小时前
深度学习
·
aigc
AI Agent的主流设计模式之工具调用模式
LLM本质上是“静态”的,它的知识截止于训练数据,且无法直接与外部世界交互。工具调用就是为了解决LLM的三大核心局限:
小雨中_
13 小时前
人工智能
·
python
·
深度学习
·
机器学习
·
llama
4.1 Megatron-LM:千卡级集群预训练的“硬核”框架
Megatron-LM 是一个基于 PyTorch 的分布式训练框架,专门面向 Transformer 大语言模型(尤其是 GPT/LLaMA 类 decoder-only 架构)的超大规模训练。它在工程上追求“极致吞吐”,在千卡级甚至万卡级训练中,往往能取得非常强的性能与可扩展性。