技术栈
深度学习
ppppppatrick
23 分钟前
人工智能
·
深度学习
【深度学习基础篇03】激活函数详解:从生物突触到非线性注入
在上一章中,我们已经知道,如果没有激活函数,无论神经网络堆叠多少层,它最终都只是一个线性模型,无法拟合复杂的非线性规律。这一章,我们将从生物神经元的工作机制出发,揭开激活函数的神秘面纱,理解它如何为神经网络注入“灵魂”,并通过代码直观感受它的作用。
Figo_Cheung
44 分钟前
人工智能
·
深度学习
·
几何学
Figo《量子几何学:从希尔伯特空间到全息时空的统一理论体系》(三)
作者:Figo Cheung & Figo AI team人类大脑对几何概念的理解,根植于顶叶皮层的空间处理能力。正如《内经》所言:“脑为髓海,主神明”,现代神经科学发现,顶叶正是人类空间认知的"神明"之所。 顶叶空间处理的几何特征: 顶叶皮层,特别是顶内沟(intraparietal sulcus)区域,在处理几何空间信息时表现出独特的神经活动模式。功能性磁共振成像(fMRI)研究表明,当被试进行几何推理时,顶叶皮层的激活模式与几何复杂度呈正相关。 数学表述上,顶叶对几何信息的处理可以建模为: P:Rn
yunhuibin
2 小时前
人工智能
·
python
·
深度学习
·
神经网络
·
学习
NIN网络学习
NIN(Network in Network)是陈天奇(Min Lin)等人在2014年提出的经典网络结构。
隔壁大炮
2 小时前
人工智能
·
深度学习
03.深度学习——特点
1、多层非线性变换:深度学习模型由多个层次组成,每一层都应用非线性激活函数对输入数据进行变换。较低的层级通常捕捉到简单的特征(如边缘、颜色等),而更高的层级则可以识别更复杂的模式(如物体或面部识别)。
Hcoco_me
3 小时前
人工智能
·
深度学习
·
数码相机
·
算法
·
机器学习
·
自动驾驶
车载摄像头核心知识点结构化总结
车载摄像头是自动驾驶最核心、不可替代的感知传感器,当前所有主流自动驾驶方案均无去摄像头的设计,仅存在去激光雷达/毫米波雷达的方案。
沪漂阿龙
3 小时前
人工智能
·
深度学习
·
transformer
LLM底层机制深度解析:从Transformer到推理优化的完整技术地图
导读:当你调用API或使用大模型时,你是否好奇过——模型内部究竟是如何工作的?为什么同样的输入,有时候快有时候慢?上下文窗口到底受什么限制?采样参数Temperature和Top-p又有什么区别?本文将带你深入LLM的底层机制,从Transformer架构到推理优化,从Tokenization到对齐技术,全面解析大模型的核心原理。无论你是AI应用开发者,还是想深入理解LLM的技术爱好者,这篇文章都能帮你建立起完整的知识框架。
袁气满满~_~
4 小时前
人工智能
·
深度学习
深度学习笔记五
目录一、卷积神经网络1、卷积运算1.1 边缘检测1.2 其他边缘检测器2、填充3、卷积步长4、互相关与卷积
光的方向_
4 小时前
人工智能
·
深度学习
·
transformer
02-Transformer核心架构详解-自注意力与多头注意力
本文深度剖析Transformer的核心机制——自注意力(Self-Attention)和多头注意力(Multi-Head Attention)。通过数学推导、可视化图表和PyTorch代码实现,详细讲解QKV矩阵计算、注意力分数、缩放点积注意力等关键技术。涵盖Transformer Block完整结构、残差连接、层归一化等工程实践要点,是理解现代大语言模型架构的必读教程。
万里鹏程转瞬至
4 小时前
论文阅读
·
深度学习
·
aigc
论文简读 | TurboDiffusion: Accelerating Video Diffusion Models by 100–200 Times
论文地址:https://jt-zhang.github.io/files/TurboDiffusion_Technical_Report.pdf 项目地址:https://github.com/thu-ml/TurboDiffusion 发表时间:2025年12月18日 内容由豆包ai总结
万里鹏程转瞬至
5 小时前
深度学习
·
aigc
SLA与Flash_attn对比测试
项目地址:https://github.com/thu-ml/SLA 项目下有SageSLA与sparse_linear_attention两个版本,SageSLA是基于SageAttention实现的版本,sparse_linear_attention是基于triton实现的版本。
yuzhuanhei
6 小时前
人工智能
·
深度学习
基于Claude Code实现MobileNetV3训练记录
MobileNetV3于2019年问世,是目前移动端实时视觉任务的首选,追求极致性价比。在同精度下,V3 比 V2 快约 20%~30%,参数量更小。MobileNetV1V2的原理介绍不再赘述。
LaughingZhu
6 小时前
人工智能
·
经验分享
·
深度学习
·
神经网络
·
产品运营
Product Hunt 每日热榜 | 2026-02-22
标语:适合iOS应用的最佳人工智能。替代Xcode的网站。介绍:最先进的人工智能应用构建工具。设计优越,支持每一个苹果平台——无论是 iPhone、iPad、Apple Watch、Apple TV、Vision Pro 还是 iMessage。如果你的设备能做到,Rork Max 就能帮你构建——3D游戏、增强现实、身体追踪、实时活动、Siri 意图、应用小部件等等。它是网络上首个 Swift 应用构建器。只需一键即可在你的 iPhone 上安装,轻松两次点击即可进入 App Store。
Niuguangshuo
7 小时前
人工智能
·
深度学习
深度学习:激活函数大全
在深度学习中,激活函数(Activation Function)是神经网络的核心组件之一。如果没有激活函数,无论网络堆叠多少层,都只是线性变换的叠加,最终输出仍是输入的线性组合。 这种线性模型连最简单的“异或(XOR)”问题都无法解决,更别说学习图像、语音、文本等复杂数据中的非线性模式。
weixin_44811994
7 小时前
笔记
·
深度学习
Datawhale Easy-Vibe 202602 第4次笔记
Endpoint(接口路径):API 请求的具体路径,告诉服务器你要访问哪个功能。完整的请求地址通常由"基础 URL + Endpoint路径"构成。例如:
小雨中_
8 小时前
人工智能
·
深度学习
·
机器学习
·
分类
·
数据挖掘
·
palm
2.1 PaLM 及其变体(PaLM / PaLM 2)
PaLM(Pathways Language Model)是 Google 提出的 Decoder-only Transformer 大规模语言模型工作之一。它的核心并不在于“换了一个全新的架构”,而是通过一组看似朴素但系统性的结构与训练配方改动,让模型在 可扩展性、训练稳定性、吞吐效率 上更适合继续做大规模 scaling。
yunhuibin
8 小时前
人工智能
·
python
·
深度学习
·
神经网络
LeNet、AlexNet、VGGNet、NiN总结
从AlexNet再次引爆深度学习后,各种神经网络结构不断实验探索出来,被实验证明有效果后,该结构就成为了后续神经网络结构的基本组件或者基类——浓缩为了经验,上升为了精华。
忙碌544
9 小时前
人工智能
·
深度学习
2026年大语言模型微调实战:从零到一构建专属AI助手
在人工智能技术飞速发展的2026年,大语言模型(LLM)已经从实验室走向了各行各业的应用场景。然而,通用大模型虽然能力强大,却往往难以满足特定领域的专业需求。这时,模型微调(Fine-tuning)技术就成为了连接通用能力与专业需求的关键桥梁。
沃达德软件
9 小时前
图像处理
·
人工智能
·
深度学习
·
目标检测
·
计算机视觉
·
数据挖掘
·
数据分析
视频监控数据分析服务
视频监控数据分析服务,包括实时预览录像抓图、远程回放(录像)、远程回放(图片)、报警布防、报警监听、人脸比对、人脸抓拍、人脸侦测、混合目标检测、人体目标识别、人员密度检测、人员排队检测、客流量统计、安全帽检测。视频监控数据分析是应用广泛的安防系统,包括图像的实时监控、视频存储与取证、人员与行为的智能分析识别,并与其他子系统紧密结合,如入侵报警系统、门禁控制系统,构建严密的安全防范系统工程。 #视频监控#视频分析#视频图像识别#安防监控
小雨中_
9 小时前
人工智能
·
python
·
深度学习
·
机器学习
·
自然语言处理
·
llama
4.1 LLaMA 系列:从 LLaMA-1 到 LLaMA-3
本节围绕 LLaMA 系列的三条主线展开:(1)基础架构与训练配方的关键选择;(2)从 LLaMA-2 开始成体系的后训练(SFT / 拒绝采样 / RLHF / DPO);(3)面向代码与长上下文的扩展(Code Llama、LLaMA-3/3.1)。 讨论默认以论文与技术报告中的描述为准,并配合必要的直观案例帮助理解。
扫地僧985
9 小时前
深度学习
课堂情绪识别系统技术实现
好的,我将为您撰写一篇关于课堂情绪识别与心理健康监测系统的论文,详细阐述其技术原理、实现步骤与代码流程。