深度学习

好评笔记3 小时前
人工智能·深度学习·算法·机器学习·校招
机器学习面试八股——常用损失函数大家好,这里是好评笔记,公主号:Goodnote,专栏文章私信限时Free。本笔记介绍机器学习中常见的损失函数和代价函数,各函数的使用场景。
weixin_468466853 小时前
人工智能·python·深度学习·算法·自然语言处理·transformer·注意力机制
全局与局部注意力机制新手实战指南在处理长文本序列时,你是否遇到过模型“记不住”开头内容,或者对关键信息聚焦不准的情况?这往往是传统循环神经网络或基础注意力机制在长距离依赖建模上的局限所致。特别是在处理数千甚至上万 token 的文档、代码库或长篇对话时,如何让模型高效地捕捉全局语境,同时又不牺牲局部细节的精度,成为了许多开发者面临的实际痛点。
小糖学代码4 小时前
人工智能·python·深度学习·神经网络
LLM系列:环境搭建:5.Python-dotenv 环境变量管理在Python项目开发中,python-dotenv 是一个用于从 .env 文件读取键值对并将其加载到系统环境变量中的核心工具库。根据日常工程规范,其主要功能与应用场景总共可分为四大类:
voidmort5 小时前
python·深度学习·算法
3. 微调(Fine-tuning)与强化学习(RL)的核心思想在大模型后训练(Post-training)阶段,最核心的两种方法是:它们都能提升模型能力,但核心思想完全不同。
keyanbanyungong7 小时前
人工智能·深度学习
告别杂乱病历!临床科研AI工具实测做临床医生有多难?白天泡在门诊手术室,晚上挤时间做科研,对着电脑里几百上千份杂乱的病例文档发呆,应该是每个想发论文的临床研究者都懂的痛。
z小猫不吃鱼8 小时前
人工智能·深度学习·机器学习
13 Scaling Law 入门:模型规模、数据规模和计算量是什么关系?在前几篇文章中,我们沿着 GPT 路线依次讲了 GPT-1、GPT-2、GPT-3、In-Context Learning 和 Prompt Engineering。
知识浅谈9 小时前
人工智能·深度学习·transformer
Transformer 中的 Q、K、V 到底是什么?怎么理解 Query、Key、Value?在学习 Transformer 的时候,很多人都会遇到三个非常关键的变量:Q、K、V。它们分别是:这三个变量是 Self-Attention(自注意力机制)的核心。理解了 Q、K、V,就更容易理解 Transformer 为什么能够根据上下文动态判断“应该关注哪些词”。
人工智能培训10 小时前
人工智能·深度学习·神经网络·机器学习·生成对抗网络
设备故障?数字孪生提前预警
weixin_4684668511 小时前
大数据·人工智能·深度学习·ai·大模型·智能交互·自动应答
千问大模型在阿里生态中的实战应用指南在日常的企业运营和技术落地过程中,我们常常面临这样一个困境:业务场景极其丰富,从客服接待到营销推广,从代码重构到数据洞察,每个环节都堆积着大量重复性高、耗时长的任务。团队往往陷入“救火”状态,疲于应付琐碎流程,却难以抽出精力去优化核心逻辑或创新业务模式。随着大语言模型技术的成熟,这种局面正在发生根本性的转变。它不再仅仅是一个聊天机器人,而是逐渐演变为能够深入具体业务流、理解上下文语境并执行复杂指令的智能助手。
wangqiaowq11 小时前
人工智能·深度学习·机器学习
预训练 后预训练 微调Post-pretrain(后预训练)是大模型训练流程中的一个关键阶段,位于**通用预训练(Pre-training)**之后、**微调(Fine-tuning)**之前,起到连接"通才"与"专才"的桥梁作用。
lqqjuly12 小时前
人工智能·深度学习·算法
知识蒸馏:理论、算法与可运行实现在前两篇文档中,我们分别讨论了量化和剪枝。知识蒸馏是模型压缩的第三大范式:知识蒸馏(Knowledge Distillation, KD)(Hinton et al., 2015)的核心思想是:用一个大的教师模型(Teacher) 来指导一个小的学生模型(Student) 训练,使学生模型学习到教师模型的"知识"。
Rocky Ding*12 小时前
论文阅读·人工智能·深度学习·机器学习·ai作画·aigc·ai-native
一文读懂HiDream-I1稀疏 DiT 图像生成基础模型【WeThinkIn出品】栏目专注于分享Rocky的认知思考与经验感悟,范围涵盖但不限于AI行业。欢迎大家关注Rocky的知乎:Rocky Ding AIGC算法工程师/开发工程师面试面经秘籍分享:WeThinkIn/Interview-for-Algorithm-Engineer欢迎大家Star~
weixin_4296302613 小时前
人工智能·深度学习·神经网络
3.46 基于改进孪生神经网络的手机摄影视觉定位本文针对智能手机单目相机室内视觉定位存在的耗时高、易受环境干扰、匹配鲁棒性差、精定位误差大等问题,提出一套低开销、高鲁棒的 2D–2D 室内定位方案:通过改进孪生神经网络(Siamese Neural Network,SNN) 实现图像相似度度量与粗定位,大幅降低样本标注工作量并适配多类别少样本场景;结合自适应 EightPoint‑RANSAC 算法优化基础矩阵、剔除匹配野值,完成相机位姿解算与精定位;实验在走廊与办公室场景实现平均定位误差 0.50m,较传统方法精度最高提升44.32%。
憨波个15 小时前
人工智能·深度学习·transformer·语音识别
【语音识别】Conformer: Convolution-augmented Transformer for Speech Recognition本文是阅读论文《Conformer: Convolution-augmented Transformer for Speech Recognition》[1] 的笔记。Transformer 的自注意力能建模长程依赖,但对局部结构(如频谱的连续帧)建模能力一般。CNN 擅长局部建模,但感受野有限,长程依赖要靠堆叠很多层。所以 Conformer(Convolution + Transformer) 把两者结合,用 Transformer 做全局建模,用卷积做局部建模,从而更适配语音信号的时间局部性和长程依
动物园猫15 小时前
深度学习·yolo·分类
睡岗检测数据集分享(适用于YOLO系列深度学习分类检测任务)链接:https://pan.baidu.com/s/1MM22lYUS9a-wfiJ89qJ7jA?pwd=xdp1
大模型最新论文速读16 小时前
论文阅读·人工智能·深度学习·机器学习·自然语言处理
05-29 · LLM 最新论文速览今日候选池 97 篇,硬过滤 + LLM 打分后通过评估 19 篇,精选 Top-10,另列 9 篇速览。
杀生丸学AI16 小时前
人工智能·深度学习·3d·三维重建·高斯泼溅·动态重建·镜面反射
【三维重建】RT-Splatting:基于3DGS的联合反射-透射建模(CVPR 2026)标题:《RT-Splatting: Joint Reflection-Transmission Modeling with Gaussian Splatting》 链接:https://sjj118.github.io/RT-Splatting 来源:北京大学智能科学与技术学院;通用人工智能国家重点实验室
weixin_4684668516 小时前
人工智能·深度学习·ai·分类·数据挖掘·图像分类·模型部署
图像分类技术落地应用与实战指南在电商大促期间,面对海量新增 SKU,运营团队往往需要耗费数天时间手动分类商品属性并上架,不仅效率低下,还容易出现归类错误导致流量流失。而在医疗领域,放射科医生每天要审阅成百上千张影像片子,长时间的高强度工作难免产生视觉疲劳,细微的病灶极易被漏诊。这些看似截然不同的行业痛点,背后其实都指向同一个技术突破口:利用计算机视觉与深度学习技术,让机器具备“看”和“判断”的能力。
MediaTea16 小时前
人工智能·深度学习
人工智能通识课:深度学习深度学习(Deep Learning)是机器学习的重要分支,也是当前人工智能中最具代表性的技术路线之一。它以多层神经网络为核心,通过大量数据训练模型,使模型能够自动学习数据中的特征表示,并完成识别、预测、理解、生成和决策等复杂任务。