深度学习

数智工坊1 小时前
人工智能·深度学习·机器人
具身智能人形机器人:从实验室走向现实的下一代通用智能体2025年8月,一场特殊的"奥运会"在中国拉开帷幕——参赛选手不是人类,而是一个个形态酷似人类的钢铁战士。它们在跑道上奔跑,在球场上传球,甚至在体操馆里完成高难度的空翻动作。这不是科幻电影,而是全球首个以人形机器人为主体的综合性体育盛会。
keineahnung23451 小时前
人工智能·pytorch·python·深度学习
PyTorch symbolic_shapes 模組的 is_contiguous 從哪來?── sizes_strides_user 安裝與實作解析在 PyTorch SymNode 為何找不到方法實作?──sizes_strides_methods 動態安裝機制解析 這篇文章中介紹了 _make_node_sizes_strides 函數,而在該函數內,又定義了 sizes_strides_impl 和 sizes_strides_user 函數。
大模型推理1 小时前
深度学习·自然语言处理·vllm
Nano-vLLM 源码解读 - 7. Continuous Batchingnano-vllm 用千行代码拆解 vLLM 核心,是读懂大模型推理最快的捷径。L02 把请求生命周期讲完了:一条序列从 add_request 进 WAITING、被调度后状态切到 RUNNING、生成结束转为 FINISHED。L02 还给出每个 step 的内部时间线——schedule 写入 num_scheduled_tokens,run 算 KV 与 logits,postprocess 把 num_scheduled_tokens 累加到 num_cached_tokens 上并将 num_
多年小白2 小时前
人工智能·深度学习·microsoft·ai
芯片/半导体/CPO光模块 深度分析报告报告生成时间:2026年5月16日 分析标的:芯片半导体板块 + CPO光模块产业链 龙头标的:中际旭创(300308)、天孚通信(300394)、新易盛(300502)、寒武纪(688256)、海光信息(688041) 数据来源:公开市场信息整理 ⚠️ 免责声明:本报告仅供参考,不构成任何投资建议。
初心未改HD2 小时前
人工智能·深度学习
深度学习之损失函数详解摘要: 损失函数(Loss Function)是深度学习模型训练的核心组成部分,它衡量模型预测值与真实值之间的差异,并为模型参数优化提供梯度方向。本文系统梳理了回归任务中的MSE、MAE、Huber Loss、Smooth L1 Loss,分类任务中的Binary Cross-Entropy、Categorical Cross-Entropy、Focal Loss,以及度量学习和生成对抗网络中的Triplet Loss、Contrastive Loss、对抗损失等特殊损失函数。文中提供完整的NumPy纯实
张二娃同学2 小时前
人工智能·python·深度学习·神经网络·学习
第12篇_深度学习学习路线总结深度学习入门专栏 · 第 12 篇 适合读者:已经阅读前两篇内容,希望继续系统学习深度学习核心方法与实践流程的初学者
aisifang003 小时前
人工智能·深度学习
GPT-Image2:高保真视频生成新突破在 2026 年,视频不再只是“更长的图片”,而更像一个对工程一致性提出更高要求的任务:要有连贯的画面内容、稳定的角色外观、可控的镜头运动,还要尽量降低闪烁、形变和细节漂移。也因此,视频序列的生成逐渐成为多模态应用的“下一座高峰”。KULAAI(dl.877ai.cn)
迪霸LZTXDY3 小时前
人工智能·深度学习·计算机视觉
U-Net 训练光纤识别U-NetU-Net和DeepLab系列是语义分割领域两种最经典的模型,各有侧重。简单来说:U-Net 以其对称的 U 型结构和跳跃连接见长,擅长精细分割,尤其适用于医学图像领域;而 DeepLab 系列则通过空洞卷积和ASPP模块,在多尺度特征提取和大场景语义理解上更具优势。
轻口味3 小时前
pytorch·深度学习·harmonyos
HarmonyOS 6.1 全栈实战录 - 13 流量增长新引擎:全场景归因与 App Linking 链接深度开发实战随着 HarmonyOS NEXT 走向全面商用,多端一体化(Phone、Tablet、PC、TV)的硬件协同已步入全新阶段。对企业开发者而言,应用的核心诉求不仅在于基础功能的稳定运行,更在于全场景、多设备维度下的精准用户增长、多端分发归因以及极速无缝体验。
RSTJ_16254 小时前
开发语言·人工智能·python·深度学习
PYTHON+AI LLM DAY FOURTY-SEVEN今天聊聊GitHub.GitHub是一个全球性的开放平台.不仅是一个代码托管平台,更像是一个云端代码库,云端图书馆,是程序员的交流社区.GitHub支持将你本地Git管理的代码同步到云端,实现代码共享和多人协作.GitHub 上内容丰富,形式多样,托管了全球超 4 亿个开源项目,涵盖前端、后端、AI、大数据等所有技术领域:Vue,React,Linux等知名框架,项目的源码都托管在GitHub上,支持免费下载下来学习.可将自己的项目或开源项目托管在GitHub上,并配上清晰的说明文档(README),方便
2zcode4 小时前
人工智能·深度学习
基于深度学习的智能职业匹配系统设计与实现摘要:随着就业市场的快速发展和职业选择的多样化,求职者面临着如何在海量职位信息中找到最匹配岗位的挑战。传统的职业推荐系统主要依赖关键词匹配和规则引擎,难以深入理解求职者技能与职位需求之间的语义关联。本文提出了一种基于Transformer架构的智能职业匹配系统,通过深度学习技术实现求职者与职位的精准匹配。
青春不败 177-3266-05204 小时前
人工智能·深度学习·机器学习·matlab·卷积神经网络·自编码器·deepseek
MATLAB 2024b深度学习新特性全面解析与DeepSeek大模型集成开发第一章:MATLAB 2024b深度学习工具箱新特性简介1、MATLAB Deep Learning Toolbox概览
初心未改HD5 小时前
人工智能·深度学习
深度学习之激活函数详解摘要: 激活函数是深度神经网络中最核心的组件之一,它为网络引入非线性表达能力,使得堆叠多层神经元成为可能。本文系统梳理了深度学习中常用的激活函数,包括 Sigmoid、Tanh、ReLU、Leaky ReLU、ELU、SeLU、Swish、Mish 以及 Softmax 等,从数学公式、输出特性、梯度分析、优缺点对比四个维度展开深入剖析,并结合 NumPy 实现完整的代码示例与可视化对比,最后给出针对不同场景的激活函数选择指南,助力读者在实战中做出合理决策。
爱写代码的小朋友5 小时前
人工智能·深度学习
人工智能背景下深度学习在高中信息技术教育中的应用研究摘要:在人工智能技术快速迭代与教育数字化转型的双重驱动下,高中信息技术教育正从“工具操作”向“素养培育”深度转型。深度学习作为人工智能的核心技术,不仅重塑了信息技术的发展格局,更为高中信息技术教育提供了全新的教学理念与实践路径。本文基于普通高中信息技术课程标准(2020修订版)要求,结合当前高中信息技术教育融入人工智能与深度学习的教学现状,剖析三者融合过程中存在的问题,探索深度学习在高中信息技术课堂教学、课程设计、评价体系中的应用策略,并结合教学案例验证其可行性,旨在为提升高中信息技术教育质量、培养学生核
knight_9___5 小时前
人工智能·python·深度学习·面试·agent·rag·mcp
大模型project面试5DPO 和 PPO 都是大模型对齐训练里的方法,都是在 SFT 之后让模型的输出更符合人类期望。PPO 是强化学习里的一个算法,在大模型里的用法是:先额外训练一个「奖励模型」来给模型的回答打分,然后用 PPO 这个 RL 算法不断调整大模型的参数,让它生成的内容往高分方向走。这套流程需要同时维护好几个模型,工程复杂度高,训练也容易不稳定,所以成本比较大。
东方佑5 小时前
人工智能·深度学习
OpenASH 85M 参数,不用 Softmax,也能通过中文考试一句话概括:OpenASH 是一个完全抛弃 Softmax 注意力的语言模型——核心运算只有 torch.cummax。在 85M 参数量级、C-EVAL 52 个科目的中文考试评测中,GRPO 强化学习版本取得 26.82% 的总体准确率,超越了同参数量级的 SFT 基线(23.11%)。
大江东去浪淘尽千古风流人物6 小时前
人工智能·深度学习·架构·spark·机器人·transformer·wm
【SANA-WM】分钟级世界模型:混合线性扩散Transformer与双分支相机控制深度解析SANA-WM,英伟达SANA系列新进展,2.6B开源世界模型,可以在单个GPU上将一张图像和一条相机轨迹转换为720p、时长一分钟、可控的视频,36倍更高吞吐
cskywit8 小时前
深度学习·yolo·目标检测
【BIBM2025】 MedMamba-YOLO:医疗目标检测,当 YOLO 遇见轻量级 Mamba医疗影像往往对比度低,微小病灶很容易与背景融为一体。经典的 YOLO 架构(如采用 PAFPN)在提取这类特征时容易丢失细节。而近期火热的 Mamba 虽然擅长长序列建模,但缺乏局部结构感知,且通常需要海量数据预训练。这篇发表于BIBM2025的工作:MedMamba-YOLO: A Vision State Space Model for Medical Image Detection ,基于 YOLOv8 进行重构,提出了 MedMamba-YOLO,在没有任何预训练(Training from sc
AI技术控8 小时前
人工智能·python·深度学习·语言模型·自然语言处理·prompt
Prompt Engineering 在企业大模型应用中的实践:从提示词模板到可控输出在大模型应用开发中,Prompt Engineering 是最容易被低估、也最容易被误解的部分。很多人认为提示词只是“把问题问清楚一点”,或者在系统提示词里写几句“你是一个专业助手”。这种方式做 Demo 可能够用,但一旦进入企业级场景,问题就会集中暴露: