技术栈
pytorch
闻道且行之
5 小时前
人工智能
·
pytorch
·
深度学习
PyTorch 深度学习开发 常见疑难报错与解决方案汇总
本文旨在系统记录使用 PyTorch 进行深度学习开发过程中遇到的各类疑难报错与异常问题,详细梳理报错现象、排查思路及最终解决方案。一方面是为了复盘问题解决过程,沉淀技术经验;另一方面也能避免后续再次遇到同类问题时重复踩坑,提升开发效率。
Dxy1239310216
8 小时前
人工智能
·
pytorch
·
深度学习
深度学习的优雅收尾:PyTorch中PolynomialLR的终极指南
在深度学习这场漫长的马拉松中,学习率(Learning Rate)不仅是起步时的爆发力,更是冲刺阶段的耐力。如果说初始学习率决定了模型能否跑起来,那么学习率调度器(Scheduler)则决定了模型能否在终点线前精准撞线。
chushiyunen
10 小时前
人工智能
·
pytorch
·
python
pycharm打包whl
用一个例子来说明,例如打包一个加法工具。 1、新建一个项目,名称为:my_math_lib 2、创建文件夹my_math (1)该文件夹下创建一个python文件,名为:__init__.py,内容如下:
墨染天姬
10 小时前
人工智能
·
pytorch
·
python
【AI】PyTorch 框架
基于 动态计算图(Dynamic Computation Graph) 的核心范式,以下是 PyTorch 的底层原理框架,与 TensorFlow 的"静态图+延迟执行"形成鲜明对比:
小班得瑞
11 小时前
pytorch
pytorch使用小结
Embedding其实是构造了一个巨大的张量表,对于输入tensor某个位置的标量,在Embedding表中查表进行赋值:
Fleshy数模
11 小时前
pytorch
·
分类
·
cnn
基于PyTorch实现食物图像分类:从数据加载到CNN训练全流程
在计算机视觉领域,图像分类是经典且基础的任务,而食物图像分类因应用场景广泛(如饮食推荐、营养分析等)成为热门方向。本文将基于PyTorch框架,完整实现从自定义数据集加载、数据预处理,到CNN模型构建与训练的食物图像分类全流程。
盼小辉丶
13 小时前
人工智能
·
pytorch
·
深度学习
PyTorch实战(35)——使用PyTorch Profiler分析模型推理性能
我们已经介绍了 PyTorch 深度学习原型库 fastai 和 PyTorch Lightning,虽然这些库能极大提升开发效率,但其抽象化设计会隐藏底层实现细节。当涉及定制化研究流程时(例如需要实现原型库未内置的自定义损失函数),仍需调整底层代码。在下一节中,我们将通过剖析 PyTorch 模型推理代码,实时监控硬件资源(包括 CPU/GPU 算力及内存)的消耗情况。
Dxy1239310216
13 小时前
人工智能
·
pytorch
·
深度学习
深度学习的优雅降温:PyTorch中CosineAnnealingLR的终极指南
在深度学习这场高维空间的探险中,学习率(Learning Rate)不仅是起步的油门,更是过弯时的刹车。如果说SGD是引擎,那么学习率调度器就是那位决定何时加速、何时减速的金牌领航员。
研究点啥好呢
13 小时前
人工智能
·
pytorch
·
神经网络
·
百度
·
ai
·
面试
·
文心一言
百度 人工智能工程师面试题精选
百度是中国领先的人工智能公司,拥有百度搜索、百度大脑、文心一言、Apollo自动驾驶等核心产品。技术栈以Python、C++为主,深度学习框架包括PyTorch、TensorFlow和自研的PaddlePaddle。面试风格重视算法基础、机器学习理论深度和工程实践能力,常考机器学习原理、深度学习模型、数学基础和实际项目经验。百度AI研究院在自然语言处理、计算机视觉、自动驾驶等领域有深厚积累。
行走__Wz
1 天前
pytorch
·
深度学习
·
线性回归
【刘二大人】《PyTorch深度学习实践》——PyTorch实现线性回归代码(自用)
步骤:(1)准备数据集(2)定义线性模型(3)选择损失函数和优化器(4)训练循环(i)先进行前向传播,计算y估计和loss函数
查无此人byebye
1 天前
pytorch
·
深度学习
·
transformer
【保姆级教程】从零实现模块化Transformer对话生成模型(PyTorch完整代码)
Transformer作为NLP领域的里程碑模型,其核心的自注意力机制彻底改变了序列建模的方式。本文将通过一个对话生成模型的完整案例,从零拆解Transformer的模块化实现过程,包括Embedding、位置编码、多头注意力、编码器/解码器层等核心组件,并基于PyTorch完成从数据处理、分词器训练到模型训练的全流程。
红茶川
1 天前
人工智能
·
pytorch
·
ai
·
端侧ai
[ExecuTorch 系列] 2. 导出官方支持的大语言模型
确保已经安装了 ExecuTorch。安装教程:[ExecuTorch 系列] 1. 从源码构建 ExecuTorch
shy^-^cky
1 天前
pytorch
·
深度学习
·
tensorflow
·
paddlepaddle
·
飞桨
TensorFlow、PyTorch、PaddlePaddle 三大深度学习框架全维度对比表
本文整合五大核心维度(基础信息、核心特性、部署能力、性能表现、生态社区),以表格形式清晰呈现三大框架差异,精准适配选型需求,数据来自官方实测及CSDN行业评测(2025-2026年),仅供参考。
兜兜风d'
1 天前
人工智能
·
pytorch
·
深度学习
PyTorch深度学习实践——卷积神经网络高级篇
学习笔记|B 站 UP 主 刘二大人 《PyTorch深度学习实践》视频知识点总结 附上源代码 传送门 PyTorch深度学习实践——卷积神经网络高级篇
zhangfeng1133
1 天前
人工智能
·
pytorch
unsloth 安装的时候会 自动升级torch版本,解决办法
或者
Narrastory
1 天前
人工智能
·
pytorch
·
深度学习
明日香 - Pytorch 快速入门保姆级教程(五)
2026.03 | ming在二分类问题中(比如判断一封邮件是否为垃圾邮件、一张图片中是否包含猫),我们通常希望模型输出一个概率值,表示样本属于正类的可能性。最常用的做法是在模型最后加上一个Sigmoid层,将输出压缩到0到1之间,然后使用二分类交叉熵作为损失函数。然而,直接串联Sigmoid和交叉熵在数值计算上可能存在不稳定性。在实际中我们也不会这么组合使用。
Dxy1239310216
2 天前
人工智能
·
pytorch
·
学习
PyTorch的MultiStepLR详细介绍:精准掌控学习率的“手术刀”
在深度学习的浩瀚征途中,学习率(Learning Rate)无疑是那颗最难掌控的“心脏”。太大则模型震荡不收敛,太小则陷入局部最优或蜗牛般爬行。而在众多动态调整学习率的策略中,MultiStepLR 犹如一把精准的手术刀,允许我们在训练的特定节点“快准狠”地切下,让模型在关键时刻完成蜕变。
如若123
2 天前
人工智能
·
pytorch
·
python
flash-attn 安装失败?从报错到成功的完整排雷指南(CUDA 12.8 + PyTorch 2.7)
以下是整理好的 CSDN 博客内容:标题:【踩坑实录】在远程 GPU 服务器上安装 flash-attn:从环境配置到百度网盘下载的完整解决方案
love530love
2 天前
人工智能
·
pytorch
·
windows
·
python
·
深度学习
·
comfyui
·
vllm
Windows 11 源码编译 vLLM 0.16 完全指南(CUDA 12.6 / PyTorch 2.7.1+cu126)
本文是上篇 vLLM Windows cu128 编译指南 的复盘版本。上篇使用 CUDA 12.8 编译,本篇使用 CUDA 12.6 重新编译,与 PyTorch 2.7.1+cu126 完全匹配。同时修正了上篇中 subst 映射用途的描述,并给出更清晰的一键恢复脚本。
兜兜风d'
2 天前
人工智能
·
pytorch
·
深度学习
PyTorch 深度学习实践——加载数据集
学习笔记|B 站 UP 主 刘二大人 《PyTorch深度学习实践》视频知识点总结 结尾附上老师代码 传送门 PyTorch深度学习实践——加载数据集