pytorch

love530love18 小时前
人工智能·pytorch·windows·python·深度学习·机器学习·pynvml
根治 PyTorch CUDA `pynvml` 弃用警告:直接修改 `torch/cuda/__init__.py` 的实践记录【笔记】消除 “FutureWarning: The pynvml package is deprecated”警告
Kobebryant-Manba1 天前
pytorch·python·深度学习·conda·numpy
安装cuda深度学习环境配置——Windows安装CUDA与CUDNN_cudnn tarball-CSDN博客Windows11安装CUDA、cuDNN、PyTorch详解_win11 cuda安装-CSDN博客(强推)
盼小辉丶1 天前
pytorch·python·深度学习·强化学习
PyTorch强化学习实战(11)——N步DQN(N-step DQN)自从 DeepMind 在 2015 年提出深度Q网络 (Deep Q-Network, DQN) 模型以来,研究人员已经提出了诸多改进方案,通过对基础架构的调整显著提升了原始 DQN 的收敛性、稳定性和样本效率。 2017 年 DeepMind 的 Hessel 等人发表了名为 Rainbow: Combining improvements in deep reinforcement learning 的论文,系统性地整合了 DQN 的六大核心改进。仅通过这六种方法的组合,便在 Atari 游戏测试集上
星越华夏1 天前
pytorch·深度学习·yolo·分类
深度学习项目实战:基于PyTorch的图像分类与目标检测(YOLOv8)目标检测是计算机视觉领域的核心技术之一,广泛应用于自动驾驶、安防监控、工业检测、医疗诊断等领域。YOLO(You Only Look Once)系列算法因其高效性和准确性成为目标检测的主流方案。
imDwAaY1 天前
人工智能·pytorch·笔记·python·学习·机器学习
从感知机到 Attention:我用 PyTorch 打穿 CS188 机器学习终章 CS188 Proj5 学习笔记这一次的Proj有很多调用了Pytorch,需要耗费一些时间补充一下前置知识:tensor是PyTorch里的数据容器,它可以是数组可以是列表可以是矩阵。下面是三个tensor变量的声明
zlkingdom2 天前
人工智能·pytorch·conda·随笔·jetson orin
Jetson Orin开发板,在conda环境中直接实现Pytorch的GPU加速如果通过传统的pip方式安装,则必装出CPU的版本,如果想直接使用系统的默认配置的Pytorch+GPU方案,只需要两个步骤即可
月疯2 天前
人工智能·pytorch·python
PyTorch 中定义了一个 LeakyReLU 激活函数层LeakyReLU 是经典 ReLU 激活函数的改进版。ReLU:对于输入 x,输出 max(0, x),负数直接置为 0。
Y学院2 天前
人工智能·pytorch·深度学习
PyTorch深度学习框架核心概念精讲张量(Tensor):PyTorch 的核心数据结构,支持多维数组,并可以在 CPU 或 GPU 上进行加速计算。
zhangfeng11332 天前
人工智能·pytorch·机器学习
联邦学习 合并权重 合并权重。导致内存溢出解决办法和类库 mergekit 包依赖版本python merge_lora_adapters.py -d ./000-001/checkpoint-6200 002-003/checkpoint-4500/ ./004-005/checkpoint-6000/ ./006-007/checkpoint-6200/ -o ./merged
nashane2 天前
人工智能·pytorch·python
HarmonyOS 6学习:应用无响应(AppFreeze)故障排查与性能优化指南在HarmonyOS 6应用开发过程中,开发者最不愿见到却又时常遭遇的场景是:用户操作应用时(如点击按钮、滑动屏幕、按键),应用界面完全无反应,仿佛"冻结"了一般。持续等待约5秒后,应用进程被系统终止或弹出"应用无响应"提示框。这种故障不仅严重影响用户体验,更是应用质量的重要衡量指标。本文将深入剖析HarmonyOS 6中应用无响应(AppFreeze)故障的成因、检测机制,并提供从问题定位到性能优化的完整解决方案。
zhangfeng11333 天前
人工智能·pytorch·机器学习
超算/曙光DCU集群 昆山站 根目录文件夹逐项释义(HTC调度集群环境、国产DCU算力节点)目录是**服务器/超算根目录/**下挂载目录+系统原生目录混合,分为4大类:Linux系统标准目录、超算业务工程目录、NAS/存储挂载盘、用户&作业临时目录
zhangfeng11333 天前
人工智能·pytorch·python·机器学习
国家超算中心 htc 如果只有gpu资源 没有cpu资源 操作文件的时候会不会很卡呢若提交任务只申请GPU、不申请CPU核心,调度只分配零星CPU,文件读写瓶颈直接锁CPU。提交脚本同时申请:--cpus-per-task=4~8 --mem=16G --gres=gpu:1 32C整机共享机型,单任务拿4~8核是最优配比,预留CPU给IO。
zhangfeng11333 天前
人工智能·pytorch·python·机器学习·华为·开源
DeepSeek V4 适配华为昇腾950 难度及开源情况结合公开技术资料与官方披露信息,现将 DeepSeek V4 在华为昇腾950 推理卡的适配难点、源码公开情况进行客观、完整、合规梳理,内容无夸大、无负面导向,真实呈现国产软硬件适配技术现状。
承渊政道3 天前
人工智能·pytorch·python·深度学习·机器学习·语言模型·自然语言处理
【从零开始大模型开发与微调:基于PyTorch与ChatGLM】(新时代的曙光之大模型与人工智能)在人工智能快速演进的今天,大语言模型已经从前沿研究逐渐走向真实业务场景,成为智能问答、内容生成、代码辅助、知识库检索等应用的核心能力.然而,对于许多开发者而言,大模型依然像一个"黑箱":我们知道它强大,却不一定清楚它是如何构建、如何训练,又该如何针对具体任务进行高效微调.本文将以"从零开始"为主线,围绕大模型开发与微调的完整流程展开,结合 PyTorch 的灵活深度学习能力与 ChatGLM 的中文大模型实践基础,带你一步步理解大模型背后的关键技术.从模型结构、数据处理、训练流程,到参数高效微调、推理部署
lqjun08274 天前
人工智能·pytorch·python
PyTorch梯度计算我来详细介绍 PyTorch 的梯度计算和更新机制,并提供易于理解的示例。PyTorch 使用动态计算图来自动计算梯度。当你对张量进行操作时,PyTorch 会记录这些操作,然后反向传播时自动计算梯度。
花落yu4 天前
pytorch·python·深度学习
【无标题】很好,Python 3.8.5 完全够用(第一天不需要更高版本)。接下来继续第一天剩余的任务:在 base 环境里安装必需的库,并成功跑通第一个本地大模型。
扫地僧9854 天前
人工智能·pytorch·python
一个基于 PyTorch 手语翻译模型Xuanmen_NetXuanmen_Net 是一个基于 PyTorch 的先进手语翻译模型, 融合了最先进的mediapipe技术,提供高精度手语翻译能力。本项目不仅包含推理演示, 还提供完整的训练框架,用户可轻松自定义训练自己的手语翻译模型。
盼小辉丶4 天前
pytorch·深度学习·ios
PyTorch深度学习实战(56)——在iOS上构建PyTorch应用我们已经学习了如何使用 PyTorch Mobile 优化 MNIST 手写数字识别模型,并将优化后的模型部署到 Android 系统上。在本节中,我们将在 iOS 平台上重复了这一过程,开发一个 iOS 应用程序,用于对手写数字的摄像头拍摄图像进行分类识别。我们将复用 Android 应用开发环节中已优化的 MNIST 手写数字识别模型。
心中有国也有家4 天前
人工智能·pytorch·python·学习·numpy
GE图引擎深度解析——CANN的计算图优化与执行引擎你在Python里写了一行 loss.backward(),到NPU上真正执行时,中间发生了什么?答案是:CANN的GE(Graph Engine)会做「图编译」和「图优化」。这篇文章拆开GE的内部机制——从Python计算图到NPU可执行文件的全流程。
瑶总迷弟5 天前
pytorch·python·华为·语言模型·自然语言处理·cnn·unix
使用 mis-tei 在昇腾310P上部署 bge-m3模型BGE-M3 是 BAAI 推出的开源多语言通用嵌入模型,支持文本嵌入、相似度计算、检索重排等多种任务,凭借优异的多语言适配能力和精度表现,被广泛应用于 RAG 知识库、文本检索、语义匹配等 AI 场景。