pytorch

查无此人byebye16 小时前
人工智能·pytorch·python·深度学习·音视频
实战DDPM扩散模型:MNIST手写数字生成+FID分数计算(完整可运行版)扩散模型(Diffusion Model)作为当下生成式AI的核心技术,在图像生成领域展现出了惊人的效果。本文将从代码层面逐行拆解一个完整可运行的DDPM(Denoising Diffusion Probabilistic Models)实现,基于MNIST数据集完成手写数字生成,并集成FID(Fréchet Inception Distance)指标量化生成效果。
Suryxin.18 小时前
人工智能·pytorch·深度学习·vllm
从0开始复现nano-vllm「ModelRunner.capture_cudagraph()」为什么需要 CUDA Graph?在 LLM 推理等小算子、高频次的场景中,CPU 逐个调度任务的开销往往比 GPU 实际计算的时间还要长,导致 GPU 大量空闲等待;CUDA Graph 通过将一系列 GPU 操作“录制”为静态图,在执行时只需一次 CPU 指令即可驱动整个计算流程,从而彻底消除 CPU 调度瓶颈,填满 GPU 流水线,显著降低推理延迟。
宁远x1 天前
人工智能·pytorch·深度学习·云计算
【万字长文】PyTorch FSDP 设计解读与性能分析本文首先介绍了FSDP的原理和流程,包括参数分片策略、通算掩盖方式以及训练各阶段的执行逻辑。然后结合实验数据,对不同FSDP配置下的性能进行了分析和拆解,明确各个参数对训练速度和显存的影响。最后,简单介绍了FSDP2的原理和优势,并针对LORA训练这一优势场景,与FSDP进行了对比分析。本文不涉及源码的讲解,适合入门分布式训练。
何伯特1 天前
人工智能·pytorch·深度学习
PyTorch基本用法介绍:从零开始构建深度学习工作流2017年诞生的PyTorch,如今已是深度学习研究与工业部署的事实标准。它的成功并非偶然——动态计算图、Pythonic的编程范式、完整的生态工具链,让研究人员能够“像写NumPy一样写神经网络”。
All The Way North-1 天前
pytorch·rnn·深度学习·神经网络·lstm·序列模型·理论与工程
【LSTM系列·第三篇】单样本 vs Batch:LSTM全流程计算对比,彻底搞懂为何 h_t 与 c_t 维度必须相同由于字数限制,本篇是【LSTM系列】第三篇第一篇链接:【LSTM系列·第一篇】彻底搞懂:细胞状态、隐藏状态、候选状态、遗忘门——新手最晕的4个概念,一篇厘清 第二篇链接:【LSTM系列·第二篇】彻底搞懂输入门、输出门与LSTM全流程:维度分析+PyTorch工程实现
L念安dd2 天前
人工智能·pytorch·python
基于 PyTorch 的轻量推荐系统框架📖【项目地址】https://github.com/datawhalechina/torch-rechub
bst@微胖子2 天前
人工智能·pytorch·python
PyTorch深度学习框架项目合集一问题扩展:1、这里的x_train, y_train, x_valid, y_valid是怎么来的?总结:
骇城迷影2 天前
人工智能·pytorch·python·gpt·深度学习
从零复现GPT-2 124M本课程是Andrej Karpathy「0 to Hero」系列的核心章节,目标是从零复现GPT-2 124M参数模型——从加载OpenAI预训练权重验证模型正确性,到完全随机初始化参数、基于高质量数据集从零训练,最终实现性能对标甚至超越原版GPT-2。
zhangfeng11332 天前
人工智能·pytorch·语言模型·github
GitHub 知名博主 hiyouga 及其明星项目 LlamaFactory项目介绍 详细介绍在人工智能技术快速发展的今天,开源社区已成为推动大模型技术进步的重要力量。GitHub 作为全球最大的开源代码托管平台,汇聚了众多优秀的开发者和项目。本研究聚焦于 GitHub 知名博主 hiyouga 及其明星项目 LlamaFactory,旨在全面了解该博主的技术影响力,并深入分析其核心项目的技术价值。
查无此人byebye3 天前
人工智能·pytorch·深度学习·架构·cnn·音视频·transformer
从DDPM到DiT:扩散模型3大核心架构演进|CNN到Transformer的AIGC生成革命(附实操要点)🔥 前言:在AIGC生成领域,扩散模型早已成为绝对主流——从 Stable Diffusion 到 Sora,从图像生成到视频合成,背后都离不开三大核心技术的迭代支撑。DDPM 奠定理论基石,ContextUNet 实现可控生成,DiT 用Transformer掀起架构革命,三者串联起扩散模型从实验室走向工业化应用的完整路径。
love530love3 天前
c++·人工智能·pytorch·windows·python·cuda·bitnet
突破 Windows 编译禁区:BitNet 1-bit LLM 推理框架 GPU 加速部署编译 BitNet CUDA 算子全记录microsoft/BitNet:1位大型语言模型的官方推理框架微软开源的 BitNet 推理框架 代表了 1-bit 量化技术(1.58b)的工业级落地。然而,官方项目对 GPU 的支持主要侧重于 Linux 环境。在 Windows 11 下尝试编译其核心算子 bitlinear_cuda 时,开发者往往会撞上一堵由 MSVC 编译器、CUDA 13 兼容性和 PyTorch 底层头文件冲突构成的“技术墙”。
盼小辉丶3 天前
人工智能·pytorch·深度学习·模型部署
PyTorch实战(28)——PyTorch深度学习模型部署我们已系统性地探讨了如何使用 PyTorch 训练和测试各类机器学习模型。我们从 PyTorch 的基础组件入手,掌握了高效完成深度学习任务的必备工具;随后深入研究了基于 PyTorch 实现的多种深度学习模型架构及其应用场景。在本节中,我们将重点讨论如何将这些模型投入生产环境。简单来说,就是讨论将一个已经训练并测试过的模型对象部署到一个独立的环境中,使其能够对新输入数据进行预测或推理。这称为模型的生产化,即将模型部署到生产系统中。 本节我们将首先构建一个简易的 PyTorch 推理管道:通过输入数据和预
呆萌小新@渊洁4 天前
人工智能·pytorch·python·ai·语音识别
LoRA 与参数高效微调:低秩适配实战指南编辑~/.bashrc引入hf-mirror镜像编写完成后执行source ~/.bashrc重载文件
码行拾光4 天前
pytorch·windows·python
踩坑90分钟血泪复盘:Windows装PyTorch报DLL错误?根本原因是Python 3.12不兼容!适用人群:Windows 用户、Python 新手、深度学习入门者 核心结论:截至 2025 年中,PyTorch 官方尚未提供 Python 3.12 的预编译 wheel 包!强行使用将导致 DLL 初始化失败。 解决方案:创建 Python 3.11 虚拟环境 + pip 安装(配国内镜像)
骇城迷影4 天前
linux·服务器·pytorch·gpt·深度学习·神经网络
从零构建 GPT 分词器本文是 Andrej Karpathy 在「Let’s build the GPT Tokenizer」课程的学习总结,涵盖 Tokenization 的核心原理、BPE 算法实现、主流库对比、工程实践及前沿方向。
self-motivation4 天前
pytorch·yolo·tensorrt·π0.5·jetson thor
在jetson thor上高效部署π0.5和yolo模型有2种方法:其中方法2的难点是如何将tensorrt engine与pytorch流程结合起来, 如使用pytorch + action DIT engine或者使用pytorch + llm tensorrt engine + action DIT engine
Brian-coder4 天前
pytorch·vscode·python·深度学习·chatgpt
从零开始:本地开发部署智能体系统(显存≥8GB)本文介绍如何从零开始构建一个完整的 RAG(检索增强生成)智能体系统,使用 Qwen 系列模型、ChromaDB 向量数据库,完全不依赖 LangChain 等框架,实现文档检索、知识问答等核心功能。
穿过锁扣的风4 天前
人工智能·pytorch·python
零基础入门PyTorch:手把手实现MNIST手写数字识别(全程逐行解析)作为编程零基础的小白,入门深度学习最经典、最友好的案例,莫过于MNIST手写数字识别——它就像编程入门时的“Hello World”,无需复杂的数据采集和预处理,就能快速上手PyTorch核心用法,读懂深度学习的基本逻辑。今天,我们就从0开始,逐行解析完整代码,一步步实现“让电脑认识手写数字”的神奇效果,全程通俗易懂,哪怕你不懂编程、不懂深度学习,跟着走也能完全看懂。
勾股导航4 天前
人工智能·pytorch·python
PyTorch GPU版本安装1.根据自己GPU型号,安装GPU及cuDNNWin参考:Windows安装GPU环境-CSDN博客Ubuntu参考:Ubuntu 安装GPU环境-CSDN博客
退休钓鱼选手5 天前
人工智能·pytorch·python
[ Pytorch教程 ] TensorBaord类TensorBoard 是可视化工具,用于跟踪和可视化以下内容:标量可视化 - 损失、准确率等指标图像可视化 - 输入/输出图像、特征图