pytorch

程序猿追21 小时前
pytorch·华为·harmonyos
那个右下角的小数字怎么“卡”住我打字——我用 HarmonyOS 自己写了一个字数限制输入框发微博的时候,你有没有被那个右下角的数字制裁过?你正写得文思泉涌,突然“198 / 200”变成了“205 / 200”,那串数字变红了,输入框也像被施了咒一样,再多敲一个字都吞不进去。你只好停下来,回去删掉几个“的”字,把“哈哈哈哈”改成“笑死”,小心翼翼地把字数压回 200 以内。这个限制无处不在:微博 140 字(后来放宽了),短视频标题 50 字,短信 70 字,小程序简介 100 字……它们背后,其实都藏着同一个小逻辑:监听输入内容、计算字符数、比较上限、决定是否允许继续输入。
闵孚龙1 天前
人工智能·pytorch·python
《PyTorch 深度修炼》Dataset 和 DataLoader:数据如何喂给模型很多人刚学 PyTorch,会把数据加载理解成“读文件”。这个理解太浅。训练模型时,真正进入模型的不是图片路径,不是 JSON,不是数据库记录,而是整理好的 Batch Tensor。
IRevers1 天前
人工智能·pytorch·深度学习·大模型·datawhale·vllm·amdev
【大模型】Gemma4在ROCm和vLLM部署Gemma 4 是 Google DeepMind 于 2026 年 4 月推出的一系列最新、最强的开源大模型。它的定位非常明确:以极高的"参数效率"为核心,将强大的 AI 能力从云端带到你的手机、电脑等本地设备上。
装不满的克莱因瓶1 天前
人工智能·pytorch·python·深度学习·机器学习·分类·数据挖掘
了解多标签图像分类方法——从Sigmoid输出到真实世界复杂视觉理解目录一、前言二、多标签图像分类的本质(一)任务定义(二)示例(三)核心区别三、多标签分类与多类别分类的本质区别
bryant_meng1 天前
pytorch·vae·log-sigma2·重参数
【VAE】From Pixels to Faces: Building a VAE from Scratch从零实现 VAE:用变分自编码器生成人脸图像本文基于 PyTorch 实现一个完整的 Variational Autoencoder (VAE),在 CelebA 数据集上训练,实现人脸重建与生成。代码已添加详尽注释,适合作为理解生成模型的入门实践。
盼小辉丶1 天前
pytorch·python·深度学习·强化学习
PyTorch强化学习实战(14)——优先经验回放机制经验回放 (Experience Replay) 通过打破样本间的时序相关性,极大地稳定了训练过程,使深度Q网络 (Deep Q-Network, DQN) 能够从非平稳分布中高效学习。然而,传统经验回放采用均匀采样策略,对所有经验样本一视同仁,这引发了一个关键问题:是否所有经验都具有同等价值?2015 年,DeepMind 的研究团队发表了《Prioritized Experience Replay》,提出了一种全新的采样机制——优先级经验回放。该方法的核心是:强化学习算法可以从更重要、更有价值的经验中
冷小鱼1 天前
人工智能·pytorch·python·tensorflow
TensorFlow 2.21 进阶实战:从训练优化到生产部署的完整指南在2026年的深度学习框架格局中,TensorFlow与PyTorch形成了鲜明的分工:PyTorch以约85%的研究论文采用率主导学术界,而TensorFlow凭借37.51%的企业市场份额和25,099家公司的生产部署,依然是工业界最信赖的框架。TensorFlow 2.21.0的发布进一步巩固了其在生产部署、边缘计算和TPU训练领域的优势。
冷小鱼1 天前
人工智能·pytorch·深度学习
PyTorch 2.12 完全指南:从动态图到编译优化的深度学习框架演进PyTorch是一个开源的深度学习框架,由Meta(原Facebook)于2017年1月开源,2022年9月移交至Linux基金会旗下的PyTorch Foundation独立治理。其核心理念是 “定义即运行”(Define-by-Run) ——代码逐行执行,立即返回结果,完全像标准Python一样工作。这与早期TensorFlow的静态图模式形成鲜明对比,也是PyTorch在学术界迅速崛起的关键原因。
装不满的克莱因瓶1 天前
人工智能·pytorch·python·深度学习·目标检测·计算机视觉·目标跟踪
【工业领域】了解目标检测评估指标——从mAP到IoU的完整评价体系解析目录一、前言二、为什么目标检测不能只看Accuracy(一)分类任务 vs 检测任务分类任务目标检测任务
闵孚龙2 天前
人工智能·pytorch·python
动态图机制:为什么 PyTorch 调试起来更舒服前 5 章我们已经知道:Tensor 承载数据,Autograd 负责求导。现在把两件事连起来:当 Python 代码执行 Tensor 运算时,PyTorch 会边计算结果,边把反向传播需要的历史记录下来。
Kobebryant-Manba2 天前
pytorch·rnn·深度学习
RNN从0实现目录代码前置知识:epoch和训练集bacth关系*********:5隐藏层单元数(重要)顺序分区和随机采样区别(重要****)
闵孚龙2 天前
人工智能·pytorch·python
PyTorch 系列 之 nn.Module:所有模型的骨架写 PyTorch 模型,最终都会回到 nn.Module。它不是一个空壳父类。它是模型的总管:管参数、管子模块、管状态、管调用、管保存加载。
去伪存真2 天前
前端·pytorch·llm
如何将没有字幕的英文视频转换成中文视频?不管是学习还是娱乐,看视频时,难免会遇到一些没有中文字幕而自己又比较好奇讲了什么的英文视频,怎么办呢?今天教你一招,如何利用VideoLingo, 将没有字幕的英文视频转换成中文视频。先展示一下成果:
装不满的克莱因瓶2 天前
人工智能·pytorch·python·深度学习·机器学习·3d·ai
了解3D卷积原理——从空间感知到时空建模的深度学习核心算子目录一、前言二、什么是3D卷积(一)基本定义(二)一句话理解(三)适用数据三、2D卷积 vs 3D卷积
闵孚龙2 天前
人工智能·pytorch·python
《PyTorch 深度修炼》优化器:参数到底是怎么被更新的梯度不是参数更新。梯度只是方向,优化器才是真正踩油门的人。模型训练不是“算出 loss 就结束”。loss 只是告诉我们错了多少。
装不满的克莱因瓶2 天前
人工智能·pytorch·python·深度学习·神经网络·3d·cnn
掌握3D CNN模型结构——从时空特征建模到视频理解与医学影像核心架构目录一、前言二、什么是3D CNN(一)基本定义(二)核心目标(三)一句话理解三、3D CNN输入数据结构
2401_885665192 天前
人工智能·pytorch·深度学习·分类·cnn·迁移学习
从零搭建CNN到迁移学习:以食物分类为例深入理解PyTorch图像分类实战随着深度学习的快速发展,卷积神经网络(CNN)已成为计算机视觉领域的核心技术之一。从图像分类、目标检测到语义分割,CNN及其变体在各种任务中都展现出了卓越的性能。对于初学者而言,从零开始实现一个CNN模型并完成训练,是理解深度学习原理的重要途径;而对于实际应用,我们往往采用迁移学习(Transfer Learning)来利用在大规模数据集上预训练的模型,从而在小数据集上快速获得高性能的分类器。
没有钱的钱仔3 天前
人工智能·pytorch·python
pytorch_cuda安装使用nvidia-smi 测试是否存在显卡驱动显示如下上图中的CUDA Version :13.1 代表此电脑最大可以安装的cuda的版本,安装的cuda版本需要小于等于显示的版本
闵孚龙3 天前
人工智能·pytorch·python
Tensor:PyTorch 世界里的一切都是张量PyTorch 里,模型吃进去的是 Tensor,参数保存的是 Tensor,梯度也是 Tensor,GPU 上跑的还是 Tensor。
一条大祥脚3 天前
pytorch·moe
Tilelang-Metax|MoE|torch baseline这个比赛的github仓库,race_tests目录下有三个算子,拉取源码操作如下,记得切换分支这里来看看moe算子的实现思路