pytorch

没有钱的钱仔1 小时前
人工智能·pytorch·python
pytorch_cuda安装使用nvidia-smi 测试是否存在显卡驱动显示如下上图中的CUDA Version :13.1 代表此电脑最大可以安装的cuda的版本,安装的cuda版本需要小于等于显示的版本
闵孚龙3 小时前
人工智能·pytorch·python
Tensor:PyTorch 世界里的一切都是张量PyTorch 里,模型吃进去的是 Tensor,参数保存的是 Tensor,梯度也是 Tensor,GPU 上跑的还是 Tensor。
一条大祥脚4 小时前
pytorch·moe
Tilelang-Metax|MoE|torch baseline这个比赛的github仓库,race_tests目录下有三个算子,拉取源码操作如下,记得切换分支这里来看看moe算子的实现思路
SilentSamsara5 小时前
人工智能·pytorch·python·深度学习·机器学习·fastapi
模型部署实战:FastAPI + ONNX + Docker 的推理服务化Notebook 里的 model.predict(X) 跑完就算完——但生产环境需要的是毫秒级响应、模型热加载、A/B 测试、灰度发布。把模型从实验环境搬到线上,需要完成序列化选型、推理加速、服务封装、容器化部署、负载均衡这一整条工程链路。本文以 scikit-learn 模型为主线,完整演示从 .pkl 到 ONNX 再到 FastAPI + Docker 的生产级部署方案。
闵孚龙6 小时前
人工智能·pytorch·python
Autograd 自动求导:PyTorch 训练模型的发动机写 PyTorch 的人,最常见的一句代码是 loss.backward()。看起来很短。但它背后不是一个函数那么简单,而是一整套动态计算图系统。
云和数据.ChenGuang6 小时前
数据库·人工智能·pytorch·深度学习·numpy
大模型厂商常用的数据库有哪些?分关系库、向量库、数仓/日志、文件/对象、时序、缓存六大类,标注每家真实落地选型TDengine、InfluxDB、Prometheus 监控GPU显存、推理QPS、token速度、任务排队时长、集群故障指标
努力写A题的小菜鸡6 小时前
人工智能·pytorch·cnn
PyTorch 搭建卷积神经网络:常规写法 vs Sequential 写法详解在 PyTorch 中搭建卷积神经网络(CNN),最常见的两种实现方式是常规逐层定义法和 **nn.Sequential 堆叠法 **。本文将以 CIFAR10 分类任务的经典网络为例,详细讲解两种写法的实现、差异、优缺点及适用场景,附完整可运行代码与注释,方便直接复现与学习。
装不满的克莱因瓶19 小时前
人工智能·pytorch·python·深度学习·学习·机器学习·自动驾驶
【自动驾驶领域】学习 Cityscapes 数据集——城市街景语义理解的标准基准目录一、前言二、Cityscapes数据集是什么(一)基本定义(二)核心任务(三)数据来源三、数据集规模
星浩AI21 小时前
pytorch·后端·llm
合规项目大模型如何部署?硬件选型 + vLLM/LMDeploy 实战如果你正接手一个合规项目——数据不能出域、访问要能审计、服务要能自己运维,大模型在内网落地——下面这些事,是不是也让你头疼过:
努力写A题的小菜鸡1 天前
人工智能·pytorch·python
01-PyTorch加载数据初认识(dataset运用)这是一个标准的 PyTorch 自定义数据集模板,核心分为 3 个部分:python运行python运行
HKkuaidou1 天前
pytorch·python·深度学习·resnet
基于深度学习的药用草本植物识别系统使用 ResNet50 + 迁移学习实现 98 类药用植物的高精度自动识别,Top-1 准确率 95.07%,Top-5 准确率 99.26% 如果需要全部的代码以及相关过程图与结果图,可以私信与我联系
盼小辉丶1 天前
pytorch·深度学习·强化学习
PyTorch强化学习实战(13)——噪声网络(NoisyNet-DQN)在深度强化学习中,探索与利用的权衡一直是一个核心难题。传统的探索策略,如经典的 ε-greedy 或熵正则化,本质上都是在动作空间中添加随机扰动。这种方法虽然简单,但却存在一个根本性问题:每一步的动作扰动都是独立的、无状态的,难以产生持续、连贯的探索行为,尤其在需要多步协调才能发现奖励的稀疏奖励环境中,这种“抖动式”探索往往效率低下。2018 年,DeepMind 研究团队提出了一种全新的探索范式——NoisyNet。该方法将可学习的参数化噪声直接注入神经网络的权重中,使智能体能够在策略空间中实现状态依赖
承渊政道1 天前
人工智能·pytorch·深度学习·机器学习·语言模型·自然语言处理·pycharm
【从零开始大模型开发与微调:基于PyTorch与ChatGLM】(从环境搭建到第一个训练闭环:PyTorch2.0深度学习入门实战)大模型正在成为人工智能应用开发的核心基础能力.从智能问答、代码助手,到企业知识库、智能客服和垂直领域应用,越来越多的场景都离不开大模型的理解、生成与推理能力.对于开发者来说,仅仅会调用现成的大模型接口已经远远不够,理解大模型的开发流程、掌握微调方法,并能够亲手完成一个从环境搭建到训练验证的闭环,正在变成一项非常重要的工程能力.不过,对于刚开始接触大模型开发的同学来说,这条路往往并不轻松.PyTorch、Transformers、ChatGLM、显存配置、数据格式、模型加载、训练参数、微调策略……这些概念单
pythonpioneer2 天前
pytorch·深度学习·其他·3d
PyTorch3D:基于 PyTorch 的高效 3D 深度学习工具库Facebook AI Research 开源的 PyTorch3D 在 GitHub 上积累了近万 Star,它为 3D 计算机视觉研究提供了一套高效、可复用的组件。
python-码博士2 天前
人工智能·pytorch·python
PyTorch 从零实现 Flow Matching:训练、采样、画图一条龙关键词:PyTorch、VelocityNet、Euler Sampler、minibatch OT、训练日志 目标:不讲大段文献,直接把一个能跑通的 Flow Matching 训练流程拆开
努力写A题的小菜鸡2 天前
人工智能·pytorch·学习
PyTorch 图像预处理 transforms 与 TensorBoard 可视化 (自己学习记录)本文基于 PyTorch 框架,详细讲解 torchvision.transforms 图像预处理工具、TensorBoard 可视化、Compose 组合操作以及 CIFAR10 官方数据集加载,附带逐行代码解析、原理说明、路径规则、常见坑点,适合零基础入门、后期复习查阅。
装不满的克莱因瓶2 天前
人工智能·pytorch·python·深度学习·ai·自然语言处理
自然语言处理常见任务——从文本理解到生成式AI的完整任务体系目录一、前言二、NLP任务整体分类三、文本分类任务(Text Classification)(一)任务定义
装不满的克莱因瓶2 天前
人工智能·pytorch·python·深度学习·ai·自然语言处理
自然语言处理中的分词——从语言切分到模型输入的第一步目录一、前言二、什么是分词(一)基本定义(二)一句话理解(三)示例三、分词的核心作用(一)模型输入标准化
All The Way North-2 天前
pytorch·深度学习·混合精度训练·大模型训练·梯度裁剪·梯度爆炸·混合精度训练/amp
大模型训练必修课:梯度裁剪(Gradient Clipping)从数学原理,到PyTorch工程实战全解析梯度裁剪(Gradient Clipping):大模型训练的“安全阀”与“稳定器”如果你之前没接触过梯度裁剪,那这篇文章将是你从零基础到精通实战的完整指南。在现代大模型(LLM)训练中,它不再是“可选项”,而是与学习率调度并列的必选项。
zzzzzz3102 天前
pytorch·机器学习·orm
LMCache 深度解析:LLM 推理加速的秘密武器,TTFT 降低 13 倍是怎么做到的?最近在搞 LLM 推理部署的时候,发现了一个让人眼前一亮的项目——LMCache。它在 GitHub 上已经积累了 8600+ stars,而且被 NVIDIA Dynamo、PyTorch 基金会、CoreWeave 等重量级玩家集成,说是目前最火的 LLM 推理加速层也不为过。