pytorch

最晚的py4 小时前
人工智能·pytorch·cnn卷积层
cnn卷积层详解卷积层是卷积神经网络(CNN)的核心组成部分,用于提取输入数据的局部特征。通过卷积操作,网络能够捕捉图像中的边缘、纹理等低级特征,并逐步组合为更高级的语义特征。卷积层的核心是卷积核(或滤波器),它在输入数据上滑动并计算局部区域的加权和。
haiyu_y11 小时前
人工智能·pytorch·深度学习
Day 54 Inception 网络及其思考学习目标:Inception 网络(也称为 GoogLeNet)是 Google 团队在 2014 年提出的经典卷积神经网络架构。
GG向前冲11 小时前
人工智能·pytorch·深度学习
【深度学习】利用GPU跑Pytorch框架深度学习配置全流程PyTorch是一款开源的深度学习框架,由Facebook的人工智能研究团队开发并维护,目前是全球深度学习领域最主流的框架之一。 它的核心定位是为科研人员和工程师提供灵活、高效的工具,用于构建、训练和部署各种深度学习模型,如图像分类、自然语言处理、语音识别等。PyTorch的核心优势在于支持动态计算图,使用时实时构建计算流程,便于调试和灵活设计复杂模型,同时兼具易用性和高性能。
学习是生活的调味剂12 小时前
pytorch·学习·tensorflow·transformers
在大模型开发中,是否需要先完整学习 TensorFlow,再学 PyTorch?在大模型开发中,是否需要先完整学习 TensorFlow,再学 PyTorch?其实都可以学,但关键在于顺序。更高效的做法是:先掌握 transformers 等高级库的基本使用,学会如何调整超参数。等模型调优有一定成果后,若希望更进一步,再去研究 TensorFlow、PyTorch 这类底层框架。
蹦蹦跳跳真可爱5891 天前
人工智能·pytorch·python·gpt·embedding
Python----大模型(GPT-2模型训练加速,训练策略)原理:NVIDIA的Tensor Core支持混合精度计算(FP16/FP32),通过Volta/Turing/Ampere架构的GPU(如V100/A100)加速矩阵运算。
xwill*1 天前
人工智能·pytorch·python
π∗0.6: a VLA That Learns From Experience序号1:优势调节1:优势调节 作者没有改变 VLA(视觉-语言-动作)模型的底层逻辑,而是改变了它的输入方式。在训练阶段,机器人尝试过很多次,有成功也有失败,当机器人看到图片并且做了一个正确的动作,就给这个数据加上一个postive的标签。在推理阶段,在模型预测动作之前,插入了一个文本标签:“Advantage: positive” 或 “Advantage: negative”([摄像头画面] + [任务:做咖啡] + [文本标签:优势:正向])。这种设计让模型学会了关联“动作”与“结果好坏”。在推理(
重生之我要成为代码大佬1 天前
人工智能·pytorch·深度学习·机器学习
深度学习1-安装pytorch(无独立显卡版本)自学深度学习,大多是跟着各种博客和教程一步步走下来的,我也会把我遇到的问题和可能遇到的一些思考加进来,也是新手,期待请教和交流。
All The Way North-1 天前
pytorch·深度学习·实战教程·全连接神经网络案例·手机价格区间分类·神经网络全过程
[实战分享] PyTorch实战:手机价格区间分类(95%准确率)+ 模型保存/加载/loss波动全解析小明创办了一家手机公司,他不知道如何估算手机产品的价格。为了解决这个问题,他收集了多家公司的手机销售数据。该数据为二手手机的各个性能的数据,最后根据这些性能得到4个价格区间,作为这些二手手机售出的价格区间。主要包括:
不错就是对2 天前
人工智能·pytorch·深度学习·机器学习·chatgpt·transformer·vllm
【Agent-lightning】 - 1_环境搭建源代码仓库:agent-lightning 源代码仓库论文链接:Agent Lightning 论文个人代码仓库:agent-lightning 个人仓库
Dfreedom.2 天前
人工智能·pytorch·python·深度学习·call
从 model(x) 到__call__:解密深度学习框架的设计基石在 PyTorch 或 TensorFlow 中构建神经网络时,你是否曾好奇过,为什么我们习惯使用 model(input) 进行前向传播,而不是直接调用 model.forward(input) 或 layer.call(input)?
njsgcs2 天前
人工智能·pytorch·深度学习·modelscope·groundingdino
用modelscope运行grounding dino参考grounding-dino-tiny · 模型库不支持中文,试过了想让它识别点赞和收藏按钮识别不出来,效果很拉
toolhow2 天前
pytorch·python·深度学习
SelfAttenion自注意力机制考虑别的token对当前token的语义影响输入x= [4x6]dk=3wq = [6x3]wk = [6x3]
TonyLee0172 天前
人工智能·pytorch·深度学习
pytorch深度学习训练随机种子设置为了确保训练的模型能够复现,这里记录一下随机种子的设置,以便直接使用。随机种子就像你玩游戏时的 “存档点”,只要你加载同一个存档(设置同一个种子),后续的游戏进程(生成的随机数)就会完全一样;换个存档(换种子),进程就会不同。
Francek Chen3 天前
人工智能·pytorch·深度学习·神经网络·自然语言处理
【自然语言处理】应用04:自然语言推断与数据集【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈PyTorch深度学习 ⌋ ⌋ ⌋ 深度学习 (DL, Deep Learning) 特指基于深层神经网络模型和方法的机器学习。它是在统计机器学习、人工神经网络等算法模型基础上,结合当代大数据和大算力的发展而发展出来的。深度学习最重要的技术特征是具有自动提取特征的能力。神经网络算法、算力和数据是开展深度学习的三要素。深度学习在计算机视觉、自然语言处理、多模态数据分析、科学探索等领域都取得了很多成果。本专栏介绍基于PyTorch的深度学习算法实现
蹦蹦跳跳真可爱5893 天前
开发语言·人工智能·pytorch·python·gpt·深度学习·embedding
Python----大模型(GPT-2模型训练,预测)GPT-2模型的核心架构基于Transformer解码器,采用自回归方式生成文本。模型构建部分定义了GPTConfig配置类,包含关键参数如block_size(序列长度)、vocab_size(词表大小)、n_layer(层数)、n_head(注意力头数)和n_embd(嵌入维度)。
子夜江寒3 天前
pytorch·cnn
基于 PyTroch 的卷积神经网络在图像分类中应用与实践卷积神经网络(CNN)是深度学习领域中处理图像数据的核心架构。它通过卷积层自动提取图像的空间特征,配合池化层降低特征维度,最终通过全连接层完成分类任务。
心态特好3 天前
人工智能·pytorch·python
pytorch和tenserflow详解想象一下,你想建造一座非常复杂、智能的 “房子”,比如一个能自动调节温度、识别访客、甚至自我学习的智能别墅。
重生之我要成为代码大佬3 天前
人工智能·pytorch·深度学习
深度学习2-在2024pycharm版本中导入pytorch自学,自己摸索的如果有问题和侵权的,请联系。在上一篇中,我成功安装了pytorch,继续看土导的视频不是很能理解,弹幕指路看到另一个up的关于2024版本pycharm的讲解,恰好我的pycharm也是2024版本的,跟着做了一下。
Easonmax4 天前
人工智能·pytorch·深度学习
从0到1:Qwen-1.8B-Chat 在昇腾Atlas 800T A2上的部署与实战指南前言随着国产算力生态的日益成熟,以及昇腾 NPU 在大模型领域的广泛应用,我决定将一个常用的开源对话模型——Qwen-1.8B-Chat 部署到昇腾Atlas 800T A2算力卡上,完整体验一次“原生 PyTorch 代码”向“NPU 环境”的迁移过程。整个过程远比想象中要简单且流畅。本文将整理出这份面向初学者的完整部署实战指南,带你避开常见陷阱,实现模型在国产算力上的成功运行。
BOF_dcb4 天前
pytorch·深度学习·机器学习
【无标题】import torch # PyTorch核心库 import torch.nn as nn # 神经网络层 from torch.utils.data import DataLoader # 数据加载器(批量处理数据) from torchvision import datasets, transforms, models # 数据集/数据增强/预训练模型 import os # 路径操作