解决方案:查看机器配置+如何迁移虚拟环境到离线机器+解决输出tensor有省略号的问题

问题一、Linux查看硬件配置信息

在Linux系统中,你可以使用一些命令来查看硬件配置信息。以下是几个常用的命令: :one::查看CPU

bash 复制代码
cat /proc/cpuinfo

一些关键性指标:

vendor_id :制造商信息,这里显示为 GenuineIntel,表示是英特尔(Intel)的处理器。 model nam e:处理器的具体型号,这里是 Intel(R) Xeon(R) Platinum,表示是英特尔至强(Xeon)铂金系列的处理器。 cpu MHz :处理器的时钟频率,这里显示为 2500.000 MHz,表示是 2.5 GHz 的处理器。 cachesize:处理器的缓存大小,这里显示为 33792 KB,表示是 33 MB 的缓存。 siblings 和 cpucores :分别表示处理器的超线程数(同时执行的线程数)和物理核心数。在这里,每个处理器都有 2 个siblings,表示支持超线程技术,每个处理器有 1 个cpu core,表示每个处理器有1个物理核心。 flags:列出了处理器支持的各种特性和指令集,包括 MMX、SSE、SSE2、AVX 等。这些特性在编程和优化程序时很有用。

:two::查看内存信息

bash 复制代码
cat /proc/meminfo

一些关键的内存相关指标:

MemTotal :总内存大小。 MemFree :空闲内存大小。 MemAvailable :可用内存大小。 Buffers :用于缓冲文件系统数据的内存大小。 Cached :用于缓存文件系统数据的内存大小。 SwapTotal :交换空间(Swap)总大小。 SwapFree:空闲的交换空间大小。

:three::查看显卡信息 方法一:lspci | grep VGA 此方法会列出所有的显卡设备,如果系统中有多个显卡,将会显示它们的信息 方法二:nvidia-smi 此方法仅仅针对 Nvidia 显卡的命令,它可以提供更详细的 Nvidia GPU 相关信息,包括 GPU 的型号、温度、内存使用情况等。

:four::查看硬盘信息

bash 复制代码
fdisk -l

命令会显示硬盘的分区表、分区的起始扇区和结束扇区、分区的大小、分区的类型等信息。这些信息可以帮助用户了解硬盘的分区情况,以及分区的用途和格式。

问题二、迁移虚拟环境到离线机器

有时候我们在维护服务器、更换机器、迁移服务器、模型固化部署等情况时会经常碰到迁移,这时如果重新在目标机器再安装一次虚拟环境,耗时耗力,而且也有可能目标机器是离线状态。

这时需要将本地的环境移植到新的机器上。

解决方案:conda 常用来执行虚拟环境配置和包管理工作,可以使用conda-pack 进行conda 环境打包和分发。

  1. 安装conda pack:conda install conda-pack

  2. 复制一份虚拟环境:conda create -n xx(拷贝虚拟环境命名) --clone **(源虚拟环境),这一步是避免打包的时候出现问题导致源虚拟环境受损,可选做。

  3. 打包刚刚拷贝的虚拟环境:conda pack -n xx,这里需要等待一段时间,包涉及到的库越多,打包时间越长;

  4. 得到一个 xx.tar.gz的文件,将该.tar.gz压缩包下载,大小在几百MB到几个G不等

  5. 输入 conda config --show ,查找Anaconda虚拟环境

  6. 通过mobaxterm或者其他方式把 xx.tar.gz上传到目标服务器的如下目录里面:/home/用户名/anaconda3/envs/xx/

  7. 在目标服务器上解压压缩包:tar -xzf xx.tar.gz

  8. 在目标服务器上查看虚拟环境:conda info --envs

问题三、输出tensor有省略号

问题描述:Torch 在输出tensor的时候,如何指定输出全部,不要省略号略过中间值 tensor([[[-102.1618, -102.1618, -103.8347, ..., -117.6031, -111.0496,-111.0496],[-102.1618, -102.1618, -103.8347, ..., -117.6031, -111.0496,-111.0496], device='cuda:0')

问题原因:输出的时候,由于tensor太长,pytorch会自动将其省略

解决方案: 在开始增加:torch.set_printoptions(threshold=np.inf)

这个方法是来修改pytorch中的打印选项的(其实就是和numpy中更改打印方法一样),就是使用print打印tensor时,我们显示的元素精度,最多显示元素个数等一系列的有关操作的选项。其参数含义如下:

参数名 意义
precision=None 显示浮点tensor中元素的精度
threshold=None 指定tensor的数目超过多少时开始显示进行折叠。默认为1000。
edgeitems=None 显示的前面与后面的数据的行数
linewidth=None 指定每行的字符数
profile=None 三种显示方法 ,分别为default、short、full
sci_mode=None 是否使用科学计数法
相关推荐
deephub13 分钟前
优化注意力层提升 Transformer 模型效率:通过改进注意力机制降低机器学习成本
人工智能·深度学习·transformer·大语言模型·注意力机制
搏博25 分钟前
神经网络问题之二:梯度爆炸(Gradient Explosion)
人工智能·深度学习·神经网络
KGback31 分钟前
【论文解析】HAQ: Hardware-Aware Automated Quantization With Mixed Precision
人工智能
电子手信39 分钟前
知识中台在多语言客户中的应用
大数据·人工智能·自然语言处理·数据挖掘·知识图谱
不高明的骗子40 分钟前
【深度学习之一】2024最新pytorch+cuda+cudnn下载安装搭建开发环境
人工智能·pytorch·深度学习·cuda
Chef_Chen1 小时前
从0开始学习机器学习--Day33--机器学习阶段总结
人工智能·学习·机器学习
搏博1 小时前
神经网络问题之:梯度不稳定
人工智能·深度学习·神经网络
GL_Rain1 小时前
【OpenCV】Could NOT find TIFF (missing: TIFF_LIBRARY TIFF_INCLUDE_DIR)
人工智能·opencv·计算机视觉
shansjqun1 小时前
教学内容全覆盖:航拍杂草检测与分类
人工智能·分类·数据挖掘
狸克先生1 小时前
如何用AI写小说(二):Gradio 超简单的网页前端交互
前端·人工智能·chatgpt·交互