技术栈
deep learning
YiPeng_Deng
10 天前
人工智能
·
深度学习
·
神经网络
·
元学习
·
deep learning
【Deep Learning】Meta-Learning:训练训练神经网络的神经网络
本文基于清华大学《深度学习》第12节《Beyond Supervised Learning》的内容撰写,既是课堂笔记,亦是作者的一些理解。
可keke
21 天前
linux
·
deep learning
gpustat
使用gpustat命令查看GPU的资源使用情况,例如: 但是需要先安装:
friendszc
1 个月前
人工智能
·
tensorflow
·
keras
·
deep learning
·
segnet
Keras实现SegNet
我真服了原来我之前用tf复现SegNet给复现错了 在网上试了多个版本代码,折腾了好久,现在终于复现对了,代码也跑通了 SegNet的架构比较老了,这几年都没人更新代码了,我这里算是提供一个最近能跑通的版本的代码吧
Big Bill Fighter
1 个月前
linux
·
服务器
·
人工智能
·
pytorch
·
python
·
深度学习
·
deep learning
【框架】简化多卡训练——huggingface accelerate使用方法介绍
HuggingFace 的 accelerate 库可以实现只需要修改几行代码就可以实现ddp训练,且支持混合精度训练和TPU训练。(甚至支持deepspeed。) accelerate支持的训练方式为CPU/单GPU (TPU)/多GPU(TPU) DDP模式/fp32/fp16等。
元素之窗
2 个月前
deep learning
更改 DeepXDE 的后端
DeepXDE 库为科学计算和工程优化等领域提供了深度学习方法,是一个非常有用的工具。其中一个重要的功能是它允许用户自定义后端。在本文中,我们将指导如何更改 DeepXDE 的后端,并且验证更改是否成功。
AzathothLXL
3 个月前
论文学习
·
deep learning
·
computer version
无监督多视角行人检测 Unsupervised Multi-view Pedestrian Detection
论文url:https://arxiv.org/abs/2305.12457该论文提出了一种名为Unsupervised Multi-view Pedestrian Detection (UMPD)的新方法,旨在通过多视角视频监控数据准确地定位行人,而无需依赖于人工标注的视频帧和相机视角。
Alex_StarSky
4 个月前
人工智能
·
深度学习
·
神经网络
·
cnn
·
deep learning
深度学习-CNN网络改进版LetNet5
深度学习中,经典网络引领一波又一波的技术革命,从LetNet到当前最火的GPT所用的Transformer,它们把AI技术不断推向高潮。
神也在Copy
5 个月前
人工智能
·
深度学习
·
deep learning
【深度学习】ND4J-科学计算库
目录简介基础用法基础信息数组创建打印数组变更维度&堆叠加减乘除累加/最大/最小转换操作矩陈乘法索引/迭代
littletreee
5 个月前
pytorch
·
python
·
gpu
·
deep learning
·
remote server
Pytorch分布式训练,其他GPU进程占用GPU0的原因
最近跑师兄21年的论文代码,代码里使用了Pytorch分布式训练,在单机8卡的情况下,运行代码,出现如下问题。 也就是说GPU(1..7)上的进程占用了GPU0,这导致GPU0占的显存太多,以至于我的batchsize不能和原论文保持一致。
lakernote
6 个月前
java
·
ocr
·
deep learning
·
deepl
从零开发短视频电商 PaddleOCR Java推理 (二)优化Translator模型输入和输出
PaddleOCR提供了一系列测试图片,你可以通过点击这里来下载。值得注意的是,PaddleOCR的模型更新速度远远快于DJL,这导致了一些DJL的优化滞后问题。因此,我们需要采取一些策略来跟上PaddleOCR的最新进展。
可keke
7 个月前
deep learning
Transformer Decoder的输入
大部分引用参考了既安的https://www.zhihu.com/question/337886108/answer/893002189这篇文章,个人认为写的很清晰,此外补充了一些自己的笔记。
zrc007007
8 个月前
java
·
java-ee
·
mnist
·
deep learning
·
dl4j
·
deeplearning4j
DL4J无法下载MNIST数据集解决 Server returned HTTP response code: 403 for URL解决方法
报错如下:自己下载好MNIST数据集,然后放入DL4J对应的文件夹下。可以在Java中运行这行代码查看:
littletreee
9 个月前
python
·
deep learning
·
remote server
报错Intel MKL FATAL ERROR: Cannot load libmkl_core.so.的一种解决方法
今天上80服务器跑mdistiller的代码时,意外发现torch、numpy都不能用了T_T以torch为例,出现如下报错情况 以numpy为例,出现如下报错情况
littletreee
9 个月前
python
·
deep learning
报错AttributeError: Attempted to set WANDB to False, but CfgNode is immutable
今天在跑代码的时候,使用到了wandb记录训练数据。 我在23服务器上跑的好好的,但将环境迁移到80服务器上重新开始跑时,却遇到了如下报错
telllong
10 个月前
python
·
stable diffusion
·
deep learning
DragGAN使用记录
DragGAN是一种基于人工智能的图像编辑工具,它可以根据用户的输入生成逼真的图像。与传统的图像编辑工具只能扭曲或裁剪现有的像素不同,DragGAN可以创建与用户意图匹配的新内容。