deep learning

YiPeng_Deng10 天前
人工智能·深度学习·神经网络·元学习·deep learning
【Deep Learning】Meta-Learning:训练训练神经网络的神经网络本文基于清华大学《深度学习》第12节《Beyond Supervised Learning》的内容撰写,既是课堂笔记,亦是作者的一些理解。
可keke21 天前
linux·deep learning
gpustat使用gpustat命令查看GPU的资源使用情况,例如: 但是需要先安装:
friendszc1 个月前
人工智能·tensorflow·keras·deep learning·segnet
Keras实现SegNet我真服了原来我之前用tf复现SegNet给复现错了 在网上试了多个版本代码,折腾了好久,现在终于复现对了,代码也跑通了 SegNet的架构比较老了,这几年都没人更新代码了,我这里算是提供一个最近能跑通的版本的代码吧
Big Bill Fighter1 个月前
linux·服务器·人工智能·pytorch·python·深度学习·deep learning
【框架】简化多卡训练——huggingface accelerate使用方法介绍HuggingFace 的 accelerate 库可以实现只需要修改几行代码就可以实现ddp训练,且支持混合精度训练和TPU训练。(甚至支持deepspeed。) accelerate支持的训练方式为CPU/单GPU (TPU)/多GPU(TPU) DDP模式/fp32/fp16等。
元素之窗2 个月前
deep learning
更改 DeepXDE 的后端DeepXDE 库为科学计算和工程优化等领域提供了深度学习方法,是一个非常有用的工具。其中一个重要的功能是它允许用户自定义后端。在本文中,我们将指导如何更改 DeepXDE 的后端,并且验证更改是否成功。
AzathothLXL3 个月前
论文学习·deep learning·computer version
无监督多视角行人检测 Unsupervised Multi-view Pedestrian Detection论文url:https://arxiv.org/abs/2305.12457该论文提出了一种名为Unsupervised Multi-view Pedestrian Detection (UMPD)的新方法,旨在通过多视角视频监控数据准确地定位行人,而无需依赖于人工标注的视频帧和相机视角。
Alex_StarSky4 个月前
人工智能·深度学习·神经网络·cnn·deep learning
深度学习-CNN网络改进版LetNet5深度学习中,经典网络引领一波又一波的技术革命,从LetNet到当前最火的GPT所用的Transformer,它们把AI技术不断推向高潮。
神也在Copy5 个月前
人工智能·深度学习·deep learning
【深度学习】ND4J-科学计算库目录简介基础用法基础信息数组创建打印数组变更维度&堆叠加减乘除累加/最大/最小转换操作矩陈乘法索引/迭代
littletreee5 个月前
pytorch·python·gpu·deep learning·remote server
Pytorch分布式训练,其他GPU进程占用GPU0的原因最近跑师兄21年的论文代码,代码里使用了Pytorch分布式训练,在单机8卡的情况下,运行代码,出现如下问题。 也就是说GPU(1..7)上的进程占用了GPU0,这导致GPU0占的显存太多,以至于我的batchsize不能和原论文保持一致。
lakernote6 个月前
java·ocr·deep learning·deepl
从零开发短视频电商 PaddleOCR Java推理 (二)优化Translator模型输入和输出PaddleOCR提供了一系列测试图片,你可以通过点击这里来下载。值得注意的是,PaddleOCR的模型更新速度远远快于DJL,这导致了一些DJL的优化滞后问题。因此,我们需要采取一些策略来跟上PaddleOCR的最新进展。
可keke7 个月前
deep learning
Transformer Decoder的输入大部分引用参考了既安的https://www.zhihu.com/question/337886108/answer/893002189这篇文章,个人认为写的很清晰,此外补充了一些自己的笔记。
zrc0070078 个月前
java·java-ee·mnist·deep learning·dl4j·deeplearning4j
DL4J无法下载MNIST数据集解决 Server returned HTTP response code: 403 for URL解决方法报错如下:自己下载好MNIST数据集,然后放入DL4J对应的文件夹下。可以在Java中运行这行代码查看:
littletreee9 个月前
python·deep learning·remote server
报错Intel MKL FATAL ERROR: Cannot load libmkl_core.so.的一种解决方法今天上80服务器跑mdistiller的代码时,意外发现torch、numpy都不能用了T_T以torch为例,出现如下报错情况 以numpy为例,出现如下报错情况
littletreee9 个月前
python·deep learning
报错AttributeError: Attempted to set WANDB to False, but CfgNode is immutable今天在跑代码的时候,使用到了wandb记录训练数据。  我在23服务器上跑的好好的,但将环境迁移到80服务器上重新开始跑时,却遇到了如下报错
telllong10 个月前
python·stable diffusion·deep learning
DragGAN使用记录DragGAN是一种基于人工智能的图像编辑工具,它可以根据用户的输入生成逼真的图像。与传统的图像编辑工具只能扭曲或裁剪现有的像素不同,DragGAN可以创建与用户意图匹配的新内容。