生成模型

盼小辉丶1 天前
pytorch·深度学习·生成对抗网络·生成模型
PyTorch实战(20)——生成对抗网络(Generative Adversarial Network,GAN)生成式人工智能已成为当前研究的热门领域,生成对抗网络 (Generative Adversarial Network, GAN) 模型于 2014 年提出,自基础 GAN 架构诞生以来,针对不同应用场景的各类 GAN 变体不断涌现并持续演进。 与变分自编码器 (Variational Autoencoder, VAE) 不同,VAE 可以学习数据的潜分布,并通过从该分布中采样生成新的样本;自回归模型则逐步生成数据,每次生成一个元素,并以之前生成的元素为条件生成数据。而 GAN 无需显式建模数据分布,即可生
这张生成的图像能检测吗2 天前
人工智能·图神经网络·生成模型·分子设计·药物发现
(论文速读)VJTNN+GAN分子优化的图到图翻译论文题目:Learning Multimodal Graph-to-Graph Translation for Molecular Optimization(学习用于分子优化的多模态图到图转换)
有为少年12 天前
人工智能·深度学习·神经网络·学习·机器学习·计算机视觉·生成模型
带噪学习 | Ambient Diffusion (NeurIPS 2023) 上篇Ambient Diffusion是首个基于扩散模型的框架,可仅通过高度损坏的样本(如缺失 90% 像素的图像)学习干净数据的分布,其核心思路是在扩散过程中引入额外测量失真,要求模型从进一步损坏的图像中预测原始损坏图像,能避免生成模型记忆训练样本,在 CelebA、CIFAR-10、AFHQ 等基准数据集上表现优异,还可在单 GPU 上仅用数小时微调基础模型(如 Deepfloyd IF),适用于 MRI 扫描等小样本损坏数据集,同时在逆问题求解中仅需 1 步预测就可比肩需数百步的现有方法。
盼小辉丶12 天前
pytorch·深度学习·生成模型
生成模型实战 | 残差流(Residual Flow)详解与实现残差流模型 (Residual Flow) 是一种基于归一化流 (Normalizing Flow) 的生成模型,它通过一系列可逆的残差变换将简单分布(如高斯分布)转换为复杂的数据分布。与传统的归一化流不同,残差流使用残差连接来构建可逆变换,这使得模型能够构建更深的网络结构。在本节中,我们将介绍残差流模型的基本原理并使用 PyTorch 从零开始实现残差流模型。
吐个泡泡v18 天前
深度学习·vae·生成模型·自编码器
深度学习中的“压缩与解压“艺术:自编码器与VAE详解想象一下你拍了一张高清照片,文件大小动辄几MB甚至几十MB。为了方便传输,你需要把它压缩到几百KB,但又希望解压后看起来依然清晰。这就像我们今天要聊的自编码器——一个会"压缩与解压"的神经网络。
盼小辉丶18 天前
pytorch·深度学习·lstm·生成模型
PyTorch实战(16)——基于LSTM实现音乐生成本节我们将介绍音乐生成,利用 PyTorch 构建能够创作类古典音乐的机器学习模型。在本节中,我们将采用长短期记忆网络 (Long Short-Term Memory, LSTM) 来处理序列化音乐数据。训练数据选自莫扎特的古典音乐作品,每首乐曲将被分解为钢琴音符序列。读取以 MIDI (Musical Instrument Digital Interface) 格式存储的音乐数据,MIDI 是一种跨设备、跨环境读写音乐数据的通用标准格式。 在将 MIDI 文件转换为钢琴音符序列(即钢琴卷帘谱,piano
盼小辉丶1 个月前
深度学习·语言模型·bert·生成模型
生成模型实战 | BERT详解与实现BERT (Bidirectional Encoder Representations from Transformers) 是 Google 在提出的预训练语言模型,它通过 Transformer 编码器结构和掩码语言模型 (Masked Language Model, MLM) 任务,实现了真正的双向上下文理解。在本节中,我们将学习如何从零开始训练自编码语言模型。训练过程包括模型的预训练和针对特定任务的训练。首先,学习 BERT (Bidirectional Encoder Representatio
这张生成的图像能检测吗2 个月前
人工智能·计算机视觉·交互·生成模型·图像生成·视觉语言模型·3d重建
(论文速读)InteractVLM: 基于2D基础模型的3D交互推理论文题目:InteractVLM: 3D Interaction Reasoning from 2D Foundational Models(基于2D基础模型的3D交互推理)
youcans_2 个月前
论文阅读·人工智能·计算机视觉·3d·生成模型
【医学影像 AI】一种用于生成逼真的3D血管的分层部件生成模型更多内容请关注【医学影像 AI by youcans@Xidian 专栏】2025 年 清华大学 Siqi Chen 等在 MICCAI2025 发表论文 “一种用于生成逼真的3D血管的分层部件生成模型(Hierarchical Part-based Generative Model for Realistic 3D Blood Vessel)”。
盼小辉丶2 个月前
深度学习·神经网络·cnn·生成模型
使用CNN构建VAE在原始变分自编码器 (Variational Autoencoder, VAE) 中,VAE 网络采用全连接网络实现。本节将使用卷积神经网络 (Convolutional Neural Network, CNN) 提升生成数字的质量,同时将参数数量大幅减少至 134165 个。
孤狼灬笑2 个月前
rnn·深度学习·算法·cnn·生成模型·fnn
深度学习经典分类(算法分析与案例)目录前馈神经网络(FNN)卷积神经网络(CNN)循环神经网络(RNN)生成模型总结与展望深度学习是人工智能的重要分支,其分类方式多样,主要可以从学习方式、模型架构和应用场景等角度进行划分。例如,按照学习方式可分为监督学习、无监督学习和强化学习;按照应用场景分类,深度学习广泛应用于图像识别、自然语言处理、语音识别和推荐系统等领域。比如,CNN在医疗诊断中用于分析医学图像,RNN和Transformer在机器翻译和文本生成中表现优异。本文主要是从模型架构的角度来进行分类的。
盼小辉丶3 个月前
人工智能·深度学习·计算机视觉·keras·生成模型
视频生成技术Deepfake我们已经了解并建立了多种用于图像生成的模型,包括 StyleGAN、Self-Attention GAN (SAGAN) 和扩散模型等,在本节中我们将继续学习视频生成(合成)。本质上,视频只是一系列图像。因此,最基本的视频生成方法是单独生成图像,并按顺序将它们放在一起以制作视频。在本节中,我们将概述视频生成。然后,我们将实现视频生成技术 Deepfake。我们将使用此功能将视频中的人脸与其他人的脸部交换。
盼小辉丶3 个月前
深度学习·生成对抗网络·aigc·keras·生成模型
AIGC实战——BicycleGAN详解与实现pix2pix 和 CycleGAN 是非常的流行生成对抗网络 (Generative Adversarial Network, GAN) ,不仅在学术界有许多变体,同时也有许多基于此的应用。但是,它们都有一个缺点——图像的输出看起来几乎总是相同的。例如,如果我们要执行斑马到马的转换,被转换的同一马的照片将始终具有相同的外观和色调,这是由于它学会过滤了噪声的随机性。为了进行多样化图像转换,本文详解了 BicycleGAN 如何解决此问题以生成更丰富的图像,并利用 Tensorflow2 实现 Bicycl
盼小辉丶4 个月前
深度学习·生成模型
生成模型与概率分布基础概率分布是机器学习的基础,在生成模型中尤为重要。在本节中,我们首先了解什么是概率,以及如何在不使用任何神经网络或复杂算法的情况下使用它来生成人脸图像。仅借助基本数学和 NumPy 代码,学习如何创建概率生成模型。
大千AI助手4 个月前
人工智能·深度学习·生成对抗网络·gan·生成模型·ian goodfellow·对抗训练
生成对抗网络(GAN):深度学习领域的革命性突破本文由「大千AI助手」原创发布,专注用真话讲AI,回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我,一起撕掉过度包装,学习真实的AI技术!
盼小辉丶4 个月前
人工智能·pytorch·生成模型
PyTorch生成式人工智能——PatchGAN详解与实现在生成对抗网络 (Generative Adversarial Network, GAN) 的发展历程中,如何提升生成图像的细节质量一直是研究者关注的核心问题。传统的全局判别器往往过于关注图像的整体结构,而忽略了局部细节的真实性,导致生成的面部图像缺乏细腻的纹理特征。正是在这样的技术背景下,PatchGAN 作为一种创新的判别器架构脱颖而出。它通过将图像分割为多个局部区域并进行独立判别,极大地增强了对高频细节的感知能力。本节将深入探讨 PatchGAN 相关原理,并使用 PyTorch 从零开始实现 Pa
这张生成的图像能检测吗4 个月前
图像处理·人工智能·机器学习·计算机视觉·生成模型·自回归模型
(论文速读)RandAR:突破传统限制的随机顺序图像自回归生成模型论文题目:RandAR: Decoder-only Autoregressive Visual Generation in Random Orders(随机顺序下仅解码器的自回归视觉生成)
盼小辉丶4 个月前
pytorch·python·深度学习·生成模型
PyTorch生成式人工智能——使用MusicGen生成音乐大语言模型在许多领域都取得了巨大成功,除了生成文本和图像外,也可以将大模型(通常基于 Transformer )用于其他任务。例如,可以创建一个大音乐模型,接受文本提示作为输入,并生成音乐作为输出。MusicGen 是音乐生成大模型中的前沿代表,通过 audiocraft 库可以轻松使用 MusicGen。
盼小辉丶5 个月前
深度学习·tensorflow·生成模型
TensorFlow深度学习实战(28)——扩散模型(Diffusion Model)与生成对抗网络 (Generative Adversarial Network, GAN)一样,扩散模型是过去十年中最有影响力的生成模型技术之一。在许多基准测试中,当前的扩散模型已经超过了以往最先进的 GAN 模型,并迅速成为生成模型的首选。事实上,扩散来源于热力学扩散。同时,基于评分的生成模型领域(即能量模型)也取得了重要的进展,其直接估计对数分布的梯度(也称为评分函数),以训练模型。噪声条件得分网络 (Noise Conditional Score Network, NCSN) 使用多尺度噪声扰动应用
盼小辉丶5 个月前
深度学习·aigc·生成模型
生成模型实战 | GLOW详解与实现GLOW (Generative Flow) 是一种基于归一化流的生成模型,通过在每个流步骤中引入可逆的 1 × 1 卷积层,替代了 RealNVP 中通道翻转或固定置换的策略,从而使通道重排更具表达力,同时保持雅可比行列式和逆变换的高效计算能力。本文首先回顾归一化流与 RealNVP 的基本原理,接着剖析 GLOW 的四大核心模块:ActNorm、可逆 1×1 卷积、仿射耦合层和多尺度架构,随后基于 PyTorch 实现 GLOW 模型,并在 CIFAR-10 数据集上进行训练。