生成模型

吐个泡泡v3 小时前
深度学习·vae·生成模型·自编码器
深度学习中的“压缩与解压“艺术:自编码器与VAE详解想象一下你拍了一张高清照片,文件大小动辄几MB甚至几十MB。为了方便传输,你需要把它压缩到几百KB,但又希望解压后看起来依然清晰。这就像我们今天要聊的自编码器——一个会"压缩与解压"的神经网络。
盼小辉丶13 小时前
pytorch·深度学习·lstm·生成模型
PyTorch实战(16)——基于LSTM实现音乐生成本节我们将介绍音乐生成,利用 PyTorch 构建能够创作类古典音乐的机器学习模型。在本节中,我们将采用长短期记忆网络 (Long Short-Term Memory, LSTM) 来处理序列化音乐数据。训练数据选自莫扎特的古典音乐作品,每首乐曲将被分解为钢琴音符序列。读取以 MIDI (Musical Instrument Digital Interface) 格式存储的音乐数据,MIDI 是一种跨设备、跨环境读写音乐数据的通用标准格式。 在将 MIDI 文件转换为钢琴音符序列(即钢琴卷帘谱,piano
盼小辉丶12 天前
深度学习·语言模型·bert·生成模型
生成模型实战 | BERT详解与实现BERT (Bidirectional Encoder Representations from Transformers) 是 Google 在提出的预训练语言模型,它通过 Transformer 编码器结构和掩码语言模型 (Masked Language Model, MLM) 任务,实现了真正的双向上下文理解。在本节中,我们将学习如何从零开始训练自编码语言模型。训练过程包括模型的预训练和针对特定任务的训练。首先,学习 BERT (Bidirectional Encoder Representatio
这张生成的图像能检测吗2 个月前
人工智能·计算机视觉·交互·生成模型·图像生成·视觉语言模型·3d重建
(论文速读)InteractVLM: 基于2D基础模型的3D交互推理论文题目:InteractVLM: 3D Interaction Reasoning from 2D Foundational Models(基于2D基础模型的3D交互推理)
youcans_2 个月前
论文阅读·人工智能·计算机视觉·3d·生成模型
【医学影像 AI】一种用于生成逼真的3D血管的分层部件生成模型更多内容请关注【医学影像 AI by youcans@Xidian 专栏】2025 年 清华大学 Siqi Chen 等在 MICCAI2025 发表论文 “一种用于生成逼真的3D血管的分层部件生成模型(Hierarchical Part-based Generative Model for Realistic 3D Blood Vessel)”。
盼小辉丶2 个月前
深度学习·神经网络·cnn·生成模型
使用CNN构建VAE在原始变分自编码器 (Variational Autoencoder, VAE) 中,VAE 网络采用全连接网络实现。本节将使用卷积神经网络 (Convolutional Neural Network, CNN) 提升生成数字的质量,同时将参数数量大幅减少至 134165 个。
孤狼灬笑2 个月前
rnn·深度学习·算法·cnn·生成模型·fnn
深度学习经典分类(算法分析与案例)目录前馈神经网络(FNN)卷积神经网络(CNN)循环神经网络(RNN)生成模型总结与展望深度学习是人工智能的重要分支,其分类方式多样,主要可以从学习方式、模型架构和应用场景等角度进行划分。例如,按照学习方式可分为监督学习、无监督学习和强化学习;按照应用场景分类,深度学习广泛应用于图像识别、自然语言处理、语音识别和推荐系统等领域。比如,CNN在医疗诊断中用于分析医学图像,RNN和Transformer在机器翻译和文本生成中表现优异。本文主要是从模型架构的角度来进行分类的。
盼小辉丶2 个月前
人工智能·深度学习·计算机视觉·keras·生成模型
视频生成技术Deepfake我们已经了解并建立了多种用于图像生成的模型,包括 StyleGAN、Self-Attention GAN (SAGAN) 和扩散模型等,在本节中我们将继续学习视频生成(合成)。本质上,视频只是一系列图像。因此,最基本的视频生成方法是单独生成图像,并按顺序将它们放在一起以制作视频。在本节中,我们将概述视频生成。然后,我们将实现视频生成技术 Deepfake。我们将使用此功能将视频中的人脸与其他人的脸部交换。
盼小辉丶3 个月前
深度学习·生成对抗网络·aigc·keras·生成模型
AIGC实战——BicycleGAN详解与实现pix2pix 和 CycleGAN 是非常的流行生成对抗网络 (Generative Adversarial Network, GAN) ,不仅在学术界有许多变体,同时也有许多基于此的应用。但是,它们都有一个缺点——图像的输出看起来几乎总是相同的。例如,如果我们要执行斑马到马的转换,被转换的同一马的照片将始终具有相同的外观和色调,这是由于它学会过滤了噪声的随机性。为了进行多样化图像转换,本文详解了 BicycleGAN 如何解决此问题以生成更丰富的图像,并利用 Tensorflow2 实现 Bicycl
盼小辉丶3 个月前
深度学习·生成模型
生成模型与概率分布基础概率分布是机器学习的基础,在生成模型中尤为重要。在本节中,我们首先了解什么是概率,以及如何在不使用任何神经网络或复杂算法的情况下使用它来生成人脸图像。仅借助基本数学和 NumPy 代码,学习如何创建概率生成模型。
大千AI助手3 个月前
人工智能·深度学习·生成对抗网络·gan·生成模型·ian goodfellow·对抗训练
生成对抗网络(GAN):深度学习领域的革命性突破本文由「大千AI助手」原创发布,专注用真话讲AI,回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我,一起撕掉过度包装,学习真实的AI技术!
盼小辉丶4 个月前
人工智能·pytorch·生成模型
PyTorch生成式人工智能——PatchGAN详解与实现在生成对抗网络 (Generative Adversarial Network, GAN) 的发展历程中,如何提升生成图像的细节质量一直是研究者关注的核心问题。传统的全局判别器往往过于关注图像的整体结构,而忽略了局部细节的真实性,导致生成的面部图像缺乏细腻的纹理特征。正是在这样的技术背景下,PatchGAN 作为一种创新的判别器架构脱颖而出。它通过将图像分割为多个局部区域并进行独立判别,极大地增强了对高频细节的感知能力。本节将深入探讨 PatchGAN 相关原理,并使用 PyTorch 从零开始实现 Pa
这张生成的图像能检测吗4 个月前
图像处理·人工智能·机器学习·计算机视觉·生成模型·自回归模型
(论文速读)RandAR:突破传统限制的随机顺序图像自回归生成模型论文题目:RandAR: Decoder-only Autoregressive Visual Generation in Random Orders(随机顺序下仅解码器的自回归视觉生成)
盼小辉丶4 个月前
pytorch·python·深度学习·生成模型
PyTorch生成式人工智能——使用MusicGen生成音乐大语言模型在许多领域都取得了巨大成功,除了生成文本和图像外,也可以将大模型(通常基于 Transformer )用于其他任务。例如,可以创建一个大音乐模型,接受文本提示作为输入,并生成音乐作为输出。MusicGen 是音乐生成大模型中的前沿代表,通过 audiocraft 库可以轻松使用 MusicGen。
盼小辉丶4 个月前
深度学习·tensorflow·生成模型
TensorFlow深度学习实战(28)——扩散模型(Diffusion Model)与生成对抗网络 (Generative Adversarial Network, GAN)一样,扩散模型是过去十年中最有影响力的生成模型技术之一。在许多基准测试中,当前的扩散模型已经超过了以往最先进的 GAN 模型,并迅速成为生成模型的首选。事实上,扩散来源于热力学扩散。同时,基于评分的生成模型领域(即能量模型)也取得了重要的进展,其直接估计对数分布的梯度(也称为评分函数),以训练模型。噪声条件得分网络 (Noise Conditional Score Network, NCSN) 使用多尺度噪声扰动应用
盼小辉丶4 个月前
深度学习·aigc·生成模型
生成模型实战 | GLOW详解与实现GLOW (Generative Flow) 是一种基于归一化流的生成模型,通过在每个流步骤中引入可逆的 1 × 1 卷积层,替代了 RealNVP 中通道翻转或固定置换的策略,从而使通道重排更具表达力,同时保持雅可比行列式和逆变换的高效计算能力。本文首先回顾归一化流与 RealNVP 的基本原理,接着剖析 GLOW 的四大核心模块:ActNorm、可逆 1×1 卷积、仿射耦合层和多尺度架构,随后基于 PyTorch 实现 GLOW 模型,并在 CIFAR-10 数据集上进行训练。
爱分享的飘哥4 个月前
人工智能·pytorch·python·aigc·教程·生成模型·代码实战
第三篇:VAE架构详解与PyTorch实现:从零构建AI的“视觉压缩引擎”在AI生成这条波澜壮阔的技术长河中,如果你想溯源而上,找到那个开启了“高清生成”时代的源头,那么VAE(Variational Autoencoder)无疑是那块最关键的“里程碑”。
CodeShare4 个月前
计算机视觉·生成模型·无监督学习
计算机视觉的未来方向:无监督学习与生成模型欧洲计算机视觉会议(ECCV)于周日开幕,与国际计算机视觉会议(ICCV)交替举办。原定今年在格拉斯哥举行的ECCV,与今年夏天大多数主要计算机科学会议一样,转为线上举行。
盼小辉丶6 个月前
pytorch·生成对抗网络·生成模型·生成式人工智能
PyTorch实战(7)——生成对抗网络(Generative Adversarial Network, GAN)实践详解生成对抗网络 (Generative Adversarial Network, GAN) 最早由 Ian Goodfellow 于 2014 年提出,其中“对抗”一词指的是两个神经网络之间在零和博弈框架下相互竞争的特性。生成器试图创建与真实样本无法区分的数据样本,而判别器则试图区分生成器生成的样本与真实样本。GAN 模型可以生成多种形式的内容,从几何形状和数字序列到高分辨率的彩色图像,甚至逼真的音乐作品。在本节中,我们将介绍 GAN 的理论基础。然后,介绍如何使用 PyTorch 从零开始构建 GAN,以
MocapLeader7 个月前
机器人·清华大学·生成模型·外骨骼机器人·中风康复·个性化中风康复方案·绳索牵引机器人
清华大学:基于生成模型的上肢外骨骼机器人助力个性化中风康复清华大学自动化系李翔老师团队针对上肢外骨骼机器人提出一种基于生成模型的轨迹优化框架,该框架能够生成高度个性化的运动轨迹并确保安全性,从而为中风患者提供个性化康复辅助训练。相关研究论文“Upper-limb rehabilitation with a dual-mode individualized exoskeleton robot: A generative-model-based solution”发表于机器人研究领域顶级期刊The International Journal of Robotics