生成模型

大千AI助手6 天前
人工智能·深度学习·生成对抗网络·gan·生成模型·ian goodfellow·对抗训练
生成对抗网络(GAN):深度学习领域的革命性突破本文由「大千AI助手」原创发布,专注用真话讲AI,回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我,一起撕掉过度包装,学习真实的AI技术!
盼小辉丶10 天前
人工智能·pytorch·生成模型
PyTorch生成式人工智能——PatchGAN详解与实现在生成对抗网络 (Generative Adversarial Network, GAN) 的发展历程中,如何提升生成图像的细节质量一直是研究者关注的核心问题。传统的全局判别器往往过于关注图像的整体结构,而忽略了局部细节的真实性,导致生成的面部图像缺乏细腻的纹理特征。正是在这样的技术背景下,PatchGAN 作为一种创新的判别器架构脱颖而出。它通过将图像分割为多个局部区域并进行独立判别,极大地增强了对高频细节的感知能力。本节将深入探讨 PatchGAN 相关原理,并使用 PyTorch 从零开始实现 Pa
这张生成的图像能检测吗15 天前
图像处理·人工智能·机器学习·计算机视觉·生成模型·自回归模型
(论文速读)RandAR:突破传统限制的随机顺序图像自回归生成模型论文题目:RandAR: Decoder-only Autoregressive Visual Generation in Random Orders(随机顺序下仅解码器的自回归视觉生成)
盼小辉丶20 天前
pytorch·python·深度学习·生成模型
PyTorch生成式人工智能——使用MusicGen生成音乐大语言模型在许多领域都取得了巨大成功,除了生成文本和图像外,也可以将大模型(通常基于 Transformer )用于其他任务。例如,可以创建一个大音乐模型,接受文本提示作为输入,并生成音乐作为输出。MusicGen 是音乐生成大模型中的前沿代表,通过 audiocraft 库可以轻松使用 MusicGen。
盼小辉丶1 个月前
深度学习·tensorflow·生成模型
TensorFlow深度学习实战(28)——扩散模型(Diffusion Model)与生成对抗网络 (Generative Adversarial Network, GAN)一样,扩散模型是过去十年中最有影响力的生成模型技术之一。在许多基准测试中,当前的扩散模型已经超过了以往最先进的 GAN 模型,并迅速成为生成模型的首选。事实上,扩散来源于热力学扩散。同时,基于评分的生成模型领域(即能量模型)也取得了重要的进展,其直接估计对数分布的梯度(也称为评分函数),以训练模型。噪声条件得分网络 (Noise Conditional Score Network, NCSN) 使用多尺度噪声扰动应用
盼小辉丶1 个月前
深度学习·aigc·生成模型
生成模型实战 | GLOW详解与实现GLOW (Generative Flow) 是一种基于归一化流的生成模型,通过在每个流步骤中引入可逆的 1 × 1 卷积层,替代了 RealNVP 中通道翻转或固定置换的策略,从而使通道重排更具表达力,同时保持雅可比行列式和逆变换的高效计算能力。本文首先回顾归一化流与 RealNVP 的基本原理,接着剖析 GLOW 的四大核心模块:ActNorm、可逆 1×1 卷积、仿射耦合层和多尺度架构,随后基于 PyTorch 实现 GLOW 模型,并在 CIFAR-10 数据集上进行训练。
爱分享的飘哥1 个月前
人工智能·pytorch·python·aigc·教程·生成模型·代码实战
第三篇:VAE架构详解与PyTorch实现:从零构建AI的“视觉压缩引擎”在AI生成这条波澜壮阔的技术长河中,如果你想溯源而上,找到那个开启了“高清生成”时代的源头,那么VAE(Variational Autoencoder)无疑是那块最关键的“里程碑”。
CodeShare1 个月前
计算机视觉·生成模型·无监督学习
计算机视觉的未来方向:无监督学习与生成模型欧洲计算机视觉会议(ECCV)于周日开幕,与国际计算机视觉会议(ICCV)交替举办。原定今年在格拉斯哥举行的ECCV,与今年夏天大多数主要计算机科学会议一样,转为线上举行。
盼小辉丶3 个月前
pytorch·生成对抗网络·生成模型·生成式人工智能
PyTorch实战(7)——生成对抗网络(Generative Adversarial Network, GAN)实践详解生成对抗网络 (Generative Adversarial Network, GAN) 最早由 Ian Goodfellow 于 2014 年提出,其中“对抗”一词指的是两个神经网络之间在零和博弈框架下相互竞争的特性。生成器试图创建与真实样本无法区分的数据样本,而判别器则试图区分生成器生成的样本与真实样本。GAN 模型可以生成多种形式的内容,从几何形状和数字序列到高分辨率的彩色图像,甚至逼真的音乐作品。在本节中,我们将介绍 GAN 的理论基础。然后,介绍如何使用 PyTorch 从零开始构建 GAN,以
MocapLeader3 个月前
机器人·清华大学·生成模型·外骨骼机器人·中风康复·个性化中风康复方案·绳索牵引机器人
清华大学:基于生成模型的上肢外骨骼机器人助力个性化中风康复清华大学自动化系李翔老师团队针对上肢外骨骼机器人提出一种基于生成模型的轨迹优化框架,该框架能够生成高度个性化的运动轨迹并确保安全性,从而为中风患者提供个性化康复辅助训练。相关研究论文“Upper-limb rehabilitation with a dual-mode individualized exoskeleton robot: A generative-model-based solution”发表于机器人研究领域顶级期刊The International Journal of Robotics
Panesle4 个月前
人工智能·算法·机器学习·计算机视觉·开源·大模型·生成模型
Index-AniSora模型论文速读:基于人工反馈的动漫视频生成论文开头指出,尽管视频生成模型不断涌现,但动漫视频生成面临动漫数据稀缺和运动模式异常的挑战,导致生成视频存在运动失真和闪烁伪影等问题,难以满足人类偏好。现有奖励模型主要针对现实世界视频,无法捕捉动漫的独特外观和一致性要求。为此,作者提出利用人类反馈对动漫视频生成进行对齐的流程,包括构建首个动漫视频多维奖励数据集、开发AnimeReward奖励模型,以及引入Gap-Aware Preference Optimization(GAPO)训练方法,在实验中展示这些方法对提升动漫视频质量的有效性。
Panesle4 个月前
人工智能·开源·大模型·多模态·生成模型
开源的跨语言GUI元素理解8B大模型:AgentCPM-GUIAgentCPM-GUI 是由清华大学自然语言处理实验室 (THUNLP) 和 ModelBest 联合开发的开源大模型。该模型基于 MiniCPM-V 架构,拥有 80 亿参数规模,是一个能够直接在终端设备上运行的轻量化智能体。它创新性地将多模态输入与 GUI 操作相结合,主要面向移动终端应用交互场景,通过接收智能手机屏幕截图作为输入,自动执行用户指定的各类任务。这标志着智能体技术在移动端 GUI 操作领域迈出了重要一步,为后续研究和应用开发提供了新的思路。
Panesle4 个月前
人工智能·开源·大模型·文生视频·多模态·生成模型
阿里开源通义万相Wan2.1-VACE-14B:用于视频创建和编辑的一体化模型Wan2.1是一个全面且开放的视频基础模型套件,旨在突破视频生成的边界。该模型在多个基准测试中持续超越现有的开源模型和商业解决方案的性能。Wan2.1支持多种任务,包括文本到视频、图像到视频、视频编辑、文本到图像和视频到音频,推动了视频生成领域的发展。此外,Wan2.1还具备生成中英文文本的能力,极大增强了其实际应用价值。
每天都要写算法(努力版)4 个月前
人工智能·深度学习·神经网络·生成模型
【神经网络与深度学习】生成模型-单位高斯分布 Generating Models-unit Gaussian distribution在生成模型的研究与应用中,单位高斯分布(标准正态分布)作为数据采样的基础扮演着至关重要的角色。其数学特性、潜在空间的连续性、灵活性以及通用性,使得生成模型能够高效且稳定地学习和生成样本。本文将详细探讨从单位高斯分布获取数据点的核心原因,并通过目录结构提供清晰的逻辑框架。
每天都要写算法(努力版)4 个月前
人工智能·深度学习·神经网络·生成模型
【神经网络与深度学习】深度学习中的生成模型简介openai 的一个古早介绍深度学习中的生成模型能够学习数据分布并生成新数据,在人工智能的多个领域中都有重要应用。不同类型的生成模型在原理和结构上各有特点,适用于不同的任务,如图像生成、文本生成和时间序列预测等。本文将介绍几种常见的生成模型,并分析其核心特点和应用场景。
Nicolas8935 个月前
gpt·大模型·生成模型·生成式·判别式·监督生成式·无监督生成式
【大模型理论篇】关于生成式模型中联合分布概率学习必要性以及GPT是生成式模型的讨论之前我们在《生成式模型与判别式模型对比(涉及VAE、CRF的数学原理详述)》以及《生成式模型算法原理深入浅出(涉及Stable Diffusion、生成对抗网络、高斯混合模型、隐马尔可夫模型、朴素贝叶斯等算法原理分析及生成式模型解释)》中,我们对一些常见的算法做了分析。刚好最近和同事聊天,聊起生成式模型,这里做一些额外信息的补充。
JokerSZ.6 个月前
人工智能·深度学习·stable diffusion·生成模型
复现:latent diffusion(LDM)stable diffusion下载项目 https://github.com/CompVis/latent-diffusion然后运行环境配置:
PeterClerk6 个月前
人工智能·机器学习·聚类·生成模型·无监督学习·降维
机器学习-无监督学习总结无监督学习(Unsupervised Learning) 是机器学习中的一种范式,它在没有明确标注的数据上进行训练,旨在发现数据的潜在结构、模式或分布。常见的无监督学习任务包括聚类(Clustering)、降维(Dimensionality Reduction)、密度估计(Density Estimation) 和生成建模(Generative Modeling)。以下是无监督学习的关键方法和应用场景。
理论最高的吻1 年前
人工智能·神经网络·机器学习·生成模型·模型优化·数据表示·模糊逻辑系统
智能技术【机器学习】总结简述岭回归、Lasso、Elastic 之间的联系与区别? 答: 联系:   岭回归、Lasso 和 Elastic Net 都是用于线性回归的正则化方法,通过添加惩罚项来防止过拟合并提升模型的泛化能力。 区别:   ①岭回归通过在损失函数中添加 L2 正则化项来限制回归系数的大小。使用 L2 正则化,这意味着惩罚项是回归系数的平方和。岭回归不会导致系数完全为零,因此它不能用于特征选择。   ②Lasso 通过在损失函数中添加 L1 正则化项来约束回归系数。使用 L1 正则化,这意味着惩罚项是回归系数的绝