AI相机“妙鸭相机”原理分析和手动实现方案

妙鸭相机

一个通过上传大约20张照片,生成专属自拍。在2023年7月末爆火,根据36Kr报道,++妙鸭相机系阿里系产品,挂靠在阿里大文娱体系下,并非独立公司++¹。

使用方法是上传20张自拍照片,之后可以选择模板生成自己的AI艺术照
妙鸭相机模板库

原理分析

上传照片生成常见方案有两种,一种是垫图一次性生成,效果可控性差,但是比较简单,可以使用Midjourney等在线工具实现;另一种是跑模型,利用训练好的模型实现,可控性比较好,但是前期需要一定量的训练图片。

从要求 "上传20张照片" 行为来看,应该是采用的训练模型的办法,此方案无法一次性换多张人脸。

如果用户不愿意提供大量照片实际上还可以选择roop换脸插件的办法,效果比较差,但是这种方案支持多张人脸。

简单来说,作为开发者需要做的就是:

  1. 用户上传照片处理(统一切分人脸区域,改大小等方便跑模型)

  2. 利用stable diffusion跑模型,应该是Lora模型(根据时间推算)

  3. 利用生成好的模板特定区域局部重绘

  4. 抽卡,这一步可能存在人工干预,比如选择出比较好看的几个

手动实现

每一个步骤都有人写过了,直接整理下链接点着看吧~

炼丹步骤:Stable Diffusion Lora模型训练详细教程_AI算法-图哥的博客-CSDN博客

这里准备了一份可供训练的素材,禁止商用!

链接:https://pan.baidu.com/s/1PdF2ocgqOBtRmQqtmij6RA?pwd=bjf4

提取码:bjf4

生成模型之后局部重绘在图生图里面,参考:图生图---AI图片生成Stable Diffusion参数及使用方式详细介绍_Coding的叶子的博客-CSDN博客

信息溯源

1 花9.9买套AI写真,「妙鸭相机」正让海马体们失业 | 产品观察-36氪 (36kr.com)

相关推荐
IT_陈寒9 小时前
为什么 Java 的 Optional 让我调试到深夜?
前端·人工智能·后端
有为少年9 小时前
深度隐式层 | 隐式函数与自动微分
人工智能·神经网络·线性代数·机器学习·矩阵
大模型真好玩9 小时前
大模型训练全流程实战指南工具篇(十三)—— 大模型评测实战(数据集评测+自动化评测)
人工智能·agent·deepseek
ShGamu9 小时前
2026上半年链条输送机厂家全流程服务与选型参考
大数据·人工智能·链条输送机
charley.layabox9 小时前
大连理工,将 LayaAir AI 游戏设计带进校园
人工智能·游戏
小虎AI生活9 小时前
WorkBuddy 直接把 ima 知识库内置了,这件事比你想的大
aigc·ai编程
Raink老师9 小时前
【AI面试临阵磨枪-76】社交 AI:内容生成、审核、智能回复、多模态理解、安全治理
人工智能·安全·面试
装不满的克莱因瓶9 小时前
SpringAI Alibaba Tool工具调用机制实战-注解注册与函数调用全流程
人工智能·ai·tools·智能体·springai·tool
ZhengEnCi9 小时前
09ab-无偏置线性层是什么?
人工智能
Lkstar9 小时前
Transformer 核心机制拆解:自注意力、多头注意力、位置编码,一篇讲透
人工智能