AI相机“妙鸭相机”原理分析和手动实现方案

妙鸭相机

一个通过上传大约20张照片,生成专属自拍。在2023年7月末爆火,根据36Kr报道,++妙鸭相机系阿里系产品,挂靠在阿里大文娱体系下,并非独立公司++¹。

使用方法是上传20张自拍照片,之后可以选择模板生成自己的AI艺术照
妙鸭相机模板库

原理分析

上传照片生成常见方案有两种,一种是垫图一次性生成,效果可控性差,但是比较简单,可以使用Midjourney等在线工具实现;另一种是跑模型,利用训练好的模型实现,可控性比较好,但是前期需要一定量的训练图片。

从要求 "上传20张照片" 行为来看,应该是采用的训练模型的办法,此方案无法一次性换多张人脸。

如果用户不愿意提供大量照片实际上还可以选择roop换脸插件的办法,效果比较差,但是这种方案支持多张人脸。

简单来说,作为开发者需要做的就是:

  1. 用户上传照片处理(统一切分人脸区域,改大小等方便跑模型)

  2. 利用stable diffusion跑模型,应该是Lora模型(根据时间推算)

  3. 利用生成好的模板特定区域局部重绘

  4. 抽卡,这一步可能存在人工干预,比如选择出比较好看的几个

手动实现

每一个步骤都有人写过了,直接整理下链接点着看吧~

炼丹步骤:Stable Diffusion Lora模型训练详细教程_AI算法-图哥的博客-CSDN博客

这里准备了一份可供训练的素材,禁止商用!

链接:https://pan.baidu.com/s/1PdF2ocgqOBtRmQqtmij6RA?pwd=bjf4

提取码:bjf4

生成模型之后局部重绘在图生图里面,参考:图生图---AI图片生成Stable Diffusion参数及使用方式详细介绍_Coding的叶子的博客-CSDN博客

信息溯源

1\] [花9.9买套AI写真,「妙鸭相机」正让海马体们失业 \| 产品观察-36氪 (36kr.com)](https://www.36kr.com/p/2354909204790024 "花9.9买套AI写真,「妙鸭相机」正让海马体们失业 | 产品观察-36氪 (36kr.com)")

相关推荐
彷徨的蜗牛1 天前
智能AI自动化协同发文系统架构设计:从理论到实践的完整指南
人工智能·系统架构·自动化
许国栋_1 天前
B2B企业如何建设价值管理办公室(VMO)?实践与落地解析
人工智能·安全·云计算·产品经理
一RTOS一1 天前
从PLC到机器人:实时操作系统如何决定能力上限
人工智能·机器人·鸿道操作系统·鸿道实时操作系统·国产嵌入式操作系统选型·鸿道机器人操作系统
bennybi1 天前
Openclaw 实践笔记
笔记·ai·openclaw
AI视觉网奇1 天前
aigc 生成几何图 整理笔记
笔记·aigc
大傻^1 天前
Spring AI 2.0 企业级 RAG 架构:混合检索、重排序与多模态知识库
人工智能·spring·架构·多模态·rag·混合检索·重排序
yiyu07161 天前
3分钟搞懂深度学习AI:实操篇:Attention
人工智能·深度学习
大傻^1 天前
Spring AI 2.0 多模型提供商配置:OpenAI、Gemini、Anthropic 与 Ollama 深度集成
java·人工智能·spring·springai
熊猫钓鱼>_>1 天前
AI语料投毒与信息证伪:当生成式引擎成为攻击向量
人工智能·ai·agent·geo·skills·agent skills·openclaw
热爱生活的猴子1 天前
RoBERTa 分类模型正则化调优实验——即dropout和冻结层对过拟合的影响
人工智能·深度学习·分类·数据挖掘·nlp