AI相机“妙鸭相机”原理分析和手动实现方案

妙鸭相机

一个通过上传大约20张照片,生成专属自拍。在2023年7月末爆火,根据36Kr报道,++妙鸭相机系阿里系产品,挂靠在阿里大文娱体系下,并非独立公司++¹。

使用方法是上传20张自拍照片,之后可以选择模板生成自己的AI艺术照
妙鸭相机模板库

原理分析

上传照片生成常见方案有两种,一种是垫图一次性生成,效果可控性差,但是比较简单,可以使用Midjourney等在线工具实现;另一种是跑模型,利用训练好的模型实现,可控性比较好,但是前期需要一定量的训练图片。

从要求 "上传20张照片" 行为来看,应该是采用的训练模型的办法,此方案无法一次性换多张人脸。

如果用户不愿意提供大量照片实际上还可以选择roop换脸插件的办法,效果比较差,但是这种方案支持多张人脸。

简单来说,作为开发者需要做的就是:

  1. 用户上传照片处理(统一切分人脸区域,改大小等方便跑模型)

  2. 利用stable diffusion跑模型,应该是Lora模型(根据时间推算)

  3. 利用生成好的模板特定区域局部重绘

  4. 抽卡,这一步可能存在人工干预,比如选择出比较好看的几个

手动实现

每一个步骤都有人写过了,直接整理下链接点着看吧~

炼丹步骤:Stable Diffusion Lora模型训练详细教程_AI算法-图哥的博客-CSDN博客

这里准备了一份可供训练的素材,禁止商用!

链接:https://pan.baidu.com/s/1PdF2ocgqOBtRmQqtmij6RA?pwd=bjf4

提取码:bjf4

生成模型之后局部重绘在图生图里面,参考:图生图---AI图片生成Stable Diffusion参数及使用方式详细介绍_Coding的叶子的博客-CSDN博客

信息溯源

1\] [花9.9买套AI写真,「妙鸭相机」正让海马体们失业 \| 产品观察-36氪 (36kr.com)](https://www.36kr.com/p/2354909204790024 "花9.9买套AI写真,「妙鸭相机」正让海马体们失业 | 产品观察-36氪 (36kr.com)")

相关推荐
流光容易把人抛10 小时前
Claude Code & CCSwitch Mac 安装配置详细教程
人工智能
ai产品老杨10 小时前
突破品牌壁垒:基于 GB28181 与 RTSP 的异构 AI 视频平台架构深度解析(支持 Docker 与源码交付)
人工智能·架构·音视频
科研前沿10 小时前
多视角相机驱动的室内人员空间定位技术白皮书
大数据·人工智能·python·科技·数码相机·音视频
得一录10 小时前
大模型需要量化的原因
人工智能
weixin_4171970510 小时前
四大科技巨头狂砸7250亿美元:AI算力军备竞赛白热化
人工智能·科技
太阳上的雨天10 小时前
AI学习ing~
学习·ai·ai编程
sali-tec10 小时前
C# 基于OpenCv的视觉工作流-章61-点线距离
图像处理·人工智能·opencv·计算机视觉
人工智能AI技术10 小时前
闭环执行基础:思考→行动→观察→反思完整链路
人工智能
罗西的思考10 小时前
【GUI-Agent】阿里通义MAI-UI 代码阅读(1)— 总体
人工智能·机器学习·ui·transformer