AI相机“妙鸭相机”原理分析和手动实现方案

妙鸭相机

一个通过上传大约20张照片,生成专属自拍。在2023年7月末爆火,根据36Kr报道,++妙鸭相机系阿里系产品,挂靠在阿里大文娱体系下,并非独立公司++¹。

使用方法是上传20张自拍照片,之后可以选择模板生成自己的AI艺术照
妙鸭相机模板库

原理分析

上传照片生成常见方案有两种,一种是垫图一次性生成,效果可控性差,但是比较简单,可以使用Midjourney等在线工具实现;另一种是跑模型,利用训练好的模型实现,可控性比较好,但是前期需要一定量的训练图片。

从要求 "上传20张照片" 行为来看,应该是采用的训练模型的办法,此方案无法一次性换多张人脸。

如果用户不愿意提供大量照片实际上还可以选择roop换脸插件的办法,效果比较差,但是这种方案支持多张人脸。

简单来说,作为开发者需要做的就是:

  1. 用户上传照片处理(统一切分人脸区域,改大小等方便跑模型)

  2. 利用stable diffusion跑模型,应该是Lora模型(根据时间推算)

  3. 利用生成好的模板特定区域局部重绘

  4. 抽卡,这一步可能存在人工干预,比如选择出比较好看的几个

手动实现

每一个步骤都有人写过了,直接整理下链接点着看吧~

炼丹步骤:Stable Diffusion Lora模型训练详细教程_AI算法-图哥的博客-CSDN博客

这里准备了一份可供训练的素材,禁止商用!

链接:https://pan.baidu.com/s/1PdF2ocgqOBtRmQqtmij6RA?pwd=bjf4

提取码:bjf4

生成模型之后局部重绘在图生图里面,参考:图生图---AI图片生成Stable Diffusion参数及使用方式详细介绍_Coding的叶子的博客-CSDN博客

信息溯源

1\] [花9.9买套AI写真,「妙鸭相机」正让海马体们失业 \| 产品观察-36氪 (36kr.com)](https://www.36kr.com/p/2354909204790024 "花9.9买套AI写真,「妙鸭相机」正让海马体们失业 | 产品观察-36氪 (36kr.com)")

相关推荐
NAGNIP10 小时前
一文搞懂深度学习中的通用逼近定理!
人工智能·算法·面试
冬奇Lab11 小时前
一天一个开源项目(第36篇):EverMemOS - 跨 LLM 与平台的长时记忆 OS,让 Agent 会记忆更会推理
人工智能·开源·资讯
冬奇Lab11 小时前
OpenClaw 源码深度解析(一):Gateway——为什么需要一个"中枢"
人工智能·开源·源码阅读
哥不是小萝莉12 小时前
OpenClaw 架构设计全解析
ai
AngelPP15 小时前
OpenClaw 架构深度解析:如何把 AI 助手搬到你的个人设备上
人工智能
宅小年15 小时前
Claude Code 换成了Kimi K2.5后,我再也回不去了
人工智能·ai编程·claude
小碗细面15 小时前
告别手动喂饭!Skill-Seekers 快速构建你的 AI 专属知识库
aigc·ai编程
九狼15 小时前
Flutter URL Scheme 跨平台跳转
人工智能·flutter·github
ZFSS15 小时前
Kimi Chat Completion API 申请及使用
前端·人工智能
warm3snow15 小时前
Claude Code 黑客马拉松:5 个获奖项目,没有一个是"纯码农"做的
ai·大模型·llm·agent·skill·mcp