AI相机“妙鸭相机”原理分析和手动实现方案

妙鸭相机

一个通过上传大约20张照片,生成专属自拍。在2023年7月末爆火,根据36Kr报道,++妙鸭相机系阿里系产品,挂靠在阿里大文娱体系下,并非独立公司++¹。

使用方法是上传20张自拍照片,之后可以选择模板生成自己的AI艺术照
妙鸭相机模板库

原理分析

上传照片生成常见方案有两种,一种是垫图一次性生成,效果可控性差,但是比较简单,可以使用Midjourney等在线工具实现;另一种是跑模型,利用训练好的模型实现,可控性比较好,但是前期需要一定量的训练图片。

从要求 "上传20张照片" 行为来看,应该是采用的训练模型的办法,此方案无法一次性换多张人脸。

如果用户不愿意提供大量照片实际上还可以选择roop换脸插件的办法,效果比较差,但是这种方案支持多张人脸。

简单来说,作为开发者需要做的就是:

  1. 用户上传照片处理(统一切分人脸区域,改大小等方便跑模型)

  2. 利用stable diffusion跑模型,应该是Lora模型(根据时间推算)

  3. 利用生成好的模板特定区域局部重绘

  4. 抽卡,这一步可能存在人工干预,比如选择出比较好看的几个

手动实现

每一个步骤都有人写过了,直接整理下链接点着看吧~

炼丹步骤:Stable Diffusion Lora模型训练详细教程_AI算法-图哥的博客-CSDN博客

这里准备了一份可供训练的素材,禁止商用!

链接:https://pan.baidu.com/s/1PdF2ocgqOBtRmQqtmij6RA?pwd=bjf4

提取码:bjf4

生成模型之后局部重绘在图生图里面,参考:图生图---AI图片生成Stable Diffusion参数及使用方式详细介绍_Coding的叶子的博客-CSDN博客

信息溯源

1\] [花9.9买套AI写真,「妙鸭相机」正让海马体们失业 \| 产品观察-36氪 (36kr.com)](https://www.36kr.com/p/2354909204790024 "花9.9买套AI写真,「妙鸭相机」正让海马体们失业 | 产品观察-36氪 (36kr.com)")

相关推荐
小陈工30 分钟前
Python Web开发入门(十七):Vue.js与Python后端集成——让前后端真正“握手言和“
开发语言·前端·javascript·数据库·vue.js·人工智能·python
阿菜ACai4 小时前
Claude 和 Codex 在审计 Skill 上性能差异探究
ai·代码审计
墨染天姬5 小时前
【AI】端侧AIBOX可以部署哪些智能体
人工智能
AI成长日志5 小时前
【Agentic RL】1.1 什么是Agentic RL:从传统RL到智能体学习
人工智能·学习·算法
SharpCJ5 小时前
Android 开发者为什么必须掌握 AI 能力?端侧视角下的技术变革
android·ai·aigc
2501_948114245 小时前
2026年大模型API聚合平台技术评测:企业级接入层的治理演进与星链4SAPI架构观察
大数据·人工智能·gpt·架构·claude
小小工匠5 小时前
LLM - awesome-design-md 从 DESIGN.md 到“可对话的设计系统”:用纯文本驱动 AI 生成一致 UI 的新范式
人工智能·ui
黎阳之光5 小时前
黎阳之光:视频孪生领跑者,铸就中国数字科技全球竞争力
大数据·人工智能·算法·安全·数字孪生
小超同学你好5 小时前
面向 LLM 的程序设计 6:Tool Calling 的完整生命周期——从定义、决策、执行到观测回注
人工智能·语言模型
墨风如雪6 小时前
玩转本地 AI 的“第 0 步”:Node.js 环境保姆级安装教程
aigc