人工智能应用-机器视觉:AI 鉴伪 06.人脸控制技术

展示了人脸控制的基本流程:首先,从"目标"图片或视频中提取出表情和动作特征,然后将这些特征应用到"源"图片中,从而生成具有相同表情和动作的图片或视频。

人脸控制伪造视频的示意图。图片来源:Zakharov 2019.

展示了一个人脸控制模型的结构。左上的"表情动作编码器"负责提取表情和动作特征,左下的"面容编码器"负责提取面部的外观特征。最后,右上的解码器将这两部分信息结合,生成带有表情和动作的合成图片或视频。

人脸控制模型结构图。图片来源:Zhang et al., 2019

相关推荐
Python私教1 分钟前
视觉 Agent 爬取 vs Playwright 脚本:Browser Use 2026 选型表
人工智能
Python私教4 分钟前
Crawlee StagehandCrawler:自然语言点 Load More 的工程化爬虫
人工智能
南屹川5 分钟前
【容器化】Docker实战:从入门到生产环境部署
人工智能
海蓝可知天湛27 分钟前
Agent&IELTS雅思口语专属语料库
人工智能·github·rag·ielts·skills
随身数智备忘录37 分钟前
什么是设备管理体系?设备管理体系包含哪些核心模块?
网络·数据库·人工智能
OpenBayes贝式计算44 分钟前
涵盖 OCR 与多轮对话:1.3B 端侧多模态模型 MiniCPM-V-4.6 正式发布;百万级智能体数据集 AgentTrove 开源!包含代码修复及数学求解
人工智能
189228048611 小时前
NY352固态MT29F32T08GWLBHD6-24QJ:B
大数据·服务器·人工智能·科技·缓存
南屹川1 小时前
【数据库】PostgreSQL实战:从基础到高级特性
人工智能
zhangxingchao1 小时前
多 Agent 架构到底怎么选?从 Claude Agent Teams、Cognition/Devin 到工程落地原则
前端·人工智能·后端
不开大的凯20771 小时前
麦当秀AiPPT战略转向:从SaaS订阅迈向Token经济,AI办公定价模式迎来新探索
大数据·人工智能