⭐CVPR2025 AKiRa:让视频生成玩转相机光学的黑科技[特殊字符]

📄论文题目:AKiRa: Augmentation Kit on Rays for optical video generation

✍️作者及机构:Xi Wang、Robin Courant、Marc Christie、Vicky Kalogeiton(法国巴黎综合理工学院、雷恩大学等)

🧩面临问题:当前文本条件视频扩散模型虽提升了视频质量,但在相机控制方面存在明显局限。多数方法仅简化考虑相机运动,忽略焦距(缩放)、镜头畸变(鱼眼效果)、光圈和焦点(景深)等关键光学参数1。同时,缺乏含丰富光学信息的训练数据,导致生成内容光学一致性不足,难以实现电影级叙事效果2。

🎯创新点及其具体研究方法:

1️⃣ 提出首个光学视频生成框架:实现对相机运动及光学参数(焦距、畸变、光圈等)的精细控制,可生成缩放、鱼眼、景深等复杂电影级效果3。方法上,在预训练视频生成骨干网络基础上,训练相机适配器,将光学参数整合到生成 pipeline 中,使模型直接利用相机和光学参数生成内容4。

2️⃣ 设计含光学参数的相机模型表示:基于 Plücker 坐标构建光线表示(方向和矩),编码焦距和镜头畸变信息;新增光圈图,关联每个像素与焦点的距离,建模景深效果,形成 9 维相机映射匹配视频帧维度56。

3️⃣ 提出 AKiRa 光线增强工具包:通过数据增强解决光学训练数据缺失问题。包括焦距增强(模拟缩放,区分于前后移动)、畸变增强(调整径向畸变系数并优化裁剪防黑边)、光圈增强(基于深度估计渲染景深效果),同时采用样条插值确保参数平滑过渡,避免闪烁78。

#CVPR 顶会 #视频生成 #计算机视觉 #深度学习 #相机控制 #光学视频生成 #AI 动画


相关推荐
cooldream20091 分钟前
小智 AI 智能音箱深度体验全解析:人设、音色、记忆与多场景玩法的全面指南
人工智能·嵌入式硬件·智能音箱
oil欧哟3 分钟前
AI 虚拟试穿实战,如何低成本生成模特上身图
人工智能·ai作画
小糖学代码27 分钟前
LLM系列:1.python入门:3.布尔型对象
linux·开发语言·python
央链知播34 分钟前
中国移联元宇宙与人工智能产业委联席秘书长叶毓睿受邀到北京联合大学做大模型智能体现状与趋势专题报告
人工智能·科技·业界资讯
人工智能培训39 分钟前
卷积神经网络(CNN)详细介绍及其原理详解(2)
人工智能·神经网络·cnn
Data_agent1 小时前
1688获得1688店铺详情API,python请求示例
开发语言·爬虫·python
懷淰メ1 小时前
【AI加持】基于PyQt5+YOLOv8+DeepSeek的输电隐患检测系统(详细介绍)
yolo·目标检测·计算机视觉·pyqt·deepseek·监测系统·输电隐患
YIN_尹1 小时前
目标检测模型量化加速在 openEuler 上的实现
人工智能·目标检测·计算机视觉
mys55182 小时前
杨建允:企业应对AI搜索趋势的实操策略
人工智能·geo·ai搜索优化·ai引擎优化
小毅&Nora2 小时前
【人工智能】【深度学习】 ⑦ 从零开始AI学习路径:从Python到大模型的实战指南
人工智能·深度学习·学习