技术栈
通用智能体
白熊188
19 天前
人工智能
·
算法
·
音视频
·
通用智能体
·
web search
【图像大模型】深度解析RIFE: 基于中间流估计的实时视频插帧算法
视频插帧(Video Frame Interpolation)是计算机视觉领域的重要研究方向,其核心目标是在现有视频帧之间生成中间帧以提升视频的流畅度。传统方法多基于光流估计(Optical Flow),但受限于光流计算的精度和效率。ECCV 2022最佳论文提名项目RIFE(Real-Time Intermediate Flow Estimation)提出了一种创新的实时视频插帧框架,在精度和速度上实现了突破性进展。
白熊188
21 天前
前端
·
人工智能
·
chrome
·
通用智能体
【通用智能体】Lynx :一款基于终端的纯文本网页浏览器
Lynx 是一款基于终端的纯文本网页浏览器,诞生于1992年,支持 HTTP、HTTPS、FTP 等协议,具有以下核心特性:
白熊188
21 天前
人工智能
·
音视频
·
通用智能体
·
web search
【图像大模型】ExVideo-SVD-128f:面向长视频生成的时空扩散模型深度解析
ExVideo-SVD-128f是基于Stable Video Diffusion(SVD)框架扩展的视频生成模型,通过创新的时空建模架构实现了128帧(约5秒@24fps)的长视频生成能力。相较于原始SVD模型的14帧生成限制,本项目在视频连贯性、运动一致性等方面实现了重大突破。
TechBeat人工智能社区
1 年前
机器学习
·
通用智能体
·
我的世界
·
模型架构
·
因果推理
视频中自监督学习:「我的世界」下指令理解与跟随
本文介绍了北京大学人工智能研究院梁一韬助理教授所带领的 CraftJarvis 团队在「我的世界」环境下探索通用智能体设计的新进展,题为“GROOT: Learning to Follow Instructions by Watching Gameplay Videos”。