CVPR 2024 图像、视频处理总汇(视频字幕、图像超分辨率、图像分类和压缩等)

1、Image/Video Captioning(图像/视频字幕)

2、Image/Video Compression(图像/视频压缩)

3、Image/Video Super-Resolution(图像超分辨率)

4、Image Classification(图像分类)

相关推荐
双翌视觉20 分钟前
机器视觉对位中的常见模型与技术原理
数码相机·计算机视觉·机器视觉
旷世奇才李先生32 分钟前
Pillow 安装使用教程
深度学习·microsoft·pillow
PyAIExplorer1 小时前
基于 OpenCV 的图像 ROI 切割实现
人工智能·opencv·计算机视觉
acstdm4 小时前
DAY 48 CBAM注意力
人工智能·深度学习·机器学习
澪-sl4 小时前
基于CNN的人脸关键点检测
人工智能·深度学习·神经网络·计算机视觉·cnn·视觉检测·卷积神经网络
羊小猪~~4 小时前
数据库学习笔记(十七)--触发器的使用
数据库·人工智能·后端·sql·深度学习·mysql·考研
视觉语言导航6 小时前
RAL-2025 | 清华大学数字孪生驱动的机器人视觉导航!VR-Robo:面向视觉机器人导航与运动的现实-模拟-现实框架
人工智能·深度学习·机器人·具身智能
羊小猪~~8 小时前
【NLP入门系列五】中文文本分类案例
人工智能·深度学习·考研·机器学习·自然语言处理·分类·数据挖掘
李师兄说大模型8 小时前
KDD 2025 | 地理定位中的群体智能:一个多智能体大型视觉语言模型协同框架
人工智能·深度学习·机器学习·语言模型·自然语言处理·大模型·deepseek
静心问道8 小时前
SqueezeBERT:计算机视觉能为自然语言处理在高效神经网络方面带来哪些启示?
人工智能·计算机视觉·自然语言处理