开源的自动驾驶视觉语言模型标注数据集

开源的自动驾驶视觉语言模型标注数据集

收集了一些关于vlm的开源数据集,供参考

开源项目列表

项目名称 描述 链接
VLM-R1 基于Qwen2.5-VL和R1强化学习技术的开源视觉语言模型,支持图像和文本的联合处理 GitHub - VLM-R1
VLMEvalKit 大型视觉语言模型的开源评估工具包,支持多种评估任务 GitHub - VLMEvalKit
SmolVLM 小巧、快速、内存高效的开源视觉语言模型,包含模型检查点、数据集和训练工具 Hugging Face - SmolVLM
Molmo VLM 开源视觉语言模型家族,适用于指向、计数、视觉问答等任务 Learn OpenCV - Molmo VLM
VisionArena-Battle 包含30K真实世界图像对话和偏好投票的标注数据集 Hugging Face - VisionArena-Battle
LlavaGuard 基于VLM的视觉保护框架,包含高质量人工标注的多模态安全数据集 arXiv - LlavaGuard
VLFeedback 开源的GPT-4V标注视觉语言偏好数据集,包含80K指令和多个大型视觉语言模型的响应 VLFeedback
Touch-Vision-Language Dataset 结合触觉、视觉和语言的多模态对齐数据集,包含43,741个图像-触觉对 Touch-Vision-Language Dataset
Prometheus-Vision 用于细粒度评估的视觉语言模型,模拟人类评估者和GPT-4V的反馈 Prometheus-Vision
SAIL-VL 通过高质量数据管理实现可扩展训练的开源视觉语言模型系列 arXiv - SAIL-VL

以上是关于自动驾驶视觉语言模型标注数据集的开源项目列表,每个项目都提供了不同的功能和数据集,适用于不同的研究和应用场景。

相关推荐
JieE21212 小时前
LeetCode 226. 翻转二叉树|JS 递归超详细拆解,二叉树入门经典题
javascript·算法
JieE21212 小时前
LeetCode 104. 二叉树的最大深度|递归思路超详细拆解
javascript·算法
vivo互联网技术17 小时前
CVPR 2026 | 全新强化学习框架 BeautyGRPO:重塑真实人像
算法·大模型·cvpr·影像
Darling噜啦啦18 小时前
列表转树算法深度解析:从 Map 到 Reduce 的两种实现,面试高频考点
数据结构·算法·面试
用户4978630507321 小时前
(一)小红的数组操作
算法·编程语言
怕浪猫1 天前
Electron 系列文章封面图
算法·架构·前端框架
徐小夕1 天前
JitWord 3.0 正式发布,高精度Word异构解析+复杂组件兼容,打造web端协同Word编辑器
前端·vue.js·算法
通信小呆呆2 天前
当算法有了“五感”:多模态数据融合如何向人体感官协同学习?
人工智能·学习·算法·机器学习·机器人
xiao5kou4chang6kai42 天前
MATLAB机器学习、深度学习--从数据预处理到模型训练
深度学习·机器学习·matlab·数据预处理