开源的自动驾驶视觉语言模型标注数据集

开源的自动驾驶视觉语言模型标注数据集

收集了一些关于vlm的开源数据集,供参考

开源项目列表

项目名称 描述 链接
VLM-R1 基于Qwen2.5-VL和R1强化学习技术的开源视觉语言模型,支持图像和文本的联合处理 GitHub - VLM-R1
VLMEvalKit 大型视觉语言模型的开源评估工具包,支持多种评估任务 GitHub - VLMEvalKit
SmolVLM 小巧、快速、内存高效的开源视觉语言模型,包含模型检查点、数据集和训练工具 Hugging Face - SmolVLM
Molmo VLM 开源视觉语言模型家族,适用于指向、计数、视觉问答等任务 Learn OpenCV - Molmo VLM
VisionArena-Battle 包含30K真实世界图像对话和偏好投票的标注数据集 Hugging Face - VisionArena-Battle
LlavaGuard 基于VLM的视觉保护框架,包含高质量人工标注的多模态安全数据集 arXiv - LlavaGuard
VLFeedback 开源的GPT-4V标注视觉语言偏好数据集,包含80K指令和多个大型视觉语言模型的响应 VLFeedback
Touch-Vision-Language Dataset 结合触觉、视觉和语言的多模态对齐数据集,包含43,741个图像-触觉对 Touch-Vision-Language Dataset
Prometheus-Vision 用于细粒度评估的视觉语言模型,模拟人类评估者和GPT-4V的反馈 Prometheus-Vision
SAIL-VL 通过高质量数据管理实现可扩展训练的开源视觉语言模型系列 arXiv - SAIL-VL

以上是关于自动驾驶视觉语言模型标注数据集的开源项目列表,每个项目都提供了不同的功能和数据集,适用于不同的研究和应用场景。

相关推荐
mm-q29152227297 小时前
【天野学院5期】 第5期易语言半内存辅助培训班,主讲游戏——手游:仙剑奇侠传4,端游:神魔大陆2
人工智能·算法·游戏
MoRanzhi12037 小时前
Python 实现:从数学模型到完整控制台版《2048》游戏
数据结构·python·算法·游戏·数学建模·矩阵·2048
2401_841495647 小时前
【数据结构】基于BF算法的树种病毒检测
java·数据结构·c++·python·算法·字符串·模式匹配
蒙奇D索大8 小时前
【算法】递归算法实战:汉诺塔问题详解与代码实现
c语言·考研·算法·面试·改行学it
一只鱼^_8 小时前
力扣第 474 场周赛
数据结构·算法·leetcode·贪心算法·逻辑回归·深度优先·启发式算法
叫我龙翔8 小时前
【数据结构】从零开始认识图论 --- 单源/多源最短路算法
数据结构·算法·图论
深圳佛手9 小时前
几种限流算法介绍和使用场景
网络·算法
陌路209 小时前
S14排序算法--基数排序
算法·排序算法
ysa0510309 小时前
虚拟位置映射(标签鸽
数据结构·c++·笔记·算法
Yue丶越9 小时前
【C语言】深入理解指针(二)
c语言·开发语言·数据结构·算法·排序算法