开源的自动驾驶视觉语言模型标注数据集

开源的自动驾驶视觉语言模型标注数据集

收集了一些关于vlm的开源数据集,供参考

开源项目列表

项目名称 描述 链接
VLM-R1 基于Qwen2.5-VL和R1强化学习技术的开源视觉语言模型,支持图像和文本的联合处理 GitHub - VLM-R1
VLMEvalKit 大型视觉语言模型的开源评估工具包,支持多种评估任务 GitHub - VLMEvalKit
SmolVLM 小巧、快速、内存高效的开源视觉语言模型,包含模型检查点、数据集和训练工具 Hugging Face - SmolVLM
Molmo VLM 开源视觉语言模型家族,适用于指向、计数、视觉问答等任务 Learn OpenCV - Molmo VLM
VisionArena-Battle 包含30K真实世界图像对话和偏好投票的标注数据集 Hugging Face - VisionArena-Battle
LlavaGuard 基于VLM的视觉保护框架,包含高质量人工标注的多模态安全数据集 arXiv - LlavaGuard
VLFeedback 开源的GPT-4V标注视觉语言偏好数据集,包含80K指令和多个大型视觉语言模型的响应 VLFeedback
Touch-Vision-Language Dataset 结合触觉、视觉和语言的多模态对齐数据集,包含43,741个图像-触觉对 Touch-Vision-Language Dataset
Prometheus-Vision 用于细粒度评估的视觉语言模型,模拟人类评估者和GPT-4V的反馈 Prometheus-Vision
SAIL-VL 通过高质量数据管理实现可扩展训练的开源视觉语言模型系列 arXiv - SAIL-VL

以上是关于自动驾驶视觉语言模型标注数据集的开源项目列表,每个项目都提供了不同的功能和数据集,适用于不同的研究和应用场景。

相关推荐
Godspeed Zhao37 分钟前
自动驾驶中的传感器技术24.3——Camera(18)
人工智能·机器学习·自动驾驶
数研小生3 小时前
构建命令行单词记忆工具:JSON 词库与艾宾浩斯复习算法的完美结合
算法·json
芒克芒克3 小时前
LeetCode 题解:除自身以外数组的乘积
算法·leetcode
Python 老手4 小时前
Python while 循环 极简核心讲解
java·python·算法
@Aurora.4 小时前
优选算法【专题九:哈希表】
算法·哈希算法·散列表
爱看科技4 小时前
微美全息(NASDAQ:WIMI)研究拜占庭容错联邦学习算法,数据安全与隐私保护的双重保障
算法
qq_417129254 小时前
C++中的桥接模式变体
开发语言·c++·算法
我有医保我先冲5 小时前
AI 时代 “任务完成“ 与 “专业能力“ 的区分:理论基础、行业影响与个人发展策略
人工智能·python·机器学习
YuTaoShao5 小时前
【LeetCode 每日一题】3010. 将数组分成最小总代价的子数组 I——(解法二)排序
算法·leetcode·排序算法
吴维炜6 小时前
「Python算法」计费引擎系统SKILL.md
python·算法·agent·skill.md·vb coding