开源的自动驾驶视觉语言模型标注数据集

开源的自动驾驶视觉语言模型标注数据集

收集了一些关于vlm的开源数据集,供参考

开源项目列表

项目名称 描述 链接
VLM-R1 基于Qwen2.5-VL和R1强化学习技术的开源视觉语言模型,支持图像和文本的联合处理 GitHub - VLM-R1
VLMEvalKit 大型视觉语言模型的开源评估工具包,支持多种评估任务 GitHub - VLMEvalKit
SmolVLM 小巧、快速、内存高效的开源视觉语言模型,包含模型检查点、数据集和训练工具 Hugging Face - SmolVLM
Molmo VLM 开源视觉语言模型家族,适用于指向、计数、视觉问答等任务 Learn OpenCV - Molmo VLM
VisionArena-Battle 包含30K真实世界图像对话和偏好投票的标注数据集 Hugging Face - VisionArena-Battle
LlavaGuard 基于VLM的视觉保护框架,包含高质量人工标注的多模态安全数据集 arXiv - LlavaGuard
VLFeedback 开源的GPT-4V标注视觉语言偏好数据集,包含80K指令和多个大型视觉语言模型的响应 VLFeedback
Touch-Vision-Language Dataset 结合触觉、视觉和语言的多模态对齐数据集,包含43,741个图像-触觉对 Touch-Vision-Language Dataset
Prometheus-Vision 用于细粒度评估的视觉语言模型,模拟人类评估者和GPT-4V的反馈 Prometheus-Vision
SAIL-VL 通过高质量数据管理实现可扩展训练的开源视觉语言模型系列 arXiv - SAIL-VL

以上是关于自动驾驶视觉语言模型标注数据集的开源项目列表,每个项目都提供了不同的功能和数据集,适用于不同的研究和应用场景。

相关推荐
steven_yzx6 分钟前
自动驾驶相机坐标系转换
人工智能·数码相机·自动驾驶
硅谷秋水10 分钟前
《自动驾驶系统开发》英文版《Autonomous Driving Hanbook》推荐
人工智能·深度学习·机器学习·计算机视觉·语言模型·自动驾驶
shehuiyuelaiyuehao22 分钟前
算法14,滑动窗口,找到字符串中所有字母异位词
算法
凯瑟琳.奥古斯特23 分钟前
图论核心考点精讲
开发语言·数据结构·算法·排序算法·哈希算法
steven_yzx28 分钟前
自动驾驶相机坐标系转换2
人工智能·数码相机·自动驾驶
WolfGang00732129 分钟前
代码随想录算法训练营 Day49 | 图论 part07
算法·图论
啦啦啦_999929 分钟前
案例之 逻辑回归_癌症预测
算法·机器学习·逻辑回归
StockTV32 分钟前
韩国股票实时数据 KOSPI(主板)和 KOSDAQ(创业板)的实时行情、K 线及指数数据
java·开发语言·算法·php
惊鸿一博33 分钟前
自动驾驶_一段式端到端_三条技术路线_UniAD_SparseDrive_概述
人工智能·机器学习·自动驾驶
byte轻骑兵34 分钟前
【LE Audio】BASS精讲[5]: 状态特征解析,广播接收状态实时可视全流程
人工智能·算法·音视频·语音识别·le audio·低功耗音频