机器学习数据集

数据猎手小k

FoMo 数据集是一个专注于机器人在季节性积雪变化环境中的导航数据集，记录了不同季节（无雪、浅雪、深雪）下的传感器数据和轨迹信息。2025-05-02，由加拿大拉瓦尔大学北方机器人实验室和多伦多大学机器人研究所联合创建的 FoMo 数据集，目的是研究机器人在季节性积雪变化环境中的导航能力。该数据集的意义在于填补了机器人在极端季节变化（如积雪深度变化）下的导航研究空白，为开发更可靠的机器人导航系统提供了宝贵的数据支持。

数据猎手小k

EmoAva:首个大规模、高质量的文本到3D表情映射数据集。2024-12-03，由哈尔滨工业大学（深圳）的计算机科学系联合澳门大学、新加坡南洋理工大学等机构创建了EmoAva数据集，这是首个大规模、高质量的文本到3D表情映射数据集，对于推动情感丰富的3D头像生成技术的发展具有重要意义。

数据猎手小k

GEOBench-VLM:专为地理空间任务设计的视觉-语言模型基准测试数据集2024-11-29 ,由穆罕默德·本·扎耶德人工智能大学等机构创建了GEOBench-VLM数据集，目的评估视觉-语言模型（VLM）在地理空间任务中的表现。该数据集的推出填补了现有基准测试在地理空间应用中的空白，提供了超过10,000个经过人工验证的指令，推动了环境监测、城市规划和灾害管理等领域的研究。

数据猎手小k

BioDeepAV：一个多模态基准数据集，包含超过1600个深度伪造视频，用于评估深度伪造检测器在面对未知生成器时的性能。2024-11-29, 由罗马尼亚布加勒斯特大学创建BioDeepAV数据集，它专门设计来评估最先进的深度伪造检测器在面对未见过的深度伪造生成器时的泛化能力，这对于提高检测器的鲁棒性和适应性具有重要意义。

数据猎手小k

HNTS-MRG 2024 Challenge：是一个包含200个头颈癌病例的磁共振图像及其标注的公开数据集，旨在推动AI在头颈癌放射治疗自动分割领域的研究。2024-11-28,由德克萨斯大学MD安德森癌症中心创建HNTS-MRG 2024 Challenge数据集，目的通过公开数据集推动自动分割算法的发展，这对于提高放射治疗的精确性和效率具有重要意义。

数据猎手小k

OSPTrack：一个包含多个生态系统中软件包执行时生成的静态和动态特征的标记数据集，用于识别开源软件中的恶意行为。2024-11-22 ，由格拉斯哥大学创建的OSPTrack数据集，目的是通过捕获在隔离环境中执行包和库时生成的特征，包括静态和动态特征，来识别开源软件（OSS）中的恶意指标，特别是在源代码访问受限时，支持在运行时高效检测方法。

数据猎手小k

FineTuneBench：由斯坦福大学创建，包含625个训练问题和1075个测试问题，覆盖4个领域。目的评估商业微调API在不同泛化任务中的知识注入能力。2024-11-11，由斯坦福大学创建的FineTuneBench数据集，揭示了商业大型语言模型（LLMs）微调API在新知识学习和现有知识更新方面的显著不足，这对于理解和改进LLMs的适应性和可靠性具有重要意义。

数据猎手小k

PCBS：由麻省理工学院和Google联合创建，揭示1.2M短文本间的相似性的大规模图聚类数据集。2024-11-15，由麻省理工学院和Google联合创建的ParClusterers Benchmark Suite (PCBS)数据集，为图聚类算法的评估带来了革命性的意义。这个数据集不仅规模宏大，包含1.2M短文本，而且通过精确的50-最近邻图构建，为聚类算法提供了一个真实且具有挑战性的测试平台，从而推动了图聚类技术的发展和优化。

数据猎手小k

DAHL：利用由跨越 29 个类别的 8,573 个问题组成的基准数据集，评估大型语言模型在生物医学领域长篇回答的事实准确性。2024-11-14，由首尔国立大学创建的DAHL数据集，为评估大型语言模型（LLMs）在生物医学领域长文本生成中的幻觉问题提供了一个重要的工具，这对于提高模型的准确性和可靠性具有重要意义。

数据猎手小k

CulturalBench ：一个旨在评估大型语言模型在全球不同文化背景下知识掌握情况的基准测试数据集2024-10-04，为了提升大型语言模型在不同文化背景下的实用性，华盛顿大学、艾伦人工智能研究所等机构联合创建了CulturalBench。这个数据集包含1,227个由人类编写和验证的问题，覆盖了包括被边缘化地区在内的45个全球区域。CulturalBench的推出，目的通过一个稳健、多样化且具有挑战性的基准测试，衡量并跟踪我们在提升LLMs文化知识方面的进步。

数据猎手小k

GS-Blur数据集：首个基于3D场景合成的156,209对多样化真实感模糊图像数据集。2024-10-31，由韩国首尔国立大学的研究团队创建的GS-Blur数据集，通过3D场景重建和相机视角移动合成了多样化的真实感模糊图像，为图像去模糊领域提供了一个大规模、高覆盖度的新工具，显著提升了去模糊算法在真实世界场景中的泛化能力。

我是有底线的