数据集

大千AI助手2 天前
人工智能·深度学习·数据集·fever·事实验证·事实抽取·虚假信息
FEVER数据集:事实验证任务的大规模基准与评估框架FEVER(Fact Extraction and VERification)由谢菲尔德大学与亚马逊剑桥研究院于2018年联合发布,是自然语言处理领域首个大规模事实验证基准数据集。其目标是为自动化事实核查系统提供标准化评估框架,解决互联网信息爆炸背景下的虚假新闻检测难题。数据集包含 185,445个人工标注的声明(claims),每个声明均基于维基百科页面生成,并标注其真实性标签及支持证据。
semantist@语校14 天前
人工智能·支持向量机·百度·ai·开源·prompt·数据集
面向向量检索的教育QA建模:九段日本文化研究所日本语学院的Prompt策略分析(6 / 500)系列说明 500 所日本语言学校结构化建模实战,第 6 篇。每篇拆解 1 所学校在 Prompt-QA 系统中的建模策略,分享工程经验,本项目持续在 Hugging Face 上同步更新,欢迎AI工程师们关注。
semantist@语校14 天前
数据结构·人工智能·ai·prompt·github·数据集·知识图谱
从Prompt到结构建模:如何以数据驱动重构日本语言学校体系?以国际日本语学院为例系列说明 500 所日本语言学校结构化建模实战,第 8 篇。每篇拆解 1 所学校在 Prompt-QA 系统中的建模策略,分享工程经验,本项目持续在 Hugging Face 上同步更新,欢迎AI工程师们关注。
semantist@语校19 天前
人工智能·百度·ai·语言模型·prompt·github·数据集
日本语言学校:签证制度类 Prompt 的结构整理路径与策略我们在构建语言留学语义系统的过程中,尝试以“签证风险”为例,探索如何让结构信息被更好地保留下来。本文不介绍 Prompt 本身,也不夸大其作用,而是希望借此与更多开发者交换看法,共同打磨适合中文生态的结构表达方式。
Listennnn20 天前
数据集
ScanNet数据集详解http://www.scan-net.org/ScanNet/https://github.com/ScanNet/ScanNet
前网易架构师-高司机21 天前
人工智能·手机·数据集
手机识别数据集,2628张原始图片,支持yolo,coco json,pasical voc xml等格式的标注本文提供手机识别数据集,2628张原始图片,支持yolo,coco json,pasical voc xml等格式的标注的数据集下载,下载地址在文末
HyperAI超神经24 天前
人工智能·数据挖掘·数据集·图像生成·医疗健康·在线教程·数学代码
OmniGen2 多模态推理×自我纠正双引擎,引领图像生成新范式;95 万分类标签!TreeOfLife-200M 解锁物种认知新维度近年来,生成式 AI 技术在图像领域取得显著突破,如 Stable Diffusion 系列、 DALL-E3 等模型通过扩散模型实现了高质量文本到图像生成。然而,这些模型缺乏视觉生成通用模型所需的全面感知理解和生成能力。 OmniGen 应运而生,基于扩散模型架构,为各种生成任务提供统一的解决方案,具备多任务处理能力,无需额外插件即可生成高质量图像。不可否认的是,该模型在多模态解耦与数据多样性方面仍存在局限。
zzc9211 个月前
人工智能·深度学习·数据集·标签·时频图·更正·白边
时频图数据集更正程序,去除坐标轴白边及调整对应的标签值当数据集是时频图时可能有一个尴尬的问题,就是数据集制作好后,发现有白边。其实这也不影响训练模型,可能对模型训练效果的影响也是微乎其微的,于是大多数情况我会选择直接用整张图片训练模型。但是,有的情况下,去掉白边模型训练效果好,不去白边模型某个类别效果就不好。比如图中的BPSK和Frank信号。
zzc9211 个月前
网络·matlab·数据集·无线信道·无线通信网络拓扑推理·多径效应
不同程度多径效应影响下的无线通信网络电磁信号仿真数据生成程序生成.mat数据:转换为PyG可用数据:
飞翔的佩奇2 个月前
python·yolo·计算机视觉·毕业设计·数据集·yolo11·石材实例分割系统
【完整源码+数据集+部署教程】石材实例分割系统源码和数据集:改进yolo11-CA-HSFPN研究背景与意义随着计算机视觉技术的快速发展,实例分割作为其中一个重要的研究方向,逐渐在多个领域中展现出其独特的应用价值。实例分割不仅能够对图像中的物体进行识别,还能精确地划分出每个物体的轮廓,这在许多实际应用中都具有重要意义。例如,在建筑行业中,石材的识别与分割对于材料的管理、施工进度的监控以及成本控制等方面都起着至关重要的作用。因此,开发一个高效的石材实例分割系统,能够有效提升相关行业的自动化水平和工作效率。
飞翔的佩奇2 个月前
python·yolo·计算机视觉·毕业设计·数据集·yolo11·安检爆炸物检测
【完整源码+数据集+部署教程】安检爆炸物检测系统源码和数据集:改进yolo11-REPVGGOREPA研究背景与意义随着全球安全形势的日益复杂,安检工作的重要性愈发凸显。特别是在公共场所和交通枢纽,如何有效地检测和识别潜在的爆炸物成为了一个亟待解决的技术难题。传统的安检手段往往依赖于人工检查和简单的物理检测,效率低下且容易受到人为因素的影响。因此,基于计算机视觉的自动化检测系统应运而生,成为提升安检效率和准确性的关键技术之一。
飞翔的佩奇2 个月前
python·yolo·计算机视觉·毕业设计·数据集·yolo11·甘蔗叶片病害检测
【完整源码+数据集+部署教程】甘蔗叶片病害检测系统源码和数据集:改进yolo11-GhostDynamicConv研究背景与意义甘蔗作为全球重要的经济作物之一,其产量和质量直接影响到糖业、酒业及生物能源等多个行业的发展。然而,甘蔗在生长过程中常常受到多种病害的侵袭,尤其是叶片病害,这不仅会导致产量下降,还会影响甘蔗的糖分含量和品质。因此,及时、准确地检测和识别甘蔗叶片病害,对于保障甘蔗的健康生长和提高经济效益具有重要意义。
丁先生qaq2 个月前
人工智能·计算机视觉·目标跟踪·数据集
热成像实例分割电力设备数据集(3类,838张)在现代电力系统的运维管理中,红外热成像已经成为检测设备隐患、预防故障的重要手段。相比传统可见光图像,红外图像可揭示设备温度分布,从而更直观地反映过热、老化等问题。而在AI赋能下,通过实例分割技术对热成像中的电力设备进行精细识别与区域分割,为智能巡检系统提供了关键能力支持。
极智视界2 个月前
人工智能·yolo·数据集·分类算法·数据标注·classification·分类数据集
分类场景数据集大全「包含数据标注+训练脚本」 (持续原地更新)一、作者介绍:六年+算法开发经验、AI 算法经理、阿里云专家博主。擅长:检测、分割、理解、大模型 等算法训练与推理部署任务。
Json____2 个月前
人工智能·数据集·知识库·ai训练·智能体·ai智能体·ai模型
服装产品属性描述数据集(19197条),AI智能体知识库收集~今天再来分享一个关于服装产品属性描述数据集!可用户AI训练,AI智能体知识库! 一、数据集介绍 电商文案优化 / 属性智能识别 / 服装产品描述数据训练首选资源
西京刀客2 个月前
python·json·数据集·pandas·模型训练·datasets
python常用库-pandas、Hugging Face的datasets库(大模型之JSONL(JSON Lines))在当今的数据交换领域,各种格式层出不穷,其中 Comma Separated Values(CSV)格式作为一种常见的数据交换格式,被广泛用于表示具有相同字段列表的记录集。而 JavaScript Object Notation(JSON)则已成为事实上的数据交换格式标准,取代了曾在 21 世纪初备受瞩目的 XML。JSON 不仅具有自我描述性,而且易于人类阅读。
howard20052 个月前
数据集·spark sql·数据帧
4.1.1 Spark SQL概述Spark SQL是Apache Spark的一个模块,专门用于处理结构化数据。它引入了DataFrame这一编程抽象,DataFrame是带有Schema信息的分布式数据集合,类似于关系型数据库中的表。用户可以通过SQL、DataFrames API和Datasets API三种方式操作结构化数据。Spark SQL的发展经历了从Hive on Spark到Shark,再到完全独立的Spark SQL的过程,不断优化性能和功能。DataFrame在Spark 1.3.0版本之前被称为SchemaRDD,
玩电脑的辣条哥3 个月前
lora·微调·数据集
什么是alpaca 或 sharegpt 格式的数据集?LLaMA-Factoryalpaca 或 sharegpt 格式的数据集?“Alpaca”和“ShareGPT”格式的数据集,是近年来在开源大语言模型微调和对话数据构建领域比较流行的两种格式。它们主要用于训练和微调以生成对话或指令驱动的模型。下面我详细介绍两者的特点和示例格式。
地理探险家3 个月前
数据库·数据集·数据·nba·赛季
各类有关NBA数据统计数据集大合集这些数据我已上传大家在CSDN上直接搜索就可以!一、【2022-2023 NBA球员统计】数据集 关键词: 篮球 描述: 语境
数据猎手小k3 个月前
机器人·数据集·传感器·机器人导航·机器学习数据集
FoMo 数据集是一个专注于机器人在季节性积雪变化环境中的导航数据集,记录了不同季节(无雪、浅雪、深雪)下的传感器数据和轨迹信息。2025-05-02,由加拿大拉瓦尔大学北方机器人实验室和多伦多大学机器人研究所联合创建的 FoMo 数据集,目的是研究机器人在季节性积雪变化环境中的导航能力。该数据集的意义在于填补了机器人在极端季节变化(如积雪深度变化)下的导航研究空白,为开发更可靠的机器人导航系统提供了宝贵的数据支持。