数据集

数据堂官方账号8 天前
人工智能·智能手机·重构·数据集·ai大模型·ai agent
数据驱动进化:AI Agent如何重构手机交互范式?如果说AIGC拉开了内容生成的序幕,那么AI Agent则标志着AI从“工具”向“助手”的跨越式进化。它不再是简单的问答机器,而是一个能够感知环境、规划任务并自主执行的智能体,更像是虚拟世界中的“全能员工”。
前网易架构师-高司机9 天前
yolo·数据集·停车场·车位·停车
停车场停车位数据集,标注停车位上是否有车,平均正确识别率99.5%,支持yolov5-11, coco json,darknet,xml格式标注停车场停车位数据集,标注停车位上是否有车,平均正确识别率98.0%,支持yolov5-11, coco json,darknet,xml格式标注
@HNUSTer14 天前
云计算·数据集·遥感大数据·gee·云平台
基于 GEE 的城市热岛效应分析——可视化地表温度 LST 与归一化植被指数 NDVI 的关联目录1 前言2 研究方法及数据处理3 完整代码4 运行结果随着全球气候变化的不断加剧,城市热岛效应逐渐成为了城市可持续发展中的重大挑战之一。城市热岛效应是指城市区域内由于人为活动、建筑材料、地面铺装方式等因素导致的温度明显高于周边郊区的现象。这种效应不仅对城市居民的舒适度造成了显著影响,还可能加剧能源消耗、空气污染,甚至对公共健康产生威胁。因此,研究城市地表温度(Land Surface Temperature,简称 LST)及其与归一化植被指数(Normalized Difference Vegetat
@HNUSTer15 天前
云计算·数据集·遥感大数据·gee·云平台
基于 GEE 利用 Sentinel-2 数据反演叶绿素与冠层水分含量目录1 数据加载与预处理2 叶绿素含量反演3 冠层水分反演4 数据可视化与导出5 完整代码6 运行结果
云卷云舒___________25 天前
人工智能·yolo·目标检测·数据集·ultralytics·小白教程·yolov12
【保姆级视频教程(二)】YOLOv12训练数据集构建:标签格式转换-划分-YAML 配置 避坑指南 | 小白也能轻松玩转目标检测!【2025全站首发】YOLOv12训练数据集构建:标签格式转换-划分-YAML 配置 避坑指南 | 小白也能轻松玩转目标检测!
@HNUSTer1 个月前
云计算·数据集·遥感大数据·gee·云平台
基于 GEE 计算研究区年均地表温度数据目录1 代码解析2 完整代码3 运行结果(1)定义研究区:(2)导入地表温度数据:本文采用的地表温度数据为MOD11A2 V6.1地表温度产品,其包含2000年至今全球的地表温度数据,时间分辨率为8天,空间分辨率为1km。
前网易架构师-高司机2 个月前
yolo·数据集·木材缺陷识别·木材表面缺陷
木材表面缺陷检测数据集,支持YOLO+COCO JSON+PASICAL VOC XML+DARKNET格式标注信息,平均正确识别率95.0%木材表面缺陷检测数据集是用于训练和验证人工智能算法,以帮助自动识别和检测木材表面的缺陷,如裂纹、疤痕、孔洞等。这对于木材行业非常重要,可以提高生产过程的效率和质量控制水平。
@HNUSTer2 个月前
云计算·数据集·遥感大数据·gee·云平台
基于 GEE 利用插值方法填补缺失影像目录1 完整代码2 运行结果利用GEE合成NDVI时,如果研究区较大,一个月的影像覆盖不了整个研究区,就会有缺失的地方,还有就是去云之后,有云量的地区变成空值。
@HNUSTer2 个月前
云计算·数据集·遥感大数据·gee·云平台
基于 GEE Landsat 与 Sentinel 数据的归一化水体指数 NDWI 计算和水体提取目录1 归一化水体指数(NDWI)2 完整代码3 运行结果4 运行结果可视化对比归一化水体指数(NDWI)是遥感影像分析中常用的指数,主要用于识别和提取水体。NDWI通过比较可见光波段(绿波段)与近红外波段(NIR)的反射率差异,突出水体与非水体区域的区别。水体在近红外波段的反射率较低,而在绿波段的反射率较高,因此NDWI能够有效地识别水域。该指数在水体监测、水资源管理以及环境变化研究中有着广泛应用。
狂小虎2 个月前
ubuntu·数据集·zenodo
Ubuntu下载zenodo文件Ubuntu download zenodo一般数据集文件会比较大,直接下载单个压缩包很慢。可以使用代码多线程下载小文件。Ubuntu22.04https://github.com/dvolgyes/zenodo_get
HyperAI超神经2 个月前
人工智能·深度学习·llm·html·数据集·多模态·gpt-4o
超越 GPT-4o!从 HTML 到 Markdown,一键整理复杂网页;AI 对话不再冰冷,大模型对话微调数据集让响应更流畅面对信息冗余的网页内容,如何快速提取全面的核心信息?Reader-LM 模型为你提供了专业的解决方案。Reader-LM 能高效处理高达 256K 字节的超长内容,精准将 HTML 转换为清晰的 Markdown 格式。它的表现甚至超过了 GPT-4o 等大型语言模型,其轻量化设计也使它更适合资源受限的场景。
HyperAI超神经2 个月前
人工智能·深度学习·机器学习·计算机视觉·3d·大模型·数据集
微软与腾讯技术交锋,TRELLIS引领3D生成领域多格式支持新方向去年 11 月,腾讯推出 Hunyuan3D 生成模型,是业界首个同时支持文字和图像生成 3D 的开源大模型。紧接着不到一个月,微软便发布了全新框架 TRELLIS,加入 3D 资产生成领域的竞争中。TRELLIS 支持多格式输出,包括辐射场、3D 高斯和网格,为不同需求提供最大灵活性。
小舞O_o3 个月前
人工智能·pytorch·python·分类·数据集
RP2K:一个面向细粒度图像的大规模零售商品数据集这是一种用于细粒度图像分类的新的大规模零售产品数据集。与以往专注于相对较少产品的数据集不同,我们收集了2000多种不同零售产品的35万张图像,这些图像直接在真实的零售商店的货架上拍摄。我们的数据集旨在推进零售对象识别的研究,该研究具有大量应用,如自动货架审计和基于图像的产品信息检索。我们的实验表明,即使是最先进的细粒度分类方法也没有优于简单的ResNet基线,这表明在细粒度零售产品分类任务上,提高分类性能的研究还有很大的潜在空间。我们的数据集具有以下特性:(1)就产品类别而言,它是迄今为止最大的数据集。(
weixin_468466853 个月前
深度学习·目标检测·数据集·图像分割·机器视觉·医学影像·ct影像
医学影像数据集汇总分享在深度学习领域,数据集的重要性不言而喻,因此本文对医学影像检测领域中公开的数据集进行了一个简要汇总,主要记录数据集的类型、数量等信息,并给出相应的下载地址。
数据岛4 个月前
大数据·数据分析·数据集·能源
大模型应用的数字能源数据集除了尚须时日的量子计算解决算力效率和能源问题,以及正在路上的超越transformer的全新模型架构外,无疑是“数据集”,准确讲是“高质量大规模多样性的数据集”。数据集是大模型发展的核心要素之一,是大计算的标的物,是实现大模型商业闭环的基础和牵引力,是实现大模型向具身智能演进的关键主线,也是大数据产业在大模型时代的新使命。
知来者逆4 个月前
人工智能·机器学习·机器人·数据集·大语言模型
Octo—— 基于80万个机器人轨迹的预训练数据集用于训练通用机器人,可在零次拍摄中解决各种任务论文地址:https://arxiv.org/abs/2405.12213 在机器人学中,通常使用针对特定机器人或任务收集的数据集来学习策略。然而,这种方法需要为每项任务收集大量数据,由此产生的策略只能实现有限的泛化性能。利用其他机器人和任务的经验可以获得更广泛的泛化性能,并在下游任务中获得更好的性能,但这需要考虑其他机器人的形态、传感器配置、任务规格和环境,因此建立一个能做到这一点的"通用机器人模型 "被认为是非常困难的任务。是一项非常艰巨的任务。
数据猎手小k4 个月前
人工智能·算法·3d·数据集·机器学习数据集·ai大模型应用
EmoAva:首个大规模、高质量的文本到3D表情映射数据集。2024-12-03,由哈尔滨工业大学(深圳)的计算机科学系联合澳门大学、新加坡南洋理工大学等机构创建了EmoAva数据集,这是首个大规模、高质量的文本到3D表情映射数据集,对于推动情感丰富的3D头像生成技术的发展具有重要意义。
数据猎手小k4 个月前
人工智能·语言模型·自然语言处理·数据集·机器学习数据集·ai大模型应用
GEOBench-VLM:专为地理空间任务设计的视觉-语言模型基准测试数据集2024-11-29 ,由穆罕默德·本·扎耶德人工智能大学等机构创建了GEOBench-VLM数据集,目的评估视觉-语言模型(VLM)在地理空间任务中的表现。该数据集的推出填补了现有基准测试在地理空间应用中的空白,提供了超过10,000个经过人工验证的指令,推动了环境监测、城市规划和灾害管理等领域的研究。
dundunmm4 个月前
论文阅读·数据挖掘·数据集·聚类·单细胞·细胞聚类·细胞测序
论文阅读之方法: Single-cell transcriptomics of 20 mouse organs creates a Tabula MurisThe Tabula Muris Consortium., Overall coordination., Logistical coordination. et al. Single-cell transcriptomics of 20 mouse organs creates a Tabula Muris. Nature 562, 367–372 (2018).
数据猎手小k4 个月前
人工智能·算法·数据集·音视频·机器学习数据集·ai大模型应用
BioDeepAV:一个多模态基准数据集,包含超过1600个深度伪造视频,用于评估深度伪造检测器在面对未知生成器时的性能。2024-11-29, 由罗马尼亚布加勒斯特大学创建BioDeepAV数据集,它专门设计来评估最先进的深度伪造检测器在面对未见过的深度伪造生成器时的泛化能力,这对于提高检测器的鲁棒性和适应性具有重要意义。