kaggle新赛:UBC卵巢癌亚型分类和异常检测大赛【图像分类】

**赛题名称:**UBC Ovarian Cancer Subtype Classification and Outlier Detection (UBC-OCEAN)

**赛题链接:**https://www.kaggle.com/competitions/UBC-OCEAN

赛题背景

卵巢癌是女性生殖系统最致命的癌症。目前,卵巢癌诊断依赖病理学家评估亚型。然而,这带来了几个挑战,包括观察者之间的分歧和诊断的可重复性。此外,医疗不发达的社区通常缺乏专科病理学家,即使是发达社区也面临缺乏妇科肿瘤专业知识的病理学家的短缺。

深度学习模型在分析组织病理学图像方面展现出了显著的能力。然而目前仍然存在挑战,例如需要大量的训练数据,理想情况下来自单一来源。技术、伦理和财务限制以及保密问题使培训成为一项挑战。

赛题任务

UBC卵巢癌亚型分类和异常检测(UBC-OCEAN)比赛的目的是对卵巢癌亚型进行分类,参赛者将在世界上最广泛的卵巢癌组织病理学图像数据集上训练模型,这些图像来自超过20个医疗中心。

参赛者的工作可以提高识别卵巢癌亚型的准确性,更好的分类将使临床医生能够制定个性化的治疗策略,而不受地理位置的限制。这种有针对性的方法有可能提高治疗效果,减少不良反应,并最终为患者带来更好的结果。

评价指标

提交内容使用balanced accuracy进行评估。

提交文件

对测试集中的每个image_id,参赛者必须为label变量预测一个类。该文件应包含一个标题并采用以下格式:

复制代码
image_id,label
2,CC
5,EC
6,HGSC
etc.

数据描述

参赛者在本次竞赛中的挑战是从活检样本的显微镜扫描中分类卵巢癌的类型。

本次竞赛使用隐藏测试。当提交的笔记本被评分时,将提供实际的测试数据(包括完整的样本提交)。由于数据集的大小,训练图像将不会被提供。

文件

[train/test]_images 包含相关图像的文件夹。有两类图像:全部切片图像(WSI)和组织微数组(TMA)。

测试集包含与训练集不同的来源医院的图像,最大的区域图像几乎为100,000 x 50,000像素。预计测试集中大约有2000张图像,大多数是TMA,总大小为550GB。

[train/test].csv 训练集的标签。

  • image_id - 每张图像的唯一ID代码。

  • label - 目标类。这些卵巢癌亚型之一:CC、ECHGSCLGSCMCOther

  • image_width - 图像宽度,以像素为单位。

  • image_height - 图像高度,以像素为单位。

  • is_tma - 如果切片是组织微数组,则为True

[train/test]_thumbnails 包含全部切片图像的较小 .png 副本的文件夹。不提供TMA的缩略图。

sample_submission.csv 有效的样本提交。只能下载第一行。

时间安排

  • 2023 年 10 月 6 日 - 开始日期

  • 2023 年 12 月 27 日 - 报名截止日期

  • 2023 年 12 月 27 日 - 合并截止日期

  • 2024 年 1 月 3 日 - 提交截止日期

赛题奖金

  • 第一名 - 12,000美元

  • 第二名 - 10,000美元

  • 第三名 - 10,000美元

  • 第四名 - 10,000美元

  • 第五名 - 8,000美元

需要组队的私聊

**关注下方【学姐带你玩AI】**🚀🚀🚀

回复"比赛"获取190+场比赛top方案(kaggle、天池、ccf...)

码字不易,欢迎大家点赞评论收藏!

相关推荐
xyz_CDragon6 小时前
OpenClaw Skills 完全指南:ClawHub 安装、安全避坑与自定义开发(2026)
人工智能·python·ai·skill·openclaw·clawhub
断眉的派大星6 小时前
pytorch中view和reshape的区别
人工智能·pytorch·python
nihao5616 小时前
机器学习:阈值与混淆矩阵
人工智能·机器学习·矩阵
鱼骨不是鱼翅7 小时前
机器学习(1)-----基础概念
人工智能·机器学习
xiao5kou4chang6kai47 小时前
蒸散发与光合作用阻抗理论 → ArcGIS自动化 → 区域ET/GPP产品融合
人工智能·蒸散发·植被生产力估算·penman-monteith
cd_949217217 小时前
骁龙与F1的故事:一场连接与速度的深度对话
人工智能
新加坡内哥谈技术7 小时前
大语言模型的上下文工程指南
人工智能
Gofarlic_OMS7 小时前
装备制造企业Fluent许可证成本分点典型案例
java·大数据·开发语言·人工智能·自动化·制造
2501_948114247 小时前
DeepSeek V4 全面实测:万亿参数开源模型的工程落地与成本推演
人工智能·ai·开源
程序员雷欧7 小时前
大模型应用开发学习第八天
大数据·人工智能·学习