kaggle新赛:UBC卵巢癌亚型分类和异常检测大赛【图像分类】

**赛题名称:**UBC Ovarian Cancer Subtype Classification and Outlier Detection (UBC-OCEAN)

**赛题链接:**https://www.kaggle.com/competitions/UBC-OCEAN

赛题背景

卵巢癌是女性生殖系统最致命的癌症。目前,卵巢癌诊断依赖病理学家评估亚型。然而,这带来了几个挑战,包括观察者之间的分歧和诊断的可重复性。此外,医疗不发达的社区通常缺乏专科病理学家,即使是发达社区也面临缺乏妇科肿瘤专业知识的病理学家的短缺。

深度学习模型在分析组织病理学图像方面展现出了显著的能力。然而目前仍然存在挑战,例如需要大量的训练数据,理想情况下来自单一来源。技术、伦理和财务限制以及保密问题使培训成为一项挑战。

赛题任务

UBC卵巢癌亚型分类和异常检测(UBC-OCEAN)比赛的目的是对卵巢癌亚型进行分类,参赛者将在世界上最广泛的卵巢癌组织病理学图像数据集上训练模型,这些图像来自超过20个医疗中心。

参赛者的工作可以提高识别卵巢癌亚型的准确性,更好的分类将使临床医生能够制定个性化的治疗策略,而不受地理位置的限制。这种有针对性的方法有可能提高治疗效果,减少不良反应,并最终为患者带来更好的结果。

评价指标

提交内容使用balanced accuracy进行评估。

提交文件

对测试集中的每个image_id,参赛者必须为label变量预测一个类。该文件应包含一个标题并采用以下格式:

复制代码
image_id,label
2,CC
5,EC
6,HGSC
etc.

数据描述

参赛者在本次竞赛中的挑战是从活检样本的显微镜扫描中分类卵巢癌的类型。

本次竞赛使用隐藏测试。当提交的笔记本被评分时,将提供实际的测试数据(包括完整的样本提交)。由于数据集的大小,训练图像将不会被提供。

文件

[train/test]_images 包含相关图像的文件夹。有两类图像:全部切片图像(WSI)和组织微数组(TMA)。

测试集包含与训练集不同的来源医院的图像,最大的区域图像几乎为100,000 x 50,000像素。预计测试集中大约有2000张图像,大多数是TMA,总大小为550GB。

[train/test].csv 训练集的标签。

  • image_id - 每张图像的唯一ID代码。

  • label - 目标类。这些卵巢癌亚型之一:CC、ECHGSCLGSCMCOther

  • image_width - 图像宽度,以像素为单位。

  • image_height - 图像高度,以像素为单位。

  • is_tma - 如果切片是组织微数组,则为True

[train/test]_thumbnails 包含全部切片图像的较小 .png 副本的文件夹。不提供TMA的缩略图。

sample_submission.csv 有效的样本提交。只能下载第一行。

时间安排

  • 2023 年 10 月 6 日 - 开始日期

  • 2023 年 12 月 27 日 - 报名截止日期

  • 2023 年 12 月 27 日 - 合并截止日期

  • 2024 年 1 月 3 日 - 提交截止日期

赛题奖金

  • 第一名 - 12,000美元

  • 第二名 - 10,000美元

  • 第三名 - 10,000美元

  • 第四名 - 10,000美元

  • 第五名 - 8,000美元

需要组队的私聊

**关注下方【学姐带你玩AI】**🚀🚀🚀

回复"比赛"获取190+场比赛top方案(kaggle、天池、ccf...)

码字不易,欢迎大家点赞评论收藏!

相关推荐
雍凉明月夜7 小时前
视觉opencv学习笔记Ⅴ-数据增强(1)
人工智能·python·opencv·计算机视觉
骚戴7 小时前
深入解析:Gemini 3.0 Pro 的 SSE 流式响应与跨区域延迟优化实践
java·人工智能·python·大模型·llm
CNRio7 小时前
从智能穿戴设备崛起看中国科技自立自强的创新实践
人工智能·科技·物联网
疾风sxp7 小时前
nl2sql技术实现自动sql生成之Spring AI Alibaba Nl2sql
java·人工智能
程序猿追7 小时前
使用GeeLark+亮数据,做数据采集打造爆款内容
运维·服务器·人工智能·机器学习·架构
木卫二号Coding7 小时前
第六十篇-ComfyUI+V100-32G+运行Wan2.2-图生视频
人工智能
GAOJ_K7 小时前
滚珠螺杆的内循环与外循环有何差异?
人工智能·科技·机器人·自动化·制造
这张生成的图像能检测吗7 小时前
(论文速读)Nickel and Diming Your GAN:通过知识蒸馏提高GAN效率的双重方法
人工智能·生成对抗网络·计算机视觉·知识蒸馏·图像生成·模型压缩技术
中国胖子风清扬7 小时前
Spring AI Alibaba + Ollama 实战:基于本地 Qwen3 的 Spring Boot 大模型应用
java·人工智能·spring boot·后端·spring·spring cloud·ai
A7bert7778 小时前
【YOLOv5seg部署RK3588】模型训练→转换RKNN→开发板部署
linux·c++·人工智能·深度学习·yolo·目标检测