(更多数据集请看)医学影像数据集集锦:https://github.com/linhandev/dataset
数据集 | 数据集大小 | 说明 | 链接 |
Kvasir-SEG | 1000 张(对) | Kvasir-seg是 胃肠道息肉图像和相应分割面罩的开放式数据集,由医生手动注释,然后由经验丰富的胃肠病学家进行验证。Kvasir-SEG 数据集(大小 46.2 MB)包含来自 Kvasir Dataset v2 的 1000 个息肉图像及其对应的地面实况。Kvasir-SEG 中包含的图像的分辨率从 332×487 到 1920×1072 像素不等。 | https://datasets.s imula.no/kvasir-seg/ |
CVC-ClinicDB | 600张 | CVC-ClinicDB 是从结肠镜检查视频中提取的帧数据库。CVC-ClinicDB 数据库由两种不同类型的图像组成:原始图像和息肉掩膜 | https://polyp.grand-cha llenge.org/CVCClinicDB/ |
CVC-ColonDB | 300张 | 结肠镜检查视频的注释视频序列。它包含 15 个简短的结肠镜检查序列,来自 15 项不同的研究。在每个序列中显示一个息肉。 | |
Synapse multi-organ CT | 50 | 从正在进行的结直肠癌化疗试验和回顾性腹疝研究的组合中随机选择了 50 份腹部 CT 扫描。50 次扫描是在门静脉造影阶段捕获的,具有可变的体积大小 (512 x 512 x 85 – 512 x 512 x 198) 和视场(约 280 x 280 x 280 mm 3 – 500 x 500 x 650 mm 3) . 平面内分辨率从 0.54 x 0.54 mm 2到 0.98 x 0.98 mm 2不等,而切片厚度范围从 2.5 mm 到 5.0 mm。标准注册数据由NiftyReg生成。 | https://www.syn apse.org/#!Synapse:syn3193805/wiki/217789 |
MoNuSeg | 22,000张 | 数据集是通过仔细注释几名患有不同器官肿瘤并在多家医院被诊断出的患者的组织图像获得的。该数据集是通过从TCGA存档下载以 40 倍放大倍率捕获的 H&E 染色组织图像创建的。H&E 染色是增强组织切片对比度的常规方案,通常用于肿瘤评估(分级、分期等)。考虑到多个器官和患者的细胞核外观的多样性,以及多家医院采用的丰富染色方案,训练数据集将能够开发出强大且可推广的细胞核分割技术,开箱即用。 | https://monuseg.gr and-challenge.org/Data/ |
胰腺分割数据集 | 美国国立卫生研究院临床中心对 53 名男性和 27 名女性受试者进行了 82 次腹部对比增强 3D CT 扫描(门静脉静脉注射对比剂后约 70 秒)。17 名受试者是在肾切除术前扫描的健康肾脏捐赠者。其余 65 名患者由放射科医师从既无重大腹部病变也无胰腺癌病变的患者中选出。受试者的年龄范围为 18 至 76 岁,平均年龄为 46.8 ± 16.7。CT 扫描具有 512×512 像素的分辨率,具有不同的像素大小和 1.5 – 2.5 mm 之间的切片厚度,在 Philips 和 Siemens MDCT 扫描仪(120 kVp 管电压)上获得。 | http://academictorre nts.com/details/80ecfefc abede760cdbdf63e38986501f7becd49 | |
MICCAI胰腺分割数据集 | 282 | 目标:肝脏和肿瘤 模式:门静脉期 CT 大小: 420 3D 卷(282 培训 +139 测试) 来源:纪念斯隆凯特琳癌症中心 挑战:标签不平衡与大(背景)、中(胰腺)和小(肿瘤)结构 | https://drive.google.com /drive/folders/1HqEgzS8BV2 c7xYNrZdEAnrHk7osJJ–2 |
LiTS肝脏分割数据集 | 131+70 | LiTS数据集包含131组训练扫描和70组测试扫描,其中70组测试数据标签不公开。LiTS训练集中包含3DIRCADB中的所有数据,所以不要合并这两个数据集。Medical Segmentation Decathlon中肝脏分割的数据集就是LiTS。 | https://sliver07.gran d-challenge.org/ |
covid19-ct-scans | 20 | 数据来自Ieee8023,对20组扫描进行了左右肺和感染区的标注。 | https://www.kaggle.co m/andrewmvd/covid19-ct-scans |
Medical Segmentation Decathlon | 2,633 | 医学分割十项全能是医学图像分割数据集的集合。它总共包含 2,633 张三维图像,这些图像是从多个感兴趣的解剖结构、多种模式和多个来源收集的。具体来说,它包含以下身体器官或部位的数据:大脑、心脏、肝脏、海马体、前列腺、肺、胰腺、肝血管、脾脏和结肠。 | http://medicald ecathlon.com/ |
GlaS | 165 | GlaS ( 结肠组织学图像挑战中的腺体分割 )本次挑战中使用的数据集包含 165 张图像,这些图像来自 T3 或 T42 期结直肠腺癌的 16 个 H&E 染色组织切片。 每个切片属于不同的患者,切片是在实验室的不同场合处理的。 因此,该数据集在染色分布和组织结构方面表现出很高的受试者间变异性。 使用像素分辨率为 0.465µm 的 Zeiss MIRAX MIDI 幻灯片扫描仪将这些组织切片数字化为全幻灯片图像 (WSI)。 | https://warwick.ac.uk/fac/cross_fac/tia/data/glascontest/ |
2018 Data Science Bowl | 该数据集包含大量分割的核图像。 这些图像是在各种条件下获得的,并且在细胞类型、放大倍率和成像方式(明场与荧光)方面有所不同。 该数据集旨在挑战算法泛化这些变化的能力。 | 出自UNet++: A Nested U-Net Architecture for Medical Image Segmentation https://www.kaggle.com/c/data-science-bowl-2018/overview | |
ACDC | 150 | 该数据集由 150 个检查(全部来自不同的患者)组成,分为 5 个均匀分布的亚组(4 个病理组和 1 个健康受试者组),如下所述。 此外,每位患者都附带以下附加信息:体重、身高以及舒张期和收缩期瞬间。 | https://acdc.creatis.insa-lyon.fr/description/databases.html |
参考:Medical Image Segmentation: https://paperswithcode.com/task/medical-image-segmentation