tiny dataset

说明:这个文档用来记录一些常用的dataset

  1. cityscape
    • 主要用于语义分割
    • 包含5000精细标注(gtFine/2975 training, 500 validation, and 1525 testing)和20000粗标注(gtCoarse)
    • leftImg8bit里面是原图,8-bit LDR
    • 30个类别
    • 数据处理脚本:https://github.com/mcordts/cityscapesScripts
    • (也包含3D标注/right stereo views & disparity)
  2. ade20k
    • 用于语义分割
    • 25,000张图像(20ktrain,2k val,3ktest)
    • *.png是原图
    • *_seg.png是mask:R和G通道编码对象类掩码,通道B对实例对象掩码进行编码
    • * _.txt是文本描述文件
    • 包含室内外场景
    • 共包含3688个类别,其中高频类别150类(100个thing和50个stuff,占所有像素的89%)
  3. coco-stuff
    • COCO-Stuff是对COCO2017数据集中全部164K图片做了像素级的标注
    • 包含80 thing classes, 91 stuff classes and 1 class ‘unlabeled’
    • 图像共用,标签分为stuffthingmaps_trainval2017.zip / stuff_trainval2017.zip (Stuff-only) / annotations_trainval2017.zip (thing-only),用灰度图格式保存
  4. PPM-100
    • 人像抠图