遥感影像-语义分割数据集:2021年昇腾杯初赛数据集详细介绍及训练样本处理流程

发布时间:2024年01月05日

原始数据集详情

简介:细粒度语义分割赛道依据现有的遥感地物分类要求, 结合现有的地物分类实际需求,参照地理国情监测、 “三调”等既有地物分类标准,依据遥感地物“所见即所得”原则, 设计地物要素分类体系,共涉及一级大类8种,数据为0.8米-2米分辨率的遥感图像。

KeyValue
卫星类型GaoFen-1、ZiYuan-3
覆盖区域未知
场景未知
分辨率0.8m-2m
数量35000张
单张尺寸512*512
原始影像位深8位
标签图片位深8位
原始影像通道数三通道
标签图片通道数单通道

标签类别对照表

像素值类别名(英文)类别名(中文)RGB
0背景
1种植土地
2林草覆盖
3房屋建筑
4铁路与道路
5构筑物
6人工堆掘地
7荒漠与裸露地
8水域

数据处理部分

大家是否有这样的困惑?真值标签图片的像素值太小,比如1、2、3······,由于像素值太小,导致看上去标签图片全为黑色,无法看出真值标签与影像图片的像素位置是否对应?如果真值标签的像素值间隔太大,又无法直接作为训练样本。

其实有办法可以解决这个问题,那就是在像素值为1、2、3等的图片上添加一个彩色表,添加的彩色表不会改变图片的像素值,但是可以由彩色的视觉效果展示,如下图所示:
在这里插入图片描述

下面对原始影像及标签进行模型训练前的数据预处理,根据这套数据集的原始信息,原作者整理的已基本接近训练条件,现在需要做的是根据自己训练模型的图片尺寸大小批量裁剪原始影像和标签为所需要的尺寸,比如512*512,另外如果需要检查裁剪后的数据是否一一对应,最好给标签数据添加颜色表,这样就可以轻易看出影像和真值标签是否一致。

下面就是使用代码对原始影像及原始标签进行批量裁剪为512*512大小,并给真值标签添加颜色表,效果图如下所示:
在这里插入图片描述

最后可以直接用于训练的数据集结构如下所示


├── train
│   ├── images
│   │   ├── 2522_0_0.tif
│   │   ├── 2522_0_512.tif
│   │   └── ......
│   └── labels
│       ├── 2522_0_0.tif
│       ├── 2522_0_512.tif
│       └── ......
└── val
    ├── images
    │   ├── 2522_512_512.tif
    │   ├── 2523_0_0.tif
    │   └── ......
    └── labels
        ├── 2522_512_512.tif
        ├── 2523_0_0.tif
        └── ......

需要原始数据集、预处理后数据集、裁剪后可训练数据集、数据处理完整代码的小伙伴可私信哦!

文章来源:https://blog.csdn.net/ly_0624/article/details/135372803
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。