训练YOLO模型时,其目标检测标签文件为txt格式,并且其内容格式为:一行一个目标,每行包括类别ID、目标在图像中的归一化Bounding Box(以图片宽度和高度为单位),用空格分隔。而有时遇到的目标检测标签为xml格式,所以这是就要我们将其进行格式转换,以适合于YOLO模型的训练。
以M3FD数据集为例。(此数据集中给出了图片对应的xml格式的目标检测标签文件)
M3FD Dataset下载地址:M3FD
要求将目标检测的XML格式的文件转换为TXT格式。
(1)XML格式的目标检测标签文件内容展示:
<annotation>
<folder>F</folder>
<filename>00000.png</filename>
<path>D:\M3FD\F\00000.png</path>
<source>
<database>Unknown</database>
</source>
<size>
<width>1024</width>
<height>768</height>
<depth>3</depth>
</size>
<segmented>0</segmented>
<object>
<name>People</name>
<pose>Unspecified</pose>
<truncated>0</truncated>
<difficult>0</difficult>
<bndbox>
<xmin>46</xmin>
<ymin>372</ymin>
<xmax>82</xmax>
<ymax>478</ymax>
</bndbox>
</object>
<object>
<name>People</name>
<pose>Unspecified</pose>
<truncated>0</truncated>
<difficult>0</difficult>
<bndbox>
<xmin>289</xmin>
<ymin>380</ymin>
<xmax>314</xmax>
<ymax>450</ymax>
</bndbox>
</object>
<object>
<name>People</name>
<pose>Unspecified</pose>
<truncated>0</truncated>
<difficult>0</difficult>
<bndbox>
<xmin>271</xmi