models/detector.py
中定位到def build(args):
,将num_classes
进行修改,改为最大的类别id+1
。我有4
个类别,类别id是从0~3
,因此max_id=3
,这里的num_classes=max_id+1=4
voc
、coco
两种格式,在main.py
的--dataset_file
设置,默认的是使用coco
main.py
的--coco_path
指明数据集根目录coco
格式,yolo标签转为coco格式的代码可参考将YOLO数据集转成COCO格式,单个文件夹转为单个json文件,例如…/images/train转为instance_train.json,如果要用voc
格式,可自行看看源码datasets/voc.py
然后,因为我的数据集排布是:
F:/A_Publicdatasets/RDD2020-1202/train_valid/RDD2020_together
├─annotations
│ ├─instances_train.json
│ ├─instances_val.json
│ └─instances_test.json
├─images
│ ├─test
│ │ ├─xxx.jpg
│ │ ├─xxx.jpg
│ ├─train
│ └─val
因此,在datasets/coco.py
中根据自己的数据集进行更改:
"train": (root / "images/train", root / "annotations" / f'{mode}_train.json'),
"val": (root / "images/val", root / "annotations" / f'{mode}_val.json'),
官方给的训练YOLOS-S 300轮的命令:
python -m torch.distributed.launch \
--nproc_per_node=8 \
--use_env main.py \
--coco_path /path/to/coco
--batch_size 1 \
--lr 2.5e-5 \
--epochs 150 \
--backbone_name small \
--pre_trained /path/to/deit-small-300epoch.pth\
--eval_size 800 \
--init_pe_size 512 864 \
--mid_pe_size 512 864 \
--output_dir /output/path/box_model
参照着上面去修改即可,我喜欢将参数直接给修改在main.py
里面,但我:
--init_pe_size
和--mid_pe_size
都设置成了default=(640, 640)
,这应该是跟图像尺寸相关的--pre_trained
,因为不想使用预训练权重题外话:
选择使用哪个?默认的是tiny,可以换成small,可对应models/backbone.py
中进行查看,可以定位到tiny
、small
函数位置
对应的有这些选项:
可能会遇到这个报错:ImportError: cannot import name 'container_abcs' from 'torch._six' (F:\SoftWareInstall\Anaconda3\envs\torch1.10\lib\site-packages\torch\_six.py)
,然后参照这个篇博客【报错】cannot import name ‘container_abcs‘ from ‘torch._six‘
在models/layers/helper.py
中将from torch._six import container_abcs
改为如下代码即可:
import collections.abc as container_abcs