本节来评估一下利用 avx2 优化卷积乘法之后的效果,评价标准为之前介绍的两个指标:吞吐和延时:小报童
对比性能时,在相同的环境下(环境配置可以参考:小报童)进行,首先在 1st_origin 目录下执行下面两条语句:
bash compile.sh
./resnet
静静等待运行完,会打印出吞吐和延时的数据:
可以看到第一版的延时为 17s,吞吐为 0.06 fps。
接下来在 2nd_avx2 目录下执行同样的操作,然后等待程序运行完成,同样会打印出吞吐和延时的数据:
可以看到利用