目录
6.年龄性别预测和识别(Python/C++/Android)?
本项目将实现年龄性别预测和识别,整套方案采用二阶段方法实现,即首先使用通用的人脸检测算法(Face Detection)定位人脸区域,裁剪人脸,再构建多任务模型,分别进行年龄预测(Age)和性别识别(Gender)。项目分为数据集说明,Pytorch模型训练和C++/Android部署等多个章节,本篇是项目《年龄性别预测》系列文章之年龄性别数据集说明;为了方便后续模型工程化和Android平台部署,项目骨干网络backbone支持resnet18/resnet50,以及轻量化模型MobilenetV2模型训练和测试,并提供Python/C++/Android多个版本;
本篇,主要分享年龄性别人脸数据集,主要介绍MegaAge_Asian,MORPH以及IMDB-WIKI三大数据集,总数约28W+的人脸图片,并且都标注了年龄和性别的信息,可以用于龄性别预测和识别模型的开发。
?【尊重原创,转载请注明出处】https://blog.csdn.net/guyuealian/article/details/135127124
更多项目《年龄性别预测》和《面部表情识别》系列文章请参考:
数据说明:Quantifying Facial Age by Posterior of Age Comparisons
MegaAge_Asian一个是亚洲人脸数据集,标注了年龄和性别标签,年龄分布为0-70岁,其中训练集37563,测试集3583;项目对该数据集进行数据清洗,标注格式统一转换为
test/287.jpg 8 0 41 64 124 180
test/135.jpg 1 1 39 74 125 182
test/1446.jpg 26 1 40 74 131 181
test/599.jpg 11 1 65 81 147 176
- image_path是图片的相对路径
- age是年龄,
- gender是性别,0表示女性,1表示男性
- xmin ymin xmax ymax对应的人脸框位置
数据说明:MORPH | UNCW
MORPH一个是欧美人脸数据集,标注了年龄和性别标签,包含 2003 年至 2007 年底超过 13,000 个人的 55,000 张独特图像。年龄范围从 16 岁到 77 岁,中位年龄为 33 岁。每个人的平均图像数量为 4 张,照片之间的平均时间为 164天,最短1天,最长1681天。 图像之间的天数标准差为 180。项目对该数据集进行数据清洗,最后整理保留了训练数据49096张图片,测试数据3000张图片,标注格式统一转换为:
数据说明:https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/
IMDB-WIKI人脸数据集是基于IMDB 和 Wikipedia 两大数据库整合的人脸数据集,其中 IMDB 数据库包含 460,723 张人脸图片,Wikipedia 数据库包含 62,328 张人脸图片,共计 523,051 张人脸图片,该数据库中每张图片都被标注年龄和性别,但很可惜,标注质量差强人意,年龄信息标注不精准,性别信息也存在标注错误的情况,勉强凑合用吧。官网也强调MDB-WIKI数据并不能保证年龄信息的准确性。
为提高IMDB-WIKI数据的质量,项目对该数据集进行了大规模的清洗,数据清洗完后,Wikipedia 数据训练数据43590张图片,测试数据3000张图片,清洗后的数据称为wiki_crop;IMDB数据清洗完后,训练数据158868张图片,测试数据10000张图片,清洗后的数据称为imdb_crop,标注格式统一转换为:
尽管,项目已经对该数据进行了清洗,但依然无法保证该数据的质量,实际项目开发中,还请谨慎使用。
数据集下载地址:可公众号【AI吃大瓜】咨询联系
内容包含:
- MegaAge_Asian亚洲人脸数据集,标注了年龄和性别标签,其中训练集37563,测试集3583
- MORPH欧美人脸数据集,标注了年龄和性别标签,训练数据49096张图片,测试数据3000张图片
- IMDB-WIKI欧美人脸数据集,标注了年龄和性别标签,其中wiki_crop训练数据43590张图片,测试数据3000张图片;imdb_crop训练数据158868张图片,测试数据10000张图片
- 标注格式统一转换为:image_path age gender xmin ymin xmax ymax
?