使用环境 |
使用Pytorch深度学习框架在服务器端完成,GPU型号为NVIDIA Tesla V100,输入图像尺寸为448×448,局部区域输入尺寸为224×224。 |
使用对象 |
CUB-200-2011数据集中的鸟类图像、FGVC Aircraft数据集中的飞机图像、Stanford Cars数据集中的汽车图像。 |
使用目的 |
在弱监督条件下,通过挖掘图像的细粒度特征和判别性区域,实现对高度相似子类图像的准确识别。 |
输入数据 |
输入为图像数据,包括CUB-200-2011、FGVC Aircraft和Stanford Cars数据集中的图像。 |
输出数据 |
输出为图像的类别识别结果,即识别出图像所属的细粒度子类类别。 |
硬件配置 |
CPU:Intel Core i7-8700;GPU:NVIDIA Tesla V100;内存:8GB。 |
样本获取 |
在CUB-200-2011、FGVC Aircraft和Stanford Cars三个公开数据集上进行实验,分别有5994张、6667张和8144张训练图像,以及5794张、3333张和8041张测试图像。 |
测试结果 |
在CUB-200-2011数据集上,识别准确率达到了94.8%;在FGVC Aircraft数据集上,识别准确率达到了94.3%;在Stanford Cars数据集上,识别准确率达到了94.8%。 |
执行速度 |
针对4核CPU,计算占比分别平均约60%,50%,70%,30%;8GB内存,使用占比50%。 |
资源消耗 |
4核CPU,计算占比平均约60%;8GB内存,使用占比约50%。 |
源码类型 |
本算法有Python版本源码,使用售卖方式三进行授权。 |
文件大小 |
算法程序文件32KB,权重文件256MB。 |
相关备注 |
算法在细粒度图像识别领域具有较高的准确率,适用于需要对高度相似子类图像进行识别的场景,鸟类识别、飞机型号识别和汽车型号识别等。 |