- 03/20
- 2023
-
QQ扫一扫
-
Vision小助手
(CMVU)
近日,数之联首席算法官陈端兵团队和广东外语外贸大学刘景发教授、电子科技大学汪航等人合作发表了题为《Feature augmentation based on information fusion rectifcation for few-shot image classifcati》的学术论文。汪航为论文第一作者,陈端兵和刘景发为论文通信作者,田晟兆、傅彦、周俊临为论文合作作者。
本文重点研究了用于小样本学习的数据增强方法,提出了一种基于信息融合的特征增强方法,该方法充分利用了数据集之间的关系进行小样本图像分类,提出的IFR模型充分利用了基类数据和新类数据以及支持数据集和查询数据集之间的相关信息。
图像分类的应用场景非常广泛,很多场景下很难收集到足够多的数据来训练模型。利用小样本学习进行图像分类可解决训练数据量小的问题。而在小样本图像分类问题中,由于缺乏足够的数据,直接训练模型会导致过拟合。为了缓解这一问题,越来越多的方法集中在非参数数据增强上。
数据增强(Data Augmentation)是增加训练样本和增强数据多样性的一种有效方法,通过对数据或特征进行增强,扩充训练样本容量,进而提高小样本图像识别的准确率。当前较为高效的小样本数据增强方法是从特征层面上进行扩充,利用已知数据的信息构造非参数正态分布来扩充支持集中的样本。然而,由于基类数据和新类数据之间存在域偏移,并且同属一个类别的不同样本之间也存在一定的分布差异,之前相关工作生成的支持集特征可能存在一定的偏差,无法达到数据增强的目的。
本文提出的基于信息融合(Information Fusion Rectification, IFR)的小样本图像识别算法,利用基类数据信息和查询集数据信息(即新类别未知标签的数据信息)对新类数据的统计信息进行修正,并通过该修正的类别统计信息进行采样,扩充新类数据的特征。最后,在mini Image Net、tiered Image Net 和 CUB数据集上进行了实验,并与相关的数据增强方法和优秀的元学习模型进行了对比,通过基于信息融合修正的小样本图像识别算法,不仅缓解了因低数据量导致的过拟合问题,而且在一定程度上还提高了小样本图像识别的准确率。