基于AlexNet的车辆型号识别研究

贾 瑞

(苏州健雄职业技术学院电子信息学院, 江苏 太仓 215400)

引言

随着经济的高速发展,汽车产业也蓬勃发展起来。虽然汽车让我们的工作效率更加快捷,生活更加便利,但同时也有不利的一面随之而来,频发的交通事故、逐步变得恶劣的生态环境以及能源等方面的问题也不断地给我们敲着警钟。对道路交通进行的传统的管理方式已经无法跟上时代的步伐,构建新型管理系统来处理复杂问题已成为必然趋势。在这种背景下,近年来发展迅速的人工智能及模式识别技术与互联网技术逐步结合起来,并开始应用于交通管理行业,车型识别系统便应运而生[1]。

分类识别的速度和准确率是车型识别最重要的两个指标,而影响这两个指标最重要的因素就是对车辆特征的提取,提取的特征要能够具备应对角度偏转、光照强度变化及图像大小尺度变化的强鲁棒性。虽然目前在图像识别领域常用的特征提取方法很多,但是特征提取主要还是依靠手工提取,而且在对提取的特征进行预处理的过程,较为麻烦且费时。

1 车型识别国内外研究现状

目前对车型的分类识别主要是利用图像处理来进行,首先从交通道路上架设的摄像头和图像采集卡收集到视频流中的图像,然后通过车辆图像的分割、车辆特征的提取和车型识别的分类来完成整个识别过程[2]。

因为车辆前脸特征包含车牌、车标、车灯等具有可判别性的大量信息,所以国内外学者常利用车辆前脸特征来实现车型分类。Sarfraz提出了利用车身前方的形状和直方图的局部特征,然后利用贝叶斯先验模型进行分类,但是识别正确率有待提高。Krishnan Ramnath等提取了车辆的3D空间曲线特征,从车辆的外形整体进行车型分类,该方法能够对任意角度拍摄的车辆图片进行分类,但是计算量较大。后来张红兵等人通过提取车辆前脸的HOG特征,用投影细定位和形态学粗定位的方法提取车辆的前脸区域,用线性判别算法提取车辆前脸的梯度方向直方图特征,其方法降低了维度,提高了运算速度。吴彤等人通过提取车辆侧向特征,利用背景差分法将车型分为大、中、小三类,通过这三类车的正视图和侧视图的直方图交集以及与现有模板比较进行分类,但是如果图像发生大尺度变换、旋转以及车辆图片不是完整图片,此方法就会失效,不能满足对车型精细分类的要求[3]。车型识别主要有以下难题仍待解决:

1)车辆图片背景复杂多变。自然场景下采集到的图片可能含有行人、动物、山川等。另外,车辆之间也可能相互遮挡。

2)车辆外观也会有多种变化。比如采取不同的拍摄点和拍摄角度,即使同一辆车型外观也会有较为明显的不同。

3)不同光照条件对识别效果影响很大。比如光线好的晴天和光线差的阴天。另外即使在光线强的白天不同时段也会对所拍图片质量造成较大影响[3]。

1.1 深度学习国内外研究现状

为了能让计算机自动选择合适特征,人工神经网络应运而生。1962年Hubel和Wiesel在对猫视觉皮层细胞的研究基础上,提出了感受野的概念以及1984年日本学者FuKushima在感受野概念基础上提出了神经认知机,这可以看成是神经网络的首次实现[3]。

直到2010年,Ciresan et al使用非线性深度后向传播网络,在MNIST手写字上进行识别,实验结果超越了所有不适用无监督学习的前人方法,人们才逐渐将深度学习用于目标检测和识别方向。最近5年,大规模训练数据(ImageNet)的出现和高性能计算硬件(GPU)的发展,为这个领域重新提供了燃料和助推器[4],使深度学习在图像识别、人脸识别等多个领域的识别结果都接近或超过了人类的水平。2017年五月份人工智能AlphaGO与中国少年棋手柯洁的对战,最终以2∶0战胜了柯洁,这代表以深度学习为基础的人工智能又迈上了一个新的高度。卷积神经网络因其模拟生物视觉机制,对平移、缩放等变换有较好鲁棒性,可以很好地解决车辆在自然场景下位置不同、角度不同等所带来的分类难题[3]。本文的目的就是使用深度学习的方法进行图像的特征提取,并在这些特征上进行车辆型号的识别工作。

1.2 车型识别系统简介

自然场景图像下的车辆定位以及车型识别是车型识别系统的重要组成部分。目前识别精度较高的检测方法有超声波检测、激光红外线检测等,但是安装过程费时,设备容易损坏而且维护成本高。而基于图像的车型识别技术是通过分析处理从摄像头和图像采集卡获取的车辆视频图像,完成车辆的分类识别,满足实时性需求,维护简单,不会给交通带来额外负担。同时,交通图片来自于交通道路的实施拍摄情况,这样可以根据实时信息对交通事故进行预测及时做出对策,还可以将收集到的数据传回给数据中心,用于存储,大数据等方面。该技术的优势显而易见,但难点在于实时处理和准确率的高要求[5]。所以本文的研究重点就是设计出一套在速度和准确度两个方面都有较好识别效果的算法。

车型识别系统可以分为品牌标志、车辆大小或车辆类别来进行分类。而本文的分类标准是按照汽车品牌标志进行的。

2 车型识别系统方案

车型识别整体框架如图1所示。

车型识别整个过程如下:首先利用训练样本对微调后的AlexNet模型进行训练,得到新的网络层级,然后利用测试图片进行车型识别。

本文从斯坦福大学公开数据库下载16 185张共196种类型的汽车图片,数据集被分为8 144张训练图片和8 041张测试图片,训练和测试几乎是一比一分配。该数据集是从各个角度拍摄的汽车图片,图片大小不统一,背景复杂,目标车辆在整个图片中所占比例相差较大。为了满足实验要求,我们将少数黑白图片进行替换,对每张训练图片都规整为227 mm×227 mm大小的图片,并对每一张训练图片进行车型标注,如表1所示。

图片[1]-基于AlexNet的车辆型号识别研究-游戏花园

图1 车型识别整体框架

图片[2]-基于AlexNet的车辆型号识别研究-游戏花园

表1 数据库标注案例

如表1所示,对于每辆训练图片的标注信息包括车辆类别(class)和车辆位置信息,车辆位置信息对应着图片中车辆的左上右下两点,(36,116,868,587) 为 00002.jpg中车辆图片的位置向量,其它类别信息同理,这里不再一一阐述。

3 车型识别详细实现3.1 实验环境

实验所用计算机配置为:处理器为Intel i5-4590;显卡为GTX 980;实验内存为8.00GB;RAM系统类型为64位操作系统;实验系统为Windows7旗舰版;实验软件为Matlab R2016b。

3.2 最终成果展示

本文最终的设计成果为一套人机交互界面,主要包含四部分:模型和阈值设置;识别对象读取;手动选取区域;自动选取区域,如下页图2所示。

3.3 实验步骤

AlexNet是2012年ImageNet大赛的冠军,它一共有8层,包括5个卷积层,2层全连接和一层分类层,如果使用其对一张图片进行前向传播,那么最后输出的这张图片属于1 000个物体中的哪一个的概率。

首先在Matlab中对AlexNet进行定义,利用trainingOptions函数建立网络训练算法,网络训练算法采用具有动力的随机梯度下降法(Stochastic gradient descent with momentum)进行训练,初始学习率为0.001,动力为0.9,每次训练迭代的最小批次为100,训练最大次数初始学习率为0.001,动力为0.9,每次训练迭代的最小批次为100,训练最大次数为500次。学习网络结构如图3所示。

接着我们对其进行微调,其实前面的卷积层都不用改,要改的就是后面一个全连接层,由于车型一共是196种,所以全连接的输出也要改成196,后面再加上输出层(Softmax)和分类层,训练方法不变。微调后新的网络结构如图4所示。

图片[3]-基于AlexNet的车辆型号识别研究-游戏花园

图2 人机交互界面总体设计

图片[4]-基于AlexNet的车辆型号识别研究-游戏花园

图3 AlexNet结构图

图片[5]-基于AlexNet的车辆型号识别研究-游戏花园

图4 微调后的网络结构AlexLayer_New

接着要开始加载训练数据并进行训练。首先要做一个图像数据容器,在matlab中写入规整后的图片和标签,输出应该为1到196。接着就可以用trainNetwork功能对微调后的AlexNet结构进行训练,训练速度相当的慢,经过反复迭代比较后发现,当初始学习率为0.000 5,动力为0.9,每次训练迭代的最小批次为100,训练最大次数为10次时,准确率取得了令人满意的成果(如图5所示)。

图片[6]-基于AlexNet的车辆型号识别研究-游戏花园

图5 AlexNet训练效果图

3.4 实验结果

将完成的代码进行封装,运行test.m文件,对单张车辆图片进行测试。图6是一些汽车图片的测试结果。

图片[7]-基于AlexNet的车辆型号识别研究-游戏花园

图6 汽车图片检测结果

4 结语

目标识别是计算机视觉的一个重要领域,由此延伸出的车辆检测和车型识别在实际应用中意义重大。本文以深度卷积神经网络为理论基础,研究了车辆定位和车型识别方法,构建了相应的识别框架,训练了一套分类算法进行车辆具体品牌和型号的识别。本文对当前目标识别和分类的算法及局限性进行了简要说明,进而介绍了卷积神经网络的工作原理及优点:不需要人工提取特征,解决了模型实时更新等问题,同时本文提出了基于AlexNet模型的车型识别方法,在所下载图片中采用ImageNet标注形式,准确率为97%以上,提出了基于Cifar10Net训练的RCNN用于车辆区域检测,并配合微调后的AlexNet进行车型识别;设计出了一套人机交互界面,可以实现手动选取区域,直接利用分类模型进行识别操作;也可以利用训练好的RCNN先进行车辆区域检测,再利用分类模型进行识别操作。

THE END
喜欢就支持一下吧
点赞89 分享