AI自动化测试:技术原理、平台搭建与工程实践
上QQ阅读APP看书,第一时间看更新

2.3 基于深度学习的图像识别算法

2.3.1 卷积神经网络

卷积神经网络(CNN)可以自动提取图像特征。通过一系列的卷积、池化等操作,使图像的特征逐渐抽象。根据任务的不同,图像特征被抽象成不同的特征层。基于这些特征层,进一步做分类。CNN网络的基本操作为卷积和池化。

卷积操作是对一个卷积核采用滑动窗口的方式,依次与图像上的像素点做卷积,生成的结果值作为特征图像上的一个像素点。池化操作,又称为下采样,根据取滑动窗口内的最大值、平均值等(最大池化、平均池化)。

自从AlexNet获得ILSVRC 2012挑战赛冠军后,用CNN分类成为主流。它是一种用于目标检测的暴力方法,通过从左到右、从上到下滑动窗口,利用分类识别目标,如图2-5所示。为了在不同观察距离处检测不同的目标类型,我们可以使用不同大小和宽高比的窗口。

图2-5 CNN的基本操作