欢迎来到亿配芯城! | 免费注册
什么是CNN池化
发布日期:2024-11-01 06:44     点击次数:201

1、什么是池化?

我们因而役使卷积后的特性,是因为图像秉赋“静态型”的性能,也就代表在一个图像区域的表征极有可能在另一个区域一模一样适用。为此,当俺们描述一个大的图像的时候就可以对不同岗位的特性拓展聚拢统计(譬如:得以约计图像一个区域上的之一特定特征的附加值 or 最大值)这种统计法子不仅仅何尝不可滑降纬度,还不容易过拟合。这种集聚统计的操作就称之为池化,或平均池化、最大池化。

2、池化的作用?

(1)保留显要特征的并且减缩参数(下降纬度,类似PCA)和计量量,曲突徙薪过拟合

在由此卷积收获了特色 (features) 日后,下一步用这些特点去做分类。我们得以用赋有领到的特点去教练分类器,可是如此这般计算老本正如高。例如softmax分类器,诸如:对此一个 96X96 像素的图像,一经我们一度学学赢得了400个概念在8X8输入上的特征,每一个特色和图像卷积城邑赢得一个 (96 − 8 + 1) * (96 − 8 + 1) = 7921 维的卷积特色,鉴于有 400 个特色,据此每个样例 (example) 地市获得一个 892 * 400 = 3,168,400 维的卷积特征向量。上学一个抱有超过 3 百万特征输入的分类器好不穷山恶水,再者易于冒出过拟合 (over-fitting)。

(2)invariance(不变性),这种不变性概括translation(挪动),rotation(打转),scale(口径) 

a、 translation invariance:

这边举一个直观的例证(数字可辨),假若有一个16x16的图籍, 芯片采购平台个中有个数目字1,咱俩亟待识假出去,本条数目字1兴许写的偏左几分(图1),这个数目字1可能偏右或多或少(图2),图1到图2对等向右挪窝了一个单位,唯独图1和图2由此max pooling以后它们都改为了相同的8x8表征空间点阵,非同儿戏的特性咱俩擒获到了,并且又将题材的框框从16x16降到了8x8,并且领有移步不变性的特点。图中的a(或b)意味,在原始图样中的这些a(或b)职位,结尾地市投射到相同的职位。

8-1.png

b、rotation invariance:

下图代表中国字“一”的辨明,首先张相对于x轴有倾斜角,伯仲张是平行于x轴,两张图籍对等做了转动,透过高频max pooling后装有相同的特性

8-2.png

c、 scale invariance:

下图意味数字“0”的辨认,率先张的“0”正如大,次之张的“0”开展了较小,相等作了缩放,同样地,由此几度max pooling后所有相同的特性

8-3.png