CV
问题: 处理高分辨率图像时,原始图像的像素数量通常非常庞大。
边缘检测
垂直边缘检测滤波
变权
利用反向传播学习
Padding
Padding:外层填充像素
- 存在问题:
- throw away information from edge
- shranky output
解决:外层填充像素
- 存在问题:
填充多少像素?
Valid: (n-f+1) * (n-f+1)
Same: Pad so that output size is the same as the input size.
三维卷积
第一个可能是垂直边缘检测器,第二个可能是水平边缘检测器,将结果叠加。
卷积网络层的类型: convolution + pooling + fully connected
池化层(Pooling Layer)
池化层是深度学习中卷积神经网络(CNN)的一个重要组成部分,主要用于降低特征图的尺寸加速计算,同时保留主要特征。
例如:Max pooling, Average pooling…
完整卷积神经网络
常见结构
CONV-POOL-CONV-POOL-FC-FC-FC-softmax
使用梯度下降来减少代价函数进行训练
卷积优势
Parameter sharing:
A feature detector (such as a vertical edge detector) that’s useful in one part of the image is probably useful in another part of the image.
Sparsity of connections:
In each layer, each output value depends only on a small number of inputs.
2. 经典卷积神经网络架构
LeNet - 5
AlexNet
VGG - 16
残差网络
残差块 (Residual block)
使用残差可以训练更深的网络
残差网络(Residual Network)
增加残差不会影响原始新性能,还可能提升性能