㈠ 把图像输入深度学习网络中先缩小,对准确率有影响吗
没有。
深度学习利用了ResNet-50、MobileNetV2和MaskR-CNN等神经网络的相同结构,同时接受频域信息作为输入,即使在输入大小为一半的情况下,该方法仍能裤判将ResNet-50的前1位精度提高1.42%。
频域学习比传统的空间降采样方法(穗纯闭将图像空间大小调整为224×224,大多数CNN模型的默认输入大小)在预处理阶段更好猜裂地保留了图像信息,从而提高了精度。
㈡ 你有哪些炼丹神器深度学习(rnn、cnn)调参的经验
对于 rnn 和 cnn 这种深度学习模型,常掘局明用的炼丹神器可能包括:
调节学习率:学习率较小可以保证模型在训练时稳定,但是训练速度腊轮较慢;学习率较大可能会使模型在训练时快速收敛,但是有可能导致过拟合。
调节隐藏单元数量:隐藏单元较多可以增加模型的表示能力,但是有可能导致过拟合。
调节激活函数:激活函数的选择会影响模型的表示能力和泛化能力。
调节正则化系数:正则化系数较大可以降低模型的复杂度,但是有可能导致模型表示能力降低。
调节批量大小:批量大判告小较小可以使模型更稳定,但是训练速度较慢;批量大小较大可以提升训练速度,但是有可能导致模型的泛化能力下降。
常用的调参方法包括网格搜索、随机搜索和贝叶斯优化等。
㈢ 目标检测系列 Mask R-CNN—图片预处理
在图片输入到神经网络前需要进行有些必烂孙要预处理工作。
减去均值 :均值向量(3 X 1,为每个颜色通道的均值)是所有训练图像上像素值的均值,并且在测试阶段也从输入图像中减去图像。
重新缩放 :这里会考虑两个参数分别是目标尺寸和最大尺寸。将图片的较短的边(宽或高)调整为目标尺寸,然后保持长宽比例饥消链来调整较长边 (宽或高),以保持长宽比不变。但是,如果调整后较长边(宽或高)超过了最大尺寸,则需要将该边的尺寸调整为最大尺寸,并根据原始长宽比例来调整较短边(宽或高),从而保持长宽比不变。目标大小和最大大小的默认值分别为 800 和 1333。
边缘填充 :因为使用 FPN,所以边缘填充是必要的。 所有填充仅在最右边和最底端的边缘,因此目标坐标不会受到影响,坐标系是从最左上角开始的。 如果不使用 FPN,则无需执行此步骤。
图片宽度为最小边 (600) ,将其桥首重新缩放为 800 后,另一个高尺寸根据宽高比例调整大小得到新的高为(1200),但是 1200 不是 32 的倍数,需要对其进行填充为使得结果大小为 32 倍数(1216/32 = 38)。
注意 :用于锚点生成和卷积步骤的图像高度和宽度将被视为调整大小后的图像,而不是填充后的高度。