㈠ 把圖像輸入深度學習網路中先縮小,對准確率有影響嗎
沒有。
深度學習利用了ResNet-50、MobileNetV2和MaskR-CNN等神經網路的相同結構,同時接受頻域信息作為輸入,即使在輸入大小為一半的情況下,該方法仍能褲判將ResNet-50的前1位精度提高1.42%。
頻域學習比傳統的空間降采樣方法(穗純閉將圖像空間大小調整為224×224,大多數CNN模型的默認輸入大小)在預處理階段更好猜裂地保留了圖像信息,從而提高了精度。
㈡ 你有哪些煉丹神器深度學習(rnn、cnn)調參的經驗
對於 rnn 和 cnn 這種深度學習模型,常掘局明用的煉丹神器可能包括:
調節學習率:學習率較小可以保證模型在訓練時穩定,但是訓練速度臘輪較慢;學習率較大可能會使模型在訓練時快速收斂,但是有可能導致過擬合。
調節隱藏單元數量:隱藏單元較多可以增加模型的表示能力,但是有可能導致過擬合。
調節激活函數:激活函數的選擇會影響模型的表示能力和泛化能力。
調節正則化系數:正則化系數較大可以降低模型的復雜度,但是有可能導致模型表示能力降低。
調節批量大小:批量大判告小較小可以使模型更穩定,但是訓練速度較慢;批量大小較大可以提升訓練速度,但是有可能導致模型的泛化能力下降。
常用的調參方法包括網格搜索、隨機搜索和貝葉斯優化等。
㈢ 目標檢測系列 Mask R-CNN—圖片預處理
在圖片輸入到神經網路前需要進行有些必爛孫要預處理工作。
減去均值 :均值向量(3 X 1,為每個顏色通道的均值)是所有訓練圖像上像素值的均值,並且在測試階段也從輸入圖像中減去圖像。
重新縮放 :這里會考慮兩個參數分別是目標尺寸和最大尺寸。將圖片的較短的邊(寬或高)調整為目標尺寸,然後保持長寬比例飢消鏈來調整較長邊 (寬或高),以保持長寬比不變。但是,如果調整後較長邊(寬或高)超過了最大尺寸,則需要將該邊的尺寸調整為最大尺寸,並根據原始長寬比例來調整較短邊(寬或高),從而保持長寬比不變。目標大小和最大大小的默認值分別為 800 和 1333。
邊緣填充 :因為使用 FPN,所以邊緣填充是必要的。 所有填充僅在最右邊和最底端的邊緣,因此目標坐標不會受到影響,坐標系是從最左上角開始的。 如果不使用 FPN,則無需執行此步驟。
圖片寬度為最小邊 (600) ,將其橋首重新縮放為 800 後,另一個高尺寸根據寬高比例調整大小得到新的高為(1200),但是 1200 不是 32 的倍數,需要對其進行填充為使得結果大小為 32 倍數(1216/32 = 38)。
注意 :用於錨點生成和卷積步驟的圖像高度和寬度將被視為調整大小後的圖像,而不是填充後的高度。