『壹』 人們識別圖像是靠形狀,那AI是怎麼識別圖像的
德國研究團隊給出一個原因,這個原因出乎意料:人類會關注圖中對象的形狀,深度學習計算機系統所用的演算法不一樣,它會研究對象的紋理。
德國圖賓根大學科學家Geirhos領導的團隊採用獨特方法進行研究。去年,團隊發表報告稱,他們用特殊噪點干擾圖像,給圖像降級,然後用圖像訓練神經網路,研究發現,如果將新圖像交給系統處理,這些圖像被人扭曲過(相同的扭曲),在識別扭曲圖像時,系統的表現比人好。不過如果圖像扭曲的方式稍有不同,神經網路就無能為力了,即使在人眼看來圖像的扭曲方式並無不同,演算法也會犯錯。當你在很長的時間段內添加許多噪點,圖中對象的形狀基本不會受到影響;不過即使只是添加少量噪點,局部位置的架構也會快速扭曲。研究人員想出一個妙招,對人類、深度學習系統處理圖片的方式進行測試。
演算法將圖像分成為小塊,接下來,它不會將信息逐步融合,變成抽象高級特徵,而是給每一小塊下一個決定,比如這塊包含自行車、那塊包含鳥。再接下來,演算法將決定集合起來,判斷圖中是什麼,比如有更多小塊包含自行車線索,所以圖中對象是自行車。演算法不會考慮小塊之間的空間關系。結果證明,在識別對象時系統的精準度很高。