1 運行機制
:計算機視覺工具包。
.:常用數據集的實現,如MNIST,CIFAR-10,等。
.model:常用的模型預訓練,如ps水平翻轉圖象圖片講解,VGG,,等。
1.1 初探
.:常用的圖像預處理方法。
類似于五年高考三年模擬,模擬的習題就是數據增強生成的圖片。
機制流程圖1.2 數據標準化
()
功能:逐的對圖像進行標準化
\rm = (input - mean)/std
mean: 各通道的均值
std: 各通道的標準差
: 是否原地操作
對數據進行標準化之后可以加速模型的收斂。
2 數據增強
數據增強又稱為數據增廣ps水平翻轉圖象圖片講解,數據擴增,它是對訓練集進行變換,使訓練集更豐富,從而提高模型的泛化能力。
2.1 裁剪
1
()
功能:從圖像中心裁剪圖片
size: 所需裁剪圖片尺寸
PS: 如果size參數大于圖片尺寸,則會填充上全黑的像素
2
()
功能:從圖片中隨機裁剪出尺寸為size的圖片,(然后進行?)
size: 所需裁剪圖片尺寸。
: 設置填充大小,可傳入tuple。
(1) 當為a時,上下左右填充a個像素;(?)
(2) 當為(a,b)時,上下填充b個像素,左右填充a個像素;(?)
(3) 當為(a,b,c,d)時,左、上、右、下分別填充a、b、c、d
: 若圖像尺寸小于size則填充。換句話說,當size大于圖像尺寸時必須為Ture。
: 填充模式,有4種模式。
(1) : 默認模式,像素值由fill設定。
(2) edge: 像素值由圖像邊緣像素決定。
(3) : 鏡像填充,最后一個像素不鏡像,eg: [1,2,3,4]\[|1|,2,3,|4|]\[3,2|1,2,3,4|3,2]
(4) :鏡像填充,最后一個像素鏡像,eg: [1,2,3,4]\[|1|,2,3,|4|]\[2,1|1,2,3,4|4,3]
fill: 當為時,設置填充的三通道像素值的tuple。
3
()
功能:隨機大小、長寬比裁剪圖片
size: 所需裁剪圖片尺寸
scale: 隨機裁剪面積比例,默認(0.08,1)
ratio: 隨機長寬比,默認(3/4,4/3)
: 插值方法,有,,.2 翻轉
1
()
2
()
功能:依概率水平(左右)或垂直(上下)翻轉圖片
p: 翻轉概率2.3 旋轉
1
()
功能:隨機旋轉圖片
: 旋轉角度。當為 a 時,在 (-a,a) 之間選擇旋轉角度;當為 (a,b) 時,在 (a,b) 之間選擇旋轉角度。
: 重采樣方法
: 是否擴大圖片,以保持原圖信息,防止因為旋轉而超出圖片框
: 旋轉點設置,默認中心旋轉2.4 圖像變換
1 填充
Pad()
功能:對圖像邊緣進行填充
: 設置填充大小
: 填充模式,有、edge、、和
fill: 當為時,設置填充的三通道像素值的tuple
2 色彩
()
功能:調整亮度、對比度、飽和度和色相
: 亮度參數。
(1) 當為 a 時,從 [max\{0,1-a\},1+a] 中隨機選擇
(2) 當為 (a,b) 時,從 [a,b] 中隨機選擇
: 對比度參數
: 飽和度參數
hue: 色相參數
由于自然圖像的采集過程中光線、環境或者設備的不同,對色彩有偏差,因此我們要對圖像進行色彩的調整,來彌補色彩帶來的擾動。
3 灰度圖
4
功能:依概率將圖片轉換為灰度圖
: 輸出通道數,只能設1或3
p: 概率值
5 仿射變換
()
功能:對圖像進行仿射變換,分別是旋轉,平移、縮放、錯切和翻轉
: 旋轉角度設置
: 平移區間設置
scale: 縮放比例
: 填充顏色設置
shear: 錯切角度設置
: 重采樣方式
6 遮擋
()
功能:對圖像進行隨機遮擋
p: 概率值
scale: 遮擋區域的面積
ratio: 遮擋區域長寬比
value: 設置遮擋區域的像素值
參考文獻: Data
2.5 函數
.()
功能:用戶自定義方法
lambd: 匿名函數2.6 的操作
1
()
功能:從一系列方法中隨機挑選一個
2
()
功能:依概率執行一組操作
3
()
功能:對一組操作打亂順序
3 自定義
自定義要素:
通過類實現多參數傳入。
4 數據增強實戰
原則:觀察訓練集和測試集之間的區別,讓訓練集與測試集更接近