【摘要】:在當(dāng)前的目標(biāo)檢測(cè)領(lǐng)域中,行人檢測(cè)有著不可取代的地位,它既是該領(lǐng)域中的難點(diǎn)問題,也是廣大研究者關(guān)注的熱點(diǎn)問題。近年來,鑒于人工智能的迅速發(fā)展,使得行人檢測(cè)技術(shù)在精度和速度上有了進(jìn)一步的提升需求。深度學(xué)習(xí)作為當(dāng)前很熱門的機(jī)器學(xué)習(xí)算法svm cnn 行人檢測(cè) 比較,因此它在行人檢測(cè)領(lǐng)域的應(yīng)用是一個(gè)值得關(guān)注的研究方向。本文圍繞基于機(jī)器學(xué)習(xí)的行人檢測(cè)方法展開,從基礎(chǔ)理論出發(fā),詳細(xì)地闡述了行人的特征表示與分類策略,系統(tǒng)地歸納了現(xiàn)今行人檢測(cè)問題的關(guān)鍵困難點(diǎn)以及已有方法所留存的問題。研究表明傳統(tǒng)的HOG+SVM和CNN深度學(xué)習(xí)方法存在提取到的行人特征復(fù)雜、計(jì)算量大,并且檢測(cè)結(jié)果容易受到遮擋、復(fù)雜背景以及光照等因素的影響等弊端。因此,提出了一種改進(jìn)的CNN模型,該模型主要有以下兩個(gè)階段完成。(1)首先通過分析已有的基于CNN的行人檢測(cè)算法的性能,發(fā)現(xiàn)其都是直接對(duì)原始圖像進(jìn)行卷積操作的,這使得計(jì)算量非常之大,并且檢測(cè)結(jié)果易受復(fù)雜背景的影響,對(duì)此本文提出先對(duì)待檢圖片進(jìn)行預(yù)處理,過濾一些沒有用的特征,再對(duì)其進(jìn)行卷積操作。本文分別對(duì)待檢圖片做了梯度預(yù)處理和紋理預(yù)處理,分析在不同預(yù)處理操作下算法的檢測(cè)性能,實(shí)驗(yàn)表明經(jīng)過紋理預(yù)處理之后的檢測(cè)性能優(yōu)于經(jīng)過梯度預(yù)處理后的檢測(cè)性能。(2)利用選擇性搜索算法對(duì)待檢圖片提取行人預(yù)選框,以應(yīng)對(duì)滑動(dòng)窗口法所帶來的預(yù)選框數(shù)量龐大的問題;再對(duì)提取到的預(yù)選框進(jìn)行放縮,使其統(tǒng)一成64*128大小的灰度圖像,接著對(duì)縮放后的圖像進(jìn)行紋理預(yù)處理,過濾掉復(fù)雜背景svm cnn 行人檢測(cè) 比較,突出行人的紋理特征;最后將經(jīng)過紋理預(yù)處理過的特征圖輸入到CNN模型中進(jìn)行檢測(cè),實(shí)驗(yàn)結(jié)果表明,改進(jìn)后的CNN模型在每張圖片中錯(cuò)誤的正例(False Per Image,FPPI)占總的正例的比率為0.1時(shí),漏檢率為27.2%,相比經(jīng)典的CNN的38.4%而言降低了 11.2%。