基於機器學習的物體辨識技術,主要分為三個部分,

1. 物體的特徵擷取 (Feature Extraction)

2. 分類演算法 (Classification Algorithm)

3. 偵測演算法 (Detection Algorithm)

 

我們這邊所稱的機器學習,指的是「監督式學習」

什麼是監督式學習呢?

簡單的說,你給電腦一大堆照片,告訴它這些都是人臉。

另外給一堆照片,告訴它這些絕對不可能是人臉。

理論上,重複這個動作,就可以讓學習的結果更為準確。

 

但是一開始,電腦絕對不知道要怎麼去認人臉,

我們要把人臉圖片的每一個像素都餵給電腦嗎?這樣做似乎頗為暴力,而且效果也不會好。

因此我們需要特徵擷取。

在這一部分的特徵,最常用的就是積分圖。

積分圖說穿了,就是把一張原始影像變成馬賽克影像...

然後把每一個區塊作為特徵。

如果有四個區塊,那麼就有四個特徵。

而這個影像裡面,只包含欲辨識的物體,其他什麼都不要。

當然,如果可以提出其他更好的方法作為特徵,那也是多多益善。

 

再來就是機器學習的部分

這裡的機器學習,指的是分類器,

主要是分成兩類,Yes or No

這種分類器可以是類神經網路模型,可以是支援向量機(SVM)

只要可以分Yes or No,並且吃特徵值為輸入的就行。

我們可以將前面提到的「特徵」餵給機器學習演算法,

一般來說要餵結果是Yes的圖形,還有結果是No的圖形

如果輸入的圖形,我們知道它確實是Yes,那麼就在結果的地方設定為Yes,反之亦然。

 

最後就是偵測的部分了

偵測的部分,可以設定一個Window,將想要確認是否為欲偵測物體的部分框起來,

再把該部分的特徵擷取出來

將該特徵丟回剛才所提到的分類器

看看得到的答案是Yes還是No

如果答案是Yes,就表示該區塊是欲辨識的物體,把它框起來

否則就不要框

 

講完了

 

最後,由於這個不是我的研究題目,所以如果我寫錯了,歡迎指正,但不要打我....XD


創作者介紹

Frank's 資訊科技潮流站

finalfrank 發表在 痞客邦 PIXNET 留言(0) 人氣()