[影像識別] 從單張影像識別出人類可工作區域 @ Frank's 資訊科技潮流站

本篇文章與個人期中報告同步

動機

以往我們的物件偵測，都是用2D框出來

因此輸入2D的照片，輸出的也是2D資訊。

這有什麼缺點？

這樣我們無法評估一個人能夠和這張圖的環境有什麼互動。

要解決這個問題，就要以3D的方式，表現出偵測到的3D物件。

觀察與發現

通常要表示一個3D世界，就要有一個3D的世界坐標系

而我們發現，房間的牆角剛好是呈現正交(Orthogonal)的

如果我們可以偵測出牆面和地板，或許就可以做出一個三維座標的模型

Lee et. al 提出一個 Room hypothesis ，可以從單張照片中判斷出不同牆面，以及地板。

剛好可以構成3D座標

voxel construction

確立了3D坐標系之後，就可以開始來建Voxel

我們假設整個3D坐標系的每一個點都有成為Voxel的可能

此時，我們來使用Hedal et. al的方法，來判斷一張2D影像中，

圖像可能為物件的可能性

接著，將剛才的3D voxel每個都投影回去2D

看看該2D的pixel的機率值是否大於0.5

如果是，就可以認為，那個voxel是存在的

www

此時，3D voxel組成的model就建好

但是，人類的家具大多是長方體

因此要進一步近似為長方體

ddx

Human workspace

最後，將人的模型也離散化為voxel，放入擺設看看，

如果可以放得進去的就是適合人的位置

huma

優缺點評析

優點：

1. 一種新穎的3D物件辨認方法

2. 結合了3D物件偵測以及人類空間

缺點：

1. 每個voxel都要投影回2D，很花時間

2. 因為需要room hypothesis，所以只能在室內做

3. 單張2D能提供的資訊畢竟比3D少，所以還是會出問題

huma

結論：

這篇提供的方法，只要會3D投影到2D，難度不會太難，

然而使用限制太多，是個嚴重的問題，

不過以voxel的概念去建立 human workspace，是很有意思的

參考資料：

Abhinav Gupta, Scott Satkin, Alexei A. Efros and Martial Hebert, From 3D Scene Geometry to Human Workspace, Computer Vision and Pattern Recognition, 2011. (PDF)

finalfrank

Frank's 資訊科技潮流站

finalfrank 發表在痞客邦留言(1) 人氣()

E-mail轉寄

Frank's 資訊科技潮流站

介紹最新的資訊技術及應用

[影像識別] 從單張影像識別出人類可工作區域

留言列表

文章搜尋

從【分類】找文章

趨勢 Trends (1)

電腦視覺 Computer Vision (5)

影像處理 Image Processing (9)

電腦圖學 Computer Graphics (3)

人工智慧 Artificial Intelligence (3)

法學資訊系統 Law System (1)

資料庫與雲端運算 Database&Cloud (3)

電腦網路 Computer Networks (3)

演算法與資料結構 Algo. & DS. (6)

程式設計 Programming (5)

遊戲設計 Game Design (3)

電腦醫院 Computer Doctor (1)

其他 (3)

文章彙整

最新留言

參觀人氣