您的位置:網站首頁 > 電器維修資料網 > 正文 >
電腦讀懂肢體語言——體感操控技術的全面認識
★★★★★【文章導讀】:電腦讀懂肢體語言——體感操控技術的全面認識具體內容是:重力監控,走出體感的第一步手,是人類各種創造性活動的天然工具,而自古以來手勢就是一套特定的語言系統,在人的交流中發揮著重要的作用。不過要單純的電腦識別一個看似簡單動作卻是一個很復雜的過程。體感控制技術…
來源: 日期:2013-11-17 19:40:16 人氣:標簽:
重力監控,走出體感的第一步
手,是人類各種創造性活動的天然工具,而自古以來手勢就是一套特定的語言系統,在人的交流中發揮著重要的作用。不過要單純的電腦識別一個看似簡單動作卻是一個很復雜的過程。體感控制技術的工作就是讓電腦要能在這些眾多可能性中識別動作的 終含義——讓電腦理解你!
那么怎么才能做到這一點呢?我們都知道,一個初生嬰兒很難區分出一個手語的含義,但我們通過多年的學習和訓練可以在幾分之一秒內做到。而體感控制技術也以類似的方法被創造出來,陀螺儀就是其中技術關鍵的突破點,它觀察身邊的世界,注意你的動作變化。借助重力監控,讓系統來通過手勢的“力度”識別手語:借助“加速度計-陀螺儀”組合,再通過測量設備的位移變化結合軟件實現指令操作。
如wii remote手柄、一些支持體感操作的電視遙控器、智能手機就是采用這種方式來讀懂你的手語。不過,這種手勢輸入控制方式只能提供簡單的指令操作,嚴格來說并不是人機交互范疇—一因為系統只會進行簡單“識別”而不是“思考”。這時以微軟kinect為代表的新一代手勢控制方式的出現向傳統智慧提出了挑戰——從感應向感觀方向過渡。
結構光模式,讓體感系統長眼睛
直接讓電腦“看見”手勢無疑是 直接的指令控制方式。為了實現這一目標,計算機視覺技術一直在努力向堪比人類大腦的智能方向發展,以更好地了解場景,因為如果不能解釋周圍的世界,計算機就無法與人實現自然交流對接。不過讓電腦看見很容易,但如何感受到動作的意思就相對復雜得多。人眼能看到3d對象,能自然識別(x,v,z)坐標軸,從而能夠看到一切事物,而大腦能夠以3d影像的形式表達這些坐標軸。機器無法獲得3d視覺的一大挑戰就是第三坐標——z軸坐標的獲取。
針對這個問題,開發人員開發出了結構光模式用來測量或掃描3d對象,讓電腦像人一樣擁有3d視覺。在該類系統中,可在整個對象上照射結構光模式,光模式可使用激光照明干擾創建,也可使用投影影像創建。一旦系統捕捉到操作者的肢體動作,就會進行分析與比較,一旦與設定的動作相一致,就執行已設定的操作。不過結構光模式的結構復雜、成本高的缺點讓它難以在消費級市場普及,后來開發人員在這基礎上推出了成本更低的“light coding”掃描模式。
light coding,顧名思義就是用光源照明給需要測量的空間編上碼,說到底還是結構光技術。但與傳統的結構光方法不同的是,他的光源打出去的并不是一副周期性變化的二維的圖像編碼,而是一個具有三維縱深的“體編碼”。這種光源叫做激光散斑(laserspeckle),是當激光照射到粗糙物體或穿透毛玻璃后形成的隨機衍射斑點。這些散斑具有高度的隨機性,而且會隨著距離的不同變換圖案,這樣識別設備就可以輕易判定出圖像中哪部分才是移動物體,并進行分析與比較。
kinect引出的人機交互方式
微軟正是在light coding這種技術基礎上,推出了基于xbox360游戲主機的體感設備——kinect。
為了教會kinect辨識,微軟專門開發了一個復雜的人工智能系統:數以tb計的數據被輸入到集群系統中來教會kinect以像素級技術來辨認手、腳以及它看到的其他身體部位。kinect會評估模型輸出的每一個可能的像素來確定關節點,通過這種方式kinect能夠基于充分的信息 準確地評估人體實際所處位置,然后利用對用戶動作的 佳推測來作出相應操作。
目前微軟正在努力重塑現有計算機上的人機交互方式,其中的一個目標是把kinect該款成功的游戲外設部署在他們無所不在的視窗操作系統上面,微軟稱為“kinect for windows”。
不過,基于light coding技術仍無法完全擺脫固有的缺點——受攝像頭及設備性能的制約,分辨率和精度都不太理想,如kinect的識別精度在4mm左右、分辨率在160×120像素~640×480像素之間,這就要求使用者在控制時需要有較大的動作幅度。這時時差測距傳感器技術(tof)的出現,為體感控制的發展提供了新的思路。
tof傳感,體感控制的第六感官
時差測距傳感器系統是一種光雷達(lidar)系統,同樣可從發射極向對象發射光脈沖。接收器則可通過計算光脈沖從發射器到對象,再以像素格式返回到接收器的運行時間來確定被測量對象的距離,并通過相應運算來獲得整個場景,確定3d范圍影像。這種不用“看”就能知道手語的方式,似乎讓電腦等設備擁了的第六感觀,更為神奇。
近期受大家關注的leapmotion leap3d手控設備就采用tof系統。該產品內置cmos傳感器和紅外線led,利用cmos傳感器捕捉物體反射的紅外線來實現動作檢測:led光掃描系統,就像是超市的掃描槍一樣,形成一個光線網,一旦光網內的手指移動就會引起紅外線反射,leap3d探知手指所在位置和移動方向的同時,利用雙攝像頭進行立體拍攝,這就可以對紅外區域探知的移動進行重點分析和檢測出三維動作。tof系統除了可以光波掃描外,聲波也是其中一個采樣方式。微軟研究院聯合華盛頓大學研發的“soundwave”系統就是利用聲波代替光波來實現手勢識別的。
相對于kinect這類采用結構光技術方案,tof系統軟件復雜程度通常較低,很容易利用已有的、已經商品化的硬件將電腦變成手勢識別接口。不過這種控制方式也存在一個缺點,那就是手勢操控距離較短,如leapmotion的leap只有在50厘米以內才能夠實現手勢操控,這就意味著失去了“遠程手勢操控”的能力。
從市場來看,windows版kinect設備預計將在今年上半年上市,售價為249美元。如果你認為微軟不夠厚道,那么leapmotion所推出的leap 3d或許就是不錯的選擇。這臺小巧的設備可以感應8立方英尺內的任何動作,甚至可以同時識別不同手指間以及鉛筆的差別,即便是0.01毫米的細微動作變化也能被leap捕捉到, 重要的是售價僅70美元。
【看看這篇文章在百度的收錄情況】
相關文章
- 上一篇: DLNA不能用?PSV繞道無線看高清
- 下一篇: MD的中文解釋