仿生系列2--誰的視力更出色?
導(dǎo)言:眼睛是人類感知世界的重要感覺器官,然而它們的視力畢竟是有限的。人們一直在努力通過科技的進(jìn)步打造電子的“千里眼”,但迄今為止這些電子眼仍有明顯的不足。研究人員已經(jīng)在“教”它們彌補(bǔ)弱勢(shì),像人類一樣觀察事物。
博樂機(jī)器人表演--機(jī)器人演出的開拓者
目前,天文學(xué)家通過哈勃望遠(yuǎn)鏡觀察到的最遠(yuǎn)星系距離地球132億光年,而最先進(jìn)的電子顯微鏡可以觀察到0.1nm的原子。這組令人印象深刻的數(shù)字可以說明,人們已經(jīng)通過自己發(fā)明的電子眼大大延伸和拓展了視野。
的確,通過機(jī)器可以采集到更清晰的畫面,獲得更多的細(xì)節(jié)信息。而且,鏡頭捕捉到的所有畫面信息都能被完整地記錄下來,但人眼卻無法做到這些。既然如此,科學(xué)家們?yōu)槭裁慈栽诨ㄙM(fèi)大量時(shí)間和精力,研發(fā)仿真人眼的技術(shù)呢?這是因?yàn)榕c“盲目”的機(jī)器人相比,人類知道自己的目光應(yīng)該在何時(shí)聚焦到何處,即使獲取到的畫面質(zhì)量很低,也可以智能地解析出最需要的答案。
大腦虛構(gòu)了圖像
人類可以輕松地將視覺的焦點(diǎn)(注意力)集中于目標(biāo)之上,獲取目標(biāo)某一部分最清晰、最佳對(duì)比度的畫面。但是,人類的視覺焦點(diǎn)范圍非常有限,常常以為自己看到了一切,但是真正能留下印象的,只有幾個(gè)細(xì)節(jié)。另外,由于人眼對(duì)亮度較敏感,而對(duì)色度不太敏感,所以我們自己認(rèn)為看到的圖像就是最完美的,其實(shí)只是因?yàn)槿四X的補(bǔ)償能力很強(qiáng),色差已經(jīng)統(tǒng)統(tǒng)被我們的大腦忽略了(視頻壓縮就利用了該原理,通常將顏色信息刪減一些之后,經(jīng)色差處理過的圖像與原始圖像的差異仍然很難被察覺)。相比于色差,人眼的生理視覺盲點(diǎn)常常是引起交通事故的關(guān)鍵原因,更加可怕。
事實(shí)上,在成像質(zhì)量上,鏡頭比人眼更加強(qiáng)大——為了減少錯(cuò)誤,鏡頭由一組分散透鏡和會(huì)聚透鏡組成,由不同類型的玻璃透鏡采集到的畫面,在按下快門的一剎那被整合為一張完美的圖像。但是鏡頭的弱點(diǎn)是可視角度偏弱,普通的鏡頭只能捕捉到面前約90°~100°的圖像,而眼睛的可視角度幾乎達(dá)到了180°,但是只有目光聚焦的一些角度是清晰的。另外,眼睛所看到的畫面中,只有視覺中心的部分是全彩色的,因?yàn)樨?fù)責(zé)讀取色彩的視錐細(xì)胞在視網(wǎng)膜中央分布密集,在周邊區(qū)域則相對(duì)較少。
鏡頭可以捕捉到多少細(xì)節(jié)以及哪些顏色,由圖像傳感器上的感光元件數(shù)量和紅綠藍(lán)組成的色彩過濾層質(zhì)量所決定。需要注意的是,鏡頭的像素?cái)?shù)越高,照片理論上可染色點(diǎn)就越多。但是打印照片沒有必要盲目追求高像素。通常普通的5寸照片(約
綜合來看,眼睛的成像質(zhì)量是無法與鏡頭相比的。眼睛無法獲取現(xiàn)實(shí)世界最真實(shí)的影像,但是聰明的大腦有選擇地忽略了錯(cuò)誤,根據(jù)不完整的信息為我們生成了一個(gè)完美的世界。相比之下,鏡頭可以采集到更完美的圖像,只可惜鏡頭無法智能地判斷應(yīng)該將焦點(diǎn)置于何處。
攝像頭要學(xué)會(huì)思考
自適應(yīng)三維目標(biāo)探測(cè)相機(jī)(Three-dimensional Adaptive Camera with Object Detection and Foveation,簡(jiǎn)稱TACO)研發(fā)團(tuán)隊(duì)希望解決攝像頭不會(huì)思考的問題,使機(jī)器能夠以一種更加自然和類人的方式觀察周圍環(huán)境。該計(jì)劃的研究者沒有使用傳統(tǒng)的二維攝像頭,他們致力于研制出比當(dāng)前激光掃描儀更加快速、廉價(jià)、性能優(yōu)越的3D傳感器,據(jù)稱采用這種視頻仿眼處理器的3D傳感器的分辨能力將比現(xiàn)存?zhèn)鞲衅鞯姆直婺芰μ岣?/span>10倍。來自維也納科技大學(xué)的工程師、TACO團(tuán)隊(duì)成員皮特向我們解釋了TACO系統(tǒng)如何識(shí)別現(xiàn)實(shí)世界的3D模型:嚴(yán)格來說,我們的攝像頭就像一臺(tái)激光掃描儀,它每秒鐘發(fā)射100萬激光脈,激光脈沖射線分別從水平和垂直方向掃描攝像頭前的情景。就像眼睛一樣,TACO攝像頭擁有寬廣的視角,但只生成低分辨率的圖像。只有當(dāng)它發(fā)現(xiàn)感興趣的目標(biāo)時(shí),才會(huì)準(zhǔn)確對(duì)焦,采集到最佳質(zhì)量的圖像。拍攝結(jié)果就像一個(gè)熱成像圖一樣,亮的部分代表重要區(qū)域,暗的部分代表不重要的區(qū)域。
這項(xiàng)正在由歐盟贊助開發(fā)的技術(shù)將使機(jī)器眼可以應(yīng)用在更復(fù)雜的環(huán)境中。例如,汽車輔助駕駛系統(tǒng)的攝像頭可以協(xié)助用戶控制車頭燈、檢查路面情況以及識(shí)別司機(jī)容易忽視的道路信號(hào)。德國(guó)寶馬汽車的駕駛輔助系統(tǒng)和車輛結(jié)構(gòu)專家胡貝爾博士深知設(shè)計(jì)這一系統(tǒng)的重要性。他告訴我們,由于攝像頭需要負(fù)責(zé)3個(gè)不同的功能,而且每一個(gè)都不輕松,所以寶馬集團(tuán)使用了一項(xiàng)鮮為人知的小技巧——將攝像頭每秒鐘拍攝的45幀圖像分為3份,每個(gè)功能都可以獲得15幀圖像。從識(shí)別道路信號(hào)功能上看,攝像頭需要結(jié)合汽車導(dǎo)航系統(tǒng)提供的信息,將攝像頭采集到的即時(shí)圖像與數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行對(duì)比。在這里,圖像質(zhì)量其實(shí)無關(guān)緊要,一個(gè)普通的VGA定焦攝像頭足以勝任。
結(jié)論:攝像頭雖然還無法做到像人類一樣自主地觀察周圍的環(huán)境,但是作為人類的視覺輔助系統(tǒng),攝像頭常常在各個(gè)領(lǐng)域擔(dān)負(fù)著重要的使命。科學(xué)家們深知簡(jiǎn)單地重建人眼是完全沒有必要的,因?yàn)閷?duì)于人類而言,真正在看東西的其實(shí)是大腦。他們正在探索配置3D傳感系統(tǒng)的機(jī)器人在自主導(dǎo)航和與日常物品互動(dòng)方面的能力。相信未來,機(jī)器人將會(huì)在清潔、建設(shè)、修理、安全、保健、娛樂和個(gè)人援助等領(lǐng)域發(fā)揮重要的作用。