三維掃描儀的計(jì)算機(jī)視覺(也稱計(jì)算機(jī)視覺)是指用攝像機(jī)和計(jì)算機(jī)代替人眼對(duì)目標(biāo)進(jìn)行識(shí)別、跟蹤和測(cè)量等,它是人工智能領(lǐng)域最熱門的研究課題之一,它和專家系統(tǒng)、自然語(yǔ)言理解已成為人工智能領(lǐng)域最活躍的三大領(lǐng)域。盡管它還沒有形成完整的理論體系,在很多方面它解決問題的方法還是一種技巧,但它是實(shí)現(xiàn)工業(yè)生產(chǎn)高度自動(dòng)化、機(jī)器人智能化、自主車導(dǎo)航、目標(biāo)跟蹤,以及各種工業(yè)檢測(cè)、醫(yī)療和軍事應(yīng)用的核心內(nèi)容之一,也是實(shí)現(xiàn)智能機(jī)器人的關(guān)鍵因素之一,它的發(fā)展不僅將大大推動(dòng)智能系統(tǒng)的發(fā)展,也將拓寬計(jì)算機(jī)與各種智能機(jī)器的研究范圍和應(yīng)用領(lǐng)域。
三維掃描儀機(jī)器視覺是研究用計(jì)算機(jī)來模擬生物外顯或宏觀視覺功能的科學(xué)和技術(shù)。機(jī)器視覺系統(tǒng)的首要目標(biāo)是用圖像創(chuàng)建或恢復(fù)現(xiàn)實(shí)世界模型,然后認(rèn)知現(xiàn)實(shí)世界。機(jī)器視覺系統(tǒng)獲取的場(chǎng)景圖像一般是灰度圖像,即三維場(chǎng)景在二維平面上的投影。此時(shí),場(chǎng)景三維信息只能通過灰度圖像或灰度圖像序列來恢復(fù)處理,這種恢復(fù)需要進(jìn)行多點(diǎn)對(duì)一點(diǎn)的映射逆變換。在信息恢復(fù)過程中,還需要有關(guān)的場(chǎng)景知識(shí)和投影幾何知識(shí)。
三維掃描儀機(jī)器視覺是一個(gè)相當(dāng)新且發(fā)展十分迅速的研究領(lǐng)域,并成為計(jì)算機(jī)科學(xué)的重要研究研究領(lǐng)域之一。機(jī)器視覺是在20 世紀(jì)50 年代從統(tǒng)計(jì)模式識(shí)別開始的,當(dāng)時(shí)的工作主要集中在二維圖像分析和識(shí)別上,如光學(xué)字符識(shí)別、工件表面、顯微圖片和航空?qǐng)D片的分析和解釋等。60 年代,Roberts (1965)通過計(jì)算機(jī)程序從數(shù)字圖像中提取出諸如立方體、楔形體、棱柱體等多面體的三維結(jié)構(gòu),并對(duì)物體形狀及物體的空間關(guān)系進(jìn)行描述。Roberts 的研究工作開創(chuàng)了以理解三維場(chǎng)景為目的的三維機(jī)器視覺的研究。Roberts對(duì)積木世界的創(chuàng)造性研究給人們以極大的啟發(fā),許多人相信,一旦由白色積木玩具組成的三維世界可以被理解,則可以推廣到理解更復(fù)雜的三維場(chǎng)景。于是,人們對(duì)積木世界進(jìn)行了深入的研究。研究的范圍從邊緣、角點(diǎn)等待征提取,到線條、平面、曲面等幾何要素分析,—直到圖像明暗、紋理、運(yùn)動(dòng)以及成像幾何等,并建立了各種數(shù)據(jù)結(jié)構(gòu)和推理規(guī)則。到了70 年代,已經(jīng)出現(xiàn)了一些視覺應(yīng)用系統(tǒng)。
70 年代中期,麻省理工學(xué)院(MIT)人工智能(AI)實(shí)驗(yàn)室正式開設(shè)“機(jī)器視覺”(Machine Vision)課程,由國(guó)際著名學(xué)者B.K.P.Horn 教授講授.同時(shí),MIT AI實(shí)驗(yàn)室吸引了國(guó)際上許多知名學(xué)者參與機(jī)器視覺的理論、算法、系統(tǒng)設(shè)計(jì)的研究。David Marr 教授就是其中的一位。他于1973 年應(yīng)邀在MIT AI 實(shí)驗(yàn)室領(lǐng)導(dǎo)一個(gè)以博士生為主體的研究小組,1977 年提出了不同于“積木世界”分析方法的計(jì)算視覺(computational vision)理論,該理論在80 年代成為機(jī)器視覺研究領(lǐng)域中的一個(gè)十分重要的理論框架。
Marr 視覺計(jì)算理論立足于計(jì)算機(jī)科學(xué),系統(tǒng)地概括了心理生理學(xué)、神經(jīng)生理學(xué)等方面業(yè)已取得的所有重要成果。是三維掃描儀視覺研究中迄今為止最為完善的視覺理論。Marr建立的視覺計(jì)算理論,使計(jì)算機(jī)視覺研究有了一個(gè)比較明確的體系,并大大推動(dòng)了計(jì)算機(jī)視覺研究的發(fā)展。人們普遍認(rèn)為,計(jì)算機(jī)視覺這門學(xué)科的形成與Marr 的視覺理論有著密切的關(guān)系。Marr 視覺計(jì)算理論將整個(gè)視覺過程所要完成的任務(wù)分成三個(gè)過程,而獲得這些表示的過程依次稱為初級(jí)視覺、中級(jí)視覺和高級(jí)視覺,如圖1 所示。
Marr 視覺過程中的三個(gè)階段
可以說.對(duì)三維掃描儀機(jī)器視覺的全球性研究熱潮是從20 世紀(jì)80 年代開始的,到了80年代中期,機(jī)器視覺獲得了蓬勃發(fā)展,新概念、新方法、新理論不斷涌現(xiàn)。有學(xué)者對(duì)計(jì)算機(jī)視覺理論的發(fā)展提出了不同的意見和建議。對(duì)Marr 的理論框架作了種種的批評(píng)和補(bǔ)充,綜合這些意見及補(bǔ)充可得如圖2 所示的框架。
補(bǔ)充的Marr 理論框架
同時(shí),在擴(kuò)充的理論框架中,引入了三維掃描儀主動(dòng)視覺的研究方法,在研究中重視了對(duì)定性、有目的的視覺等的研究[。比如,基于感知特征群的物體識(shí)別理論框架、主動(dòng)視覺理論框架、視覺集成理論框架等。到目前為止,機(jī)器視覺仍然是一個(gè)非?;钴S的研究領(lǐng)域。許多會(huì)議論文集都反映了該領(lǐng)域的最新進(jìn)展,比如,國(guó)際計(jì)算機(jī)視覺與模式識(shí)別會(huì)議(InternationalConference on Computer Vision and Pattern Recognition,CVPR);國(guó)際計(jì)算機(jī)視覺會(huì)議(InternationalConference on Computer Vision ,ICCV) ; 國(guó)際模式識(shí)別會(huì)議(International Conference on Pattern Recognition, ICPP);國(guó)際機(jī)器人學(xué)與自動(dòng)化會(huì)議(International Conference on Robotics and Automation,ICRA);計(jì)算機(jī)視覺研討會(huì)(Workshop on Computer Vision, WCV)以及許多SPIE 的會(huì)議。還有許多學(xué)術(shù)期刊也包含了這一領(lǐng)城的最新研究成果,如,IEEE Transaction on Pattern Analysis and Machine16Intelligence(PAMI);Computer Vision,Graphics,and Image Processing (CVGIP);IEEE高層知識(shí): 物體模型Transaction on ImageProcessing;IEEE Transaction on Man,and Cybernetics (SMC);MachineVisionandApplications;International Journal on Computer Vision (IJCV);Imageand Vision Computing;Pattern Recognition。另外,每年還出版許多研究專集、學(xué)術(shù)著作、技術(shù)報(bào)告,專題討論會(huì)文集等.所有這些都是研究機(jī)器視覺及其應(yīng)用的很好信息來源。機(jī)器視覺系統(tǒng)主要由三部分組成:圖像的獲取、圖像的處理和分析、輸出或顯示。
轉(zhuǎn)載請(qǐng)注明出處。