Meta AI最近在官網(wǎng)發(fā)布了一個(gè)基礎(chǔ)模型——Segment Anything Model(SAM),并將其開源。該模型的本質(zhì)是使用基于Transform模型架構(gòu)的GPT方式,讓計(jì)算機(jī)具備理解圖像中一個(gè)個(gè)“對象”的通用能力。SAM模型可以接受文本提示,并基于海量數(shù)據(jù)訓(xùn)練而獲得泛化能力,從而實(shí)現(xiàn)圖像分割的重要任務(wù)。圖像分割有助于識(shí)別和確認(rèn)圖像中的不同物體,并將它們從背景中分離出來。這在自動(dòng)駕駛和醫(yī)學(xué)成像等應(yīng)用中特別重要。
根據(jù)CBInsight數(shù)據(jù),機(jī)器視覺是人工智能正在快速發(fā)展的一個(gè)分支,當(dāng)前中國已成為繼美國、日本之后的第三大機(jī)器視覺領(lǐng)域應(yīng)用市場。盡管作為新興技術(shù)和產(chǎn)業(yè),中國機(jī)器視覺行業(yè)規(guī)模相對較小,但其增速遠(yuǎn)快于全球,處于高速成長的階段。GGII預(yù)計(jì)到2025年,機(jī)器視覺市場規(guī)模將超過1200億元,行業(yè)具有長期廣闊的發(fā)展前景。
根據(jù)美國制造工程師協(xié)會(huì)(SME)機(jī)器視覺分會(huì)的定義,機(jī)器視覺是利用光學(xué)裝置和非接觸式傳感器自動(dòng)獲取和處理真實(shí)物體的圖像,以獲得所需信息或用于控制機(jī)器人運(yùn)動(dòng)的設(shè)備。機(jī)器視覺是人工智能、計(jì)算機(jī)科學(xué)、圖像處理和模式識(shí)別等領(lǐng)域合作完成的,它利用計(jì)算機(jī)、圖像傳感器和其他相關(guān)設(shè)備來模擬人類視覺功能,賦予機(jī)器“看”和“認(rèn)知”的能力。
機(jī)器視覺設(shè)備通常包括兩個(gè)部分:
1)硬件部分,即“視”部分,包括光源、鏡頭、工業(yè)相機(jī)和圖像采集卡;
2)軟件部分,即“覺”部分,是系統(tǒng)的視覺處理軟件。機(jī)器視覺具有識(shí)別、測量、定位和檢測四大功能,其中檢測技術(shù)是最具挑戰(zhàn)性的。
逐步替代人工的機(jī)器視覺在工業(yè)領(lǐng)域相對于人眼視覺擁有顯著優(yōu)勢,如精度高、速度快、適應(yīng)性強(qiáng)、可靠性高、效率高等人工視覺無法比擬。
在我國,隨著人工成本增加、數(shù)字化轉(zhuǎn)型以及制造業(yè)效率和質(zhì)量要求提高的背景下,機(jī)器視覺正在被廣泛應(yīng)用。
根據(jù)行業(yè)研究數(shù)據(jù)庫行行查的資料顯示,機(jī)器視覺產(chǎn)業(yè)可以分為上游、中游和下游終端應(yīng)用三個(gè)部分。
上游的范圍較為廣泛,包括光源、工業(yè)鏡頭、工業(yè)相機(jī)、圖像采集卡以及軟件和算法平臺(tái)等環(huán)節(jié);
中游是機(jī)器視覺產(chǎn)業(yè)鏈最核心的環(huán)節(jié),由視覺系統(tǒng)和視覺裝備集成構(gòu)成;
下游則是應(yīng)用領(lǐng)域,廣泛應(yīng)用于電子、半導(dǎo)體、機(jī)器人、汽車、醫(yī)療等各個(gè)行業(yè)。
在一個(gè)典型的機(jī)器視覺系統(tǒng)中,硬件部分包括光源及光源控制器、鏡頭和相機(jī),負(fù)責(zé)成像。視覺控制系統(tǒng)則負(fù)責(zé)對成像結(jié)果進(jìn)行處理分析,并將輸出的分析結(jié)果傳輸至智能設(shè)備的其他執(zhí)行機(jī)構(gòu)。機(jī)器視覺應(yīng)用系統(tǒng)則由圖像捕捉、光源系統(tǒng)、圖像數(shù)字化模塊、數(shù)字圖像處理模塊、智能判斷決策模塊和機(jī)械控制執(zhí)行模塊組成。
光源及光源控制器
光源控制器與光源搭配使用,光源控制器負(fù)責(zé)供電和控制光源的狀態(tài)(亮/滅)、亮度、頻閃等。在機(jī)器視覺行業(yè)中,LED光源產(chǎn)品是主要采用的光源,其好壞取決于對比度、亮度和對位置變化的敏感程度。針對每個(gè)特定的應(yīng)用實(shí)例,目前還沒有通用的機(jī)器視覺照明設(shè)備,需要使用個(gè)性化的方案以達(dá)到最佳效果。
國內(nèi)光源行業(yè)的市場呈現(xiàn)出兩極分化的態(tài)勢,高端市場被CCS和AI等外企主導(dǎo),而中低端市場國產(chǎn)化率超過90%,國內(nèi)廠商競爭激烈。其中,奧普特是市場占有率最大的企業(yè),其他主要參與廠商包括沃德普、緯朗光電、大族激光和義眾實(shí)業(yè)等。
工業(yè)鏡頭
針對機(jī)器視覺應(yīng)用的工業(yè)鏡頭相當(dāng)于人眼晶狀體,起始點(diǎn)為采集和傳遞物體信息。工業(yè)鏡頭需要滿足不同場景下高光學(xué)分辨率、光學(xué)畸變更小和光譜響應(yīng)豐富等應(yīng)用需求。
在市場格局方面,外企在高端市場占據(jù)市場份額,而國內(nèi)企業(yè)則主要推出性價(jià)比較高的產(chǎn)品,在中低端市場國產(chǎn)化率超過80%。
目前,東正光學(xué)、慕騰光、普密斯、聯(lián)創(chuàng)電子、聯(lián)合光電、鳳凰光學(xué)和宇瞳光學(xué)等廠商在工業(yè)鏡頭領(lǐng)域處于主要地位。
工業(yè)相機(jī)
相機(jī)在機(jī)器視覺中扮演著圖像采集的重要角色,就像人眼的視網(wǎng)膜一樣將光信號(hào)轉(zhuǎn)換成電信號(hào)。
光學(xué)通過鏡頭聚焦到像平面上,生成圖像后,相機(jī)會(huì)采集并輸出模擬或數(shù)字信號(hào)。這些信號(hào)在視覺控制系統(tǒng)中被重建為灰度或彩色的矩陣圖像。
工業(yè)相機(jī)市場主要由歐美進(jìn)口品牌占據(jù),國產(chǎn)品牌從低端市場開始逐步替代進(jìn)口產(chǎn)品。
目前,奧普特、海康機(jī)器人(海康威視的子公司)、大恒圖像和華睿科技(大華股份的子公司)等公司已經(jīng)具備工業(yè)相機(jī)生產(chǎn)能力。
圖像處理軟件及算法平臺(tái)
在機(jī)器視覺系統(tǒng)中,軟件和系統(tǒng)是關(guān)鍵,能夠?yàn)檎麄€(gè)解決方案提供更高的附加值。
機(jī)器視覺開發(fā)工具主要分為兩種類型,一種是包含多種處理算法的工具包,另一種是專門實(shí)現(xiàn)某一類特定任務(wù)的應(yīng)用軟件。
底層算法難度很大,外國公司幾乎壟斷了底層算法領(lǐng)域,而本土廠商正在積極尋求突破。目前,國內(nèi)僅有少數(shù)企業(yè)擁有自己的算法庫。
國內(nèi)代表性的軟件和算法供應(yīng)商包括凌云光、深科達(dá)、商湯科技、虹軟科技和云從科技等。
圖像采集卡和圖像處理器領(lǐng)域的供應(yīng)商包括維視圖像、凌云光、凌華科技、北京君正、富瀚微和高新興等。
機(jī)器視覺設(shè)備和集成
視覺裝備是由視覺系統(tǒng)和自動(dòng)化裝備構(gòu)成的。除了自主研發(fā)、生產(chǎn)并銷售標(biāo)準(zhǔn)化的機(jī)器視覺核心部件,機(jī)器視覺廠商還提供整體解決方案,深度結(jié)合下游實(shí)際場景。
在國內(nèi),集成端發(fā)展迅速,尤其是在一些外資還沒有布局的領(lǐng)域或非標(biāo)自動(dòng)化領(lǐng)域,例如3C等。當(dāng)前,國內(nèi)集成廠商單純進(jìn)行二次開發(fā)利潤空間較小,因此,一旦在某一行業(yè)下游完成良好布局,有望嘗試逐步向上游底層開發(fā)延伸,進(jìn)行核心軟硬件的進(jìn)口替代。
國內(nèi)機(jī)器視覺設(shè)備環(huán)節(jié)主流供應(yīng)商包括天準(zhǔn)科技、凌云光、奧普特、矩子科技、美亞光電、精測電子、賽騰股份、奧比中光、勁拓股份、先導(dǎo)智能、康鴻智能等。而系統(tǒng)集成商主要布局者包括凌云光、精測電子、依圖科技、智泰科技、維視圖像、格林深瞳等。
機(jī)器視覺市場格局顯示,國內(nèi)品牌在中低端市場具有競爭力,而高端市場仍由海外品牌主導(dǎo)。其中,基恩士和康耐視兩大巨頭壟斷了全球市場份額超過50%。這表明機(jī)器視覺行業(yè)擁有較高的行業(yè)壁壘,主要源于其“技術(shù)密集”和“工藝密集”這兩大特性。從1998年引入機(jī)器視覺系統(tǒng)以來,參與機(jī)器視覺產(chǎn)業(yè)發(fā)展的國內(nèi)企業(yè)逐年增加。根據(jù)企查查數(shù)據(jù),2010年至2019年每年新增行業(yè)內(nèi)相關(guān)企業(yè)呈逐年增長的趨勢,到達(dá)2019年時(shí),當(dāng)年新增機(jī)器視覺企業(yè)數(shù)已達(dá)819個(gè),達(dá)到近年來的頂峰。然而,由于疫情影響和行業(yè)內(nèi)集中度的提升,2020年以來每年新增企業(yè)數(shù)逐漸放緩,2021年共新增278家機(jī)器視覺相關(guān)企業(yè),市場格局仍然相對分散。
目前,90%的制造業(yè)企業(yè)擁有自動(dòng)生產(chǎn)線,但僅有40%實(shí)現(xiàn)數(shù)字化管理,5%打通工廠數(shù)據(jù),1%使用智能化技術(shù),許多場景仍然依賴于人工或簡單設(shè)備進(jìn)行識(shí)別和檢測。據(jù)康耐視數(shù)據(jù)估計(jì),在全球3.6億制造業(yè)工人中,約有3500萬人從事視覺質(zhì)檢工作,每年僅視覺檢測的人工成本就超過3000億美元。然而,機(jī)器視覺可以通過節(jié)約人工成本為下游帶來價(jià)值增值。同時(shí),考慮到產(chǎn)品質(zhì)量和一致性的提高、數(shù)字化生產(chǎn)和機(jī)器視覺在高精度、復(fù)雜場景下的增量應(yīng)用等因素,機(jī)器視覺行業(yè)前景廣闊。
總體來看,中國工業(yè)增加值占全球比例正不斷提升,未來在自動(dòng)駕駛、醫(yī)療成像、工業(yè)機(jī)器人等高速成長的行業(yè)的帶動(dòng)下,有望提振機(jī)器視覺行業(yè)需求,進(jìn)一步擴(kuò)大市場。