誠然,ChatGPT帶來的智能化應(yīng)用,已經(jīng)讓人們對大規(guī)模及算法快速進(jìn)化下的智能機(jī)器人有了更高的期待。而在工業(yè)領(lǐng)域,機(jī)器人的廣泛應(yīng)用讓工業(yè)自動化成為可能,智能化則成為其下一個目標(biāo)。
微億智造創(chuàng)新系統(tǒng)部負(fù)責(zé)人馬元巍博士告訴記者,工業(yè)界傳統(tǒng)的自動化方案基本上都是將知識灌入機(jī)器人系統(tǒng),通過編程的形式實現(xiàn)自動批量處理事務(wù)的功能。因此誕生了一系列計算機(jī)視覺的任務(wù)和機(jī)器人控制的任務(wù),比如一個完整的抓取分揀操作,包含了3D感知、配準(zhǔn)、點云分割、抓取點估計、任務(wù)重排、規(guī)劃、2D校準(zhǔn)等任務(wù),通過強(qiáng)大的工業(yè)軟件將這些技術(shù)點耦合在一起,催生了工業(yè)上的絕大部分應(yīng)用?!斑@樣的應(yīng)用具有可控、重復(fù)性高的特點,但是整個方案實施成本高、柔性低、換線復(fù)雜,并且每個方案都是獨特的,缺乏基準(zhǔn)和技術(shù)一致性,非常不利于整體技術(shù)的進(jìn)步?!?/p>
(資料圖片)
正因如此,幾乎每個行業(yè)對自動化的“解決方案”這四個字有錐骨之痛。如何破解這一現(xiàn)象,則成為智能機(jī)器人產(chǎn)業(yè)發(fā)展的重點方向。
“人類經(jīng)常被物化為工業(yè)流水線中最柔性的執(zhí)行機(jī)構(gòu),是因為人觀察和學(xué)習(xí)周圍的環(huán)境,使用自己的大腦充分利用自己的身體完成各種復(fù)雜的任務(wù),并且在執(zhí)行中不斷受到更新自己的認(rèn)知?!瘪R元巍表示,這種模式正是智能化追求的一種理想形式,也是1950年圖靈在論文中提到的具身智能。
行業(yè)專家普遍認(rèn)為,工業(yè)智能化發(fā)展始于具身智能。
具身智能是指具有身體的人工智能,需要與真實世界進(jìn)行交互。這種交互不僅涉及視覺上的高維特征提取,還包括其他感官信息,例如聽覺、嗅覺、味覺和觸覺。通過這種交互,智能體可以獲取物理世界的真實反饋,并通過反饋來學(xué)習(xí)并進(jìn)化,可以幫助機(jī)器人更好地完成任務(wù)。
具身智能執(zhí)行步驟一般為多傳感器從真實到模擬,然后從模擬到真實的過程,具體的過程就是通過多種感知設(shè)備和算法,盡量將現(xiàn)實世界的信息能夠還原到虛擬環(huán)境中,然后在經(jīng)過模擬和規(guī)劃后,將算法和規(guī)劃應(yīng)用到實際機(jī)器人上。
產(chǎn)業(yè)界以前為什么不提具身智能呢?馬元巍認(rèn)為,主要還是因為技術(shù)復(fù)雜,各個技術(shù)點發(fā)展不成熟。隨著人工智能技術(shù)的快速發(fā)展,尤其是大語言模型徹底改變了語義理解和頂層規(guī)劃的困難?!癈hatGPT證明了大語言模型具有較強(qiáng)的綜合思考、邏輯能力、數(shù)理能力,大語言模型越來越被證明,其作為機(jī)器人的上層邏輯規(guī)劃器是非常有希望的,一舉改變了機(jī)器人系統(tǒng)不智能的缺點。多模態(tài)模型的發(fā)展,為統(tǒng)一圖像、行為理解、語音、動作等提供了技術(shù)基礎(chǔ)。”
基于當(dāng)前智能技術(shù)的發(fā)展,微億智造提出了獨特的工業(yè)智能機(jī)器人漸進(jìn)式路線:以“眼手腦云”的實施架構(gòu)為基礎(chǔ),聚焦于可累積數(shù)據(jù)場景和通用關(guān)鍵技術(shù),打造虛實結(jié)合的應(yīng)用產(chǎn)品,漸進(jìn)式地實現(xiàn)機(jī)器人智能化。
縱觀整個工業(yè)智能的發(fā)展,之所以遠(yuǎn)遠(yuǎn)比不上消費端的發(fā)展速度,其根本原因是相關(guān)基礎(chǔ)元素沒有被很好地數(shù)字化。有理由相信,隨著各種大模型的發(fā)展和應(yīng)用,機(jī)器人的感、知、控等技術(shù)將飛速發(fā)展,實現(xiàn)工業(yè)智能化的要素將逐漸齊備。
當(dāng)然,這肯定需要一個過程。正如張建偉所言,未來的機(jī)器人大概率會是通用智能機(jī)器人,一個機(jī)器人既能夠給你端茶倒水,又能到餐館服務(wù),還能到工廠干活?!斑@將是智能機(jī)器人產(chǎn)業(yè)的大目標(biāo),也是一個非常艱巨的目標(biāo)?!?/p>
關(guān)鍵詞: