人工智能又上新了!今天(12日)下午,由國(guó)家和地方共建的具身智能機(jī)器人創(chuàng)新中心——北京人形機(jī)器人創(chuàng)新中心發(fā)布了全球首個(gè)“一腦多能”“一腦多機(jī)”的通用具身智能平臺(tái)“慧思開(kāi)物”。
傳統(tǒng)的機(jī)器人軟件系統(tǒng)的開(kāi)發(fā),大多是針對(duì)同一個(gè)任務(wù)、單一場(chǎng)景來(lái)開(kāi)發(fā)的,比如送餐機(jī)器人只會(huì)送餐,不會(huì)干程序以外的事兒。但這套具身智能平臺(tái),顛覆了傳統(tǒng)機(jī)器人軟件開(kāi)發(fā)的模式,具備在不同場(chǎng)景和不同機(jī)器人上使用的通用性,簡(jiǎn)單說(shuō)就是讓機(jī)器人的硬件身體有了一個(gè)聰明的“大腦”,還能通過(guò)靠譜的“小腦”干各種不同的活兒。“慧思開(kāi)物”究竟是什么,有了哪些新的能力?即刻揭秘↓↓↓
01
通用具身智能平臺(tái)
“慧思開(kāi)物”今天發(fā)布
▌實(shí)現(xiàn)從任務(wù)理解到執(zhí)行的全流程智能化

在發(fā)布會(huì)現(xiàn)場(chǎng),北京人形機(jī)器人創(chuàng)新中心團(tuán)隊(duì)用直播的形式,公開(kāi)展示了“慧思開(kāi)物”平臺(tái)的能力。“慧思開(kāi)物”能夠?qū)崿F(xiàn)從任務(wù)理解到執(zhí)行的全流程智能化,具備處理多場(chǎng)景復(fù)雜任務(wù)的泛化能力。
▌兼容機(jī)械臂、輪式、人形機(jī)器人等多構(gòu)型本體
首次實(shí)現(xiàn)了單個(gè)軟件系統(tǒng)在機(jī)械臂、輪式機(jī)器人、人形機(jī)器人等多構(gòu)型本體上的兼容,能夠適應(yīng)多樣化的應(yīng)用場(chǎng)景和任務(wù),為具身智能機(jī)器人提供強(qiáng)大的感知、決策與執(zhí)行能力。

北京人形機(jī)器人創(chuàng)新中心首席技術(shù)官 唐劍:我們可以為某個(gè)垂直行業(yè)去提供一個(gè)全套的解決方案,也就是天工機(jī)器人加上“慧思開(kāi)物”平臺(tái),它就可以在某種程度上閉環(huán)完成用戶(hù)需要它去完成的任務(wù),我們這個(gè)平臺(tái)也可以以一種獨(dú)立的形式存在,機(jī)器人應(yīng)用開(kāi)發(fā)商或者是系統(tǒng)集成商可以使用這個(gè)平臺(tái),在市場(chǎng)上選購(gòu)一款機(jī)器人,通過(guò)簡(jiǎn)單配置以及簡(jiǎn)單的自然語(yǔ)言的描述,或者當(dāng)有一些復(fù)雜任務(wù)需要一些編程,就可以讓這樣一個(gè)機(jī)器人去物理世界完成相應(yīng)的任務(wù)。
▌“慧思開(kāi)物”賦能 大批機(jī)器人集體進(jìn)廠

就在近期,優(yōu)必選工廠內(nèi),大批機(jī)器人集體進(jìn)廠,開(kāi)展訓(xùn)練,結(jié)合的就是通用具身智能平臺(tái)“慧思開(kāi)物”的能力,通過(guò)將機(jī)器人接入這個(gè)具身智能平臺(tái),機(jī)器人不僅可以有聰明的大腦去拆解任務(wù)、調(diào)動(dòng)小腦來(lái)執(zhí)行任務(wù),還可以進(jìn)行互相的協(xié)作,可以真正推動(dòng)智能機(jī)器人從單一任務(wù)執(zhí)行躍升至復(fù)雜環(huán)境下的自主決策與執(zhí)行。
02
記者體驗(yàn)“慧思開(kāi)物”
帶給機(jī)器人哪些類(lèi)人能力
把最新發(fā)布的通用具身智能平臺(tái)“慧思開(kāi)物”接入機(jī)器人,會(huì)給機(jī)器人帶來(lái)哪些類(lèi)人的能力?記者第一時(shí)間進(jìn)行了互動(dòng)體驗(yàn)。
▌?wù)Z音互動(dòng) 操控機(jī)器人分揀物料

總臺(tái)央視記者 張春玲:這里有一個(gè)工業(yè)分揀機(jī)器人,只要跟它通過(guò)一些簡(jiǎn)單的語(yǔ)音互動(dòng),就可以來(lái)去操控這樣一個(gè)機(jī)器人為我干活了。給它設(shè)置一個(gè)多步驟的任務(wù),看看能不能實(shí)現(xiàn)。在手機(jī)頁(yè)面中,同步可以看到機(jī)器人的視角,它正在進(jìn)行這些操作,全流程都是可視化的,我們看到它顯示任務(wù)執(zhí)行成功。這些操作的實(shí)現(xiàn)就是因?yàn)闄C(jī)器人擁有了一個(gè)非常智慧的“大腦”,同時(shí)有靈活的“小腦”來(lái)配合“大腦”共同完成任務(wù)。
▌空間理解 精細(xì)操控 機(jī)器人復(fù)現(xiàn)搭積木

“天工”的空間理解能力和對(duì)物品的精細(xì)操控能力如何?記者在它面前隨機(jī)用積木搭出了一個(gè)形狀,“天工”成功復(fù)現(xiàn)。
▌排除干擾 不斷糾錯(cuò) 自主實(shí)現(xiàn)任務(wù)目標(biāo)

在居家場(chǎng)景中,正在整理桌面的機(jī)器人,則展示出了它面對(duì)外部干擾,能不斷糾錯(cuò),自主實(shí)現(xiàn)任務(wù)目標(biāo)的執(zhí)行能力。面對(duì)記者的“搗亂”測(cè)試,機(jī)器人仍舊順利完成目標(biāo)任務(wù)。
▌搭配靈巧手 一系列動(dòng)作連貫完成

機(jī)器人還展示了它處理長(zhǎng)程任務(wù)的能力,同時(shí)還搭配上了新裝備——靈巧手來(lái)共同完成。掃碼、放入物品、打包、粘貼信息條、放入生產(chǎn)線等一系列動(dòng)作,連貫完成,無(wú)需人為控制。
03
具身智能機(jī)器人是如何煉成的
“天工”機(jī)器人加上“慧思開(kāi)物”通用具身智能平臺(tái),天工、開(kāi)物兩者相結(jié)合,讓具身智能機(jī)器人擁有了類(lèi)似人類(lèi)擁有的能力。機(jī)器人具備智能的能力,并能自主執(zhí)行任務(wù),離不開(kāi)“通用智能平臺(tái)”技術(shù)的發(fā)展。機(jī)器人是怎么學(xué)到這些能力、變得越來(lái)越智能的?又是怎么指揮自己去完成這些動(dòng)作的?
▌具身“大腦”規(guī)劃任務(wù) 具身“小腦”執(zhí)行動(dòng)作

機(jī)器人智能體是如何煉成的?“慧思開(kāi)物”平臺(tái)是由AI大模型驅(qū)動(dòng)的任務(wù)規(guī)劃具身“大腦”以及數(shù)據(jù)驅(qū)動(dòng)的具身“小腦”構(gòu)成的,其中,具身“大腦”具備自然交互、空間感知、意圖理解、分層規(guī)劃和錯(cuò)誤反思等能力,由具身“大腦”進(jìn)行任務(wù)規(guī)劃,再調(diào)用具身“小腦”技能庫(kù)執(zhí)行具體動(dòng)作,并將執(zhí)行反饋傳遞給具身“大腦”,形成任務(wù)閉環(huán)。

北京人形機(jī)器人創(chuàng)新中心首席技術(shù)官 唐劍:整個(gè)“慧思開(kāi)物”平臺(tái),其實(shí)它不是一個(gè)智能體,而是一個(gè)分布式的多智能體。比方說(shuō)用戶(hù)提出一個(gè)指令說(shuō)給我烤一片面包,那么它要把這樣的一個(gè)任務(wù)拆解成多個(gè)子任務(wù),這個(gè)任務(wù)就可以被拆解成拿起面包、放到面包機(jī)里、摁一下按鈕、等待、拿出面包、放到盤(pán)子里這樣6個(gè)子任務(wù)來(lái)完成,每一項(xiàng)子任務(wù)都會(huì)對(duì)應(yīng)一個(gè)技能。
▌30多個(gè)技能已上線 年底技能可達(dá)百種
以創(chuàng)新中心大量機(jī)器人模仿學(xué)習(xí)的高質(zhì)量數(shù)據(jù)為基礎(chǔ),機(jī)器人技能庫(kù)里已經(jīng)上線了30多個(gè)技能,它們可以幫助機(jī)器人理解并執(zhí)行動(dòng)作,完成任務(wù)。

北京人形機(jī)器人創(chuàng)新中心首席技術(shù)官 唐劍:剛才提到的打開(kāi)、關(guān)上、拿起、放下、拉出、旋轉(zhuǎn),這都是一個(gè)技能。我們正在豐富技能庫(kù),目前大概有30種比較常用的技能,到今年年底,整個(gè)技能庫(kù)大概會(huì)有100種技能,基本上可以覆蓋物理世界的絕大部分任務(wù)。
04
具身智能到底是個(gè)啥
問(wèn)題來(lái)了,具身智能到底是什么意思?它是把DeepSeek這樣的大模型安裝到機(jī)器人身上嗎?機(jī)器人、機(jī)器狗都算是具身智能嗎?具身智能能幫我們干什么?記者采訪了研究人工智能和機(jī)器人的專(zhuān)家,幫我們答疑解惑。
▌Q:什么是具身智能?

深圳市人工智能與機(jī)器人研究院常務(wù)副院長(zhǎng)丁寧:具身智能實(shí)際上是讓智能算法擁有自己的機(jī)器人身體,從而更深刻地理解物理世界規(guī)則的一種方法。這種更深入的理解讓它在我們的生產(chǎn)生活各種場(chǎng)景的作業(yè)能力可以更強(qiáng)。
▌Q:具身智能是把大模型安到機(jī)器人身上嗎?

深圳市人工智能與機(jī)器人研究院常務(wù)副院長(zhǎng) 丁寧:具身智能不僅僅是把大模型這類(lèi)人工智能算法安裝在電腦的硬件上面,以機(jī)器人作為一個(gè)載體那么簡(jiǎn)單。跟DeepSeek、ChatGPT這種語(yǔ)言模型或者離身智能最大的區(qū)別是什么?離身智能主要是通過(guò)語(yǔ)言、文本、圖像作為數(shù)據(jù)支撐,現(xiàn)在具身智能有了自己的身體之后,它就可以通過(guò)自己的交互、體會(huì),用更多的模態(tài)和傳感器來(lái)理解外部世界。
舉個(gè)“栗子”!
就像教小孩去理解世界、認(rèn)知世界,離身智能是讓小孩坐在椅子上不動(dòng),我們用語(yǔ)言告訴他小貓小狗長(zhǎng)成什么樣,讓他看一千萬(wàn)張圖片,他也能夠總結(jié)出來(lái)一些規(guī)律,這也是一定的認(rèn)知,但這個(gè)認(rèn)知相對(duì)片面。
具身智能是讓小孩離開(kāi)座位走下來(lái),看到小貓就把它抱起來(lái),就像機(jī)器人它有自己的身體,它有這種能力去跟我們看到的對(duì)象做非常親密的交互,把它抱起來(lái)感受毛發(fā)的質(zhì)感、溫度,尾巴是怎么動(dòng),互動(dòng)過(guò)程中,你對(duì)它的理解就非常深刻全面。基于這樣的理解,自然它的作業(yè)能力就會(huì)更高 ,這是具身智能最大的特點(diǎn)。
▌Q:具身智能就是人形機(jī)器人嗎?

深圳市人工智能與機(jī)器人研究院常務(wù)副院長(zhǎng)丁寧:
人形機(jī)器人實(shí)際上是一種通用型作業(yè)的機(jī)器人,它實(shí)際上是具身智能非常好的一個(gè)載體,它有一個(gè)通用的身體,在不同的場(chǎng)景里可以很好地發(fā)揮作用。
具身智能不僅僅只能賦能人形機(jī)器人,它也可以賦能機(jī)器狗,或者是一些行業(yè)的專(zhuān)用裝備。其他形態(tài)的機(jī)器人也都是具身智能很好的載體。有些場(chǎng)景就不見(jiàn)得適合人形機(jī)器人去作業(yè),比如地下管道這種非常狹窄的空間,可能蛇形機(jī)器人它的作業(yè)能力就更合適,它可以鉆到縫隙里面去檢測(cè)管道的一些狀態(tài)。
▌Q:具身智能能幫我們做什么?

深圳市人工智能與機(jī)器人研究院常務(wù)副院長(zhǎng) 丁寧:
具身智能未來(lái)賦能機(jī)器人之后,它其實(shí)可以大幅地增加機(jī)器人自主的作業(yè)能力,解決很多實(shí)際的問(wèn)題,比如養(yǎng)老康復(fù)、端茶送水。
每個(gè)人個(gè)體差異還挺大的,它也要理解你的狀態(tài)、理解你的實(shí)際需求,用合適的策略。
比如洗衣機(jī)洗好了衣服,把它拿出來(lái)、疊好、晾曬這些交互能力,希望未來(lái)機(jī)器人擁有具身智能之后更聰明,去解決一些復(fù)雜任務(wù)時(shí)更有效。
在工業(yè)制造的環(huán)境里,也有非常多需要去應(yīng)對(duì)的極端事件,機(jī)器人和具身智能的配合能夠讓作業(yè)的過(guò)程更加高效。
來(lái)源:央視新聞客戶(hù)端
責(zé)任編輯:林紅

請(qǐng)輸入驗(yàn)證碼