機器人可以做的事情越來越多,摘水果、組裝家具、做壽司……但實際上現在的人工智慧還離不開人工干預。

不過最近伊隆·馬斯克創辦的人工智慧組織 OpenAI 展示了一個具有里程碑意義的成果,其去年首次發布的機械手 Dactyl ,已經學會了單手解魔術方塊,而這項技能是 Dactyl 自學而成的。

圖片來源:

在影片中可以看到, Dactyl 解魔術方塊的手法還稍顯笨拙,需要花費 4 分鐘左右才能完成,這比起熟練的魔術方塊高手還是有很大差距。但解魔術方塊的手速並不是 Dactyl 新能力的重點,而是這意味著我們距離理想中的 AI 機器人更近一步了:

那是一種可以通過學習執行各種現實任務的機器人,而且無需經過長達數月到數年的訓練,甚至無需專門編程。

實際上,機器人解魔術方塊並不是什麽新鮮事。2016 年半導體制造商英飛淩制造的一個機器人,能在不到 1 秒鐘之內復原一個魔術方塊,遠遠超過了人類的最快紀錄。兩年後麻省理工學院開發的一款機器人把將這個時間縮短到了 0.4 秒。

圖片來源:

但這些機器人的形態大都和人手很不一樣,這樣的設計也註定了無法完成更多不同的任務。而 Dactyl 採用的是模仿人手的 24 關節機械手,研究人員希望 Dactyl 能學習如何像人類一樣來控制這些關節。

圖片來源:

OpenAI 的機器人技術主管 Peter Welinder 表示,其實很多機器人都能輕易解魔術方塊,但 Dactyl 與這些機器人最大的不同在於,那些機器人是制造出來專門用於解魔術方塊的,但 Dactyl 卻能完成更多任務。

我們正在嘗試製造一個通用的機器人,能像人手一樣完成多種操作,而不是侷限於某項特定任務。

因此, Dactyl 真正了不起的地方不在於能單手解魔術方塊,而是如何學習這項技能的過程。因為在整個過程中,研究人員其實並沒有專門為機械手的操作進行編程,一切都要靠 Dactyl 自己領悟。

圖片來源:

而要讓機器人「自學成才」則離不開人工智慧。Dactyl 採用的是一種在虛擬環境中進行的深度學習模型,這種虛擬環境的訓練模式有一個好處,那就是不會耗費現實世界的時間,此外還不用擔心機器人在訓練中摔壞或者傷害他人。

Dactyl 在虛擬世界中積累數萬年的訓練經驗,但在現實中只過了幾個月時間,頗有點「山中方一日,世上已千年」的感覺,這種訓練方式大大縮短了 AI 的學習時間,背後則需要數千個超高性能的 CPU 和 GPU 同時運行。

圖片來源:

通過這種訓練而成的 Dactyl 還能自行應對各種突發狀況,比如在解魔術方塊過程中研究人員不斷用一些物體去戳它,還用紙屑和泡沫進行干擾,但 Dactyl 依舊能完成任務,而在訓練中沒有模擬過這種情形。

圖片來源:

Peter Welinder 指出,現在機器人之所以無法像人類一樣掌握多項技能,是因為機器人要完成一項簡單的任務,也需要大量的訓練,完成新任務則要從頭開始訓練,即便是波士頓動力的網紅機器狗也無法實現自主操作,如果沒有專門編程和人工干預連基本的動作都難以完成

但如果機器人的 AI 算法可以像人類一樣建模,就能快速掌握多項技能。正如 OpenAI 所說,Dactyl 是邁向未來機器人的一小步,但卻至關重要,能讓人工智慧不再依賴人類,代替人類完成更多複雜的體力勞動。

圖片來源:OpenAI

本文轉載自《愛范兒

作者介紹 |

愛范兒 ifanr

合作轉載

愛范兒連接全球創新者及消費者,跨界技術、文化、消費及創新,致力消費科技領域的產業評論、產品報導及社群連接,創造高品質的消費樂趣。

分享