人人干97-人人干操-人人干狠狠操-人人干美女-国产人妖在线-国产人妖在线播放

今日報丨英偉達AI智能體接入GPT-4:自主寫代碼獨霸「我的世界」,無需人類插手
時間:2023-05-28 15:29:42  來源:引領外匯網(wǎng)  
1
聽新聞

給游戲行業(yè)來點GPT-4式震撼?這個叫Voyager的智能體不僅可以根據(jù)游戲的反饋自主訓練,而且還能自行寫代碼推動游戲任務。

編者按:本文來自微信公眾號 新智元(ID:AI_era),作者:新智元,創(chuàng)業(yè)邦經(jīng)授權(quán)發(fā)布。


(資料圖片僅供參考)

給游戲行業(yè)來點GPT-4式震撼?這個叫Voyager的智能體不僅可以根據(jù)游戲的反饋自主訓練,而且還能自行寫代碼推動游戲任務。

繼斯坦福的25人小鎮(zhèn)后,AI智能體又出爆款新作了。

最近,英偉達首席科學家Jim Fan等人把GPT-4整進了「我的世界」(Minecraft)——提出了一個全新的AI智能體Voyager。

Voyager的厲害之處在于,它不僅性能完勝AutoGPT,而且還可以在游戲中進行全場景的終身學習!

比起之前的SOTA,Voyager獲得的物品多出了3.3倍,旅行距離變長了2.3倍,解鎖關鍵技能樹的速度快了15.3倍。

對此,網(wǎng)友直接震驚了:我們離通用人工智能AGI,又近了一步。

所以,未來的游戲,就是由大模型帶動NPC來玩的吧?

真·數(shù)字生命

接入GPT-4之后,Voyager根本不用人類操心,完全就是自學成才。

它不僅掌握了挖掘、建房屋、收集、打獵這些基本的生存技能,還學會了自個進行開放式探索。

它會自己去到不同的城市,路過一片片海洋,一座座金字塔,甚至還會自己搭建傳送門。

通過自我驅(qū)動,它不斷探索著這個神奇的世界,擴充著自己的物品和裝備,配備不同等級的盔甲,用盾牌格擋上海,用柵欄圈養(yǎng)動物……

Voyager的英勇事跡包括但不限于——

大戰(zhàn)末影人

造基地

挖紫水晶

挖金子

收集仙人掌

打獵

釣魚

數(shù)字生命的潛能究竟有多大?我們只知道,現(xiàn)在Voyager仍然在Minecraft中一刻不停地探索,不斷擴展著自己的疆域。

「訓練」無需梯度下降

此前,AI領域的一大挑戰(zhàn)就是,構(gòu)建具有通用能力的具身智能體,讓它們在開放世界中自主探索,自行發(fā)展新技能。

以往,學界都是采用強化學習和模仿學習,但這些方法在系統(tǒng)化的探索、可解釋性和泛化性等方面,表現(xiàn)往往差強人意。

大語言模型的出現(xiàn),給構(gòu)建具身智能體帶來了全新的可能性。因為基于LLM的智能體可以利用預訓練模型中蘊含的世界知識,生成一致的行動計劃或可執(zhí)行策略,這就非常適合應用于游戲和機器人之類的任務。

此前,斯坦福研究者構(gòu)建出生活著25個AI智能體的虛擬小鎮(zhèn),震驚了AI社區(qū)

這種智能體還有一個好處就是,不需要具體化的自然語言處理任務。

然而,這些智能體仍然無法擺脫這樣的缺陷——無法終身學習,因而不能在較長時間跨度上逐步獲取知識,并且將它們積累下來。

而這項工作最重要的意義就在于,GPT-4開啟了一種新的范式:這個過程中是靠代碼執(zhí)行「訓練」,而非靠梯度下降。

Jim Fan解釋道:我們在BabyAGI/AutoGPT之前就有了這個想法,花了很多時間找出最好的無梯度架構(gòu)

「訓練模型」是Voyager迭代式構(gòu)建的技能代碼庫,而非浮點數(shù)矩陣。通過這種方法,團隊正在將無梯度架構(gòu)推向極限。

在這種情況下訓練出的智能體,已經(jīng)具備了同人類一樣的終身學習能力。

比如,Voyager如果發(fā)現(xiàn)自己處在沙漠而非森林中,就會知道學會收集沙子和仙人掌就比學會收集鐵礦更重要。

而且,它不僅能根據(jù)目前的技能水平和世界狀態(tài)明確自己最合適的任務,還能根據(jù)反饋不斷完善技能,保存在記憶中,留在下次調(diào)用。

所以,我們離硅基生命出現(xiàn)還有多遠?

剛剛回到OpenAI的Karpathy對這個工作表示盛贊:這是個用于高級技能的「無梯度架構(gòu)」。在這里,LLM就相當于是前額葉皮層,通過代碼生成了較低級的mineflayer API。

Karpathy回憶起,在2016年左右,智能體在Minecraft環(huán)境中的表現(xiàn)還很讓人絕望。當時的RL只能從超稀疏的獎勵中隨機地探索執(zhí)行長期任務的方式,讓人感覺非常stuck。

而現(xiàn)在,這個障礙已經(jīng)在很大程度上被解除了——正確的做法是另辟蹊徑,首先訓練LLM從互聯(lián)網(wǎng)文本上學習世界知識、推理和工具使用(尤其是編寫代碼),然后直接把問題拋給它們。

最后他感慨道:如果我在2016年就讀到這種對智能體的「無梯度」方法,我肯定會大吃一驚。

微博大V「寶玉xp」也對這個工作給予了高度評價——

Voyager

與其他AI研究中常用的游戲不同,Minecraft并沒有強加預定義的終點目標或固定的劇情線,而是提供了一個具有無盡可能性的游樂場。

對于一個有效的終身學習智能體來說,它應該具有與人類玩家類似的能力:

1. 根據(jù)其當前的技能水平和世界狀態(tài)提出適當?shù)娜蝿眨纾绻l(fā)現(xiàn)自己是在沙漠而不是森林中,就會在學習收集鐵之前學習收集沙子和仙人掌

2. 基于環(huán)境反饋來完善技能,并將掌握的技能記入記憶,以便在類似情況下重復使用(例如,與僵尸戰(zhàn)斗與與蜘蛛戰(zhàn)斗類似)

3. 持續(xù)探索世界,以自我驅(qū)動的方式尋找新的任務。

為了讓Voyager具有上述這些能力,來自英偉達、加州理工學院、得克薩斯大學奧斯汀分校和亞利桑那州立大學的團隊提出了3個關鍵組件:

1. 一個迭代提示機制,能結(jié)合游戲反饋、執(zhí)行錯誤和自我驗證來改進程序

2. 一個技能代碼庫,用來存儲和檢索復雜行為

3. 一個自動教程,可以最大化智能體的探索

首先,Voyager會嘗試使用一個流行的Minecraft JavaScript API(Mineflayer)來編寫一個實現(xiàn)特定目標的程序。

雖然程序在第一次嘗試時就出錯了,但是游戲環(huán)境反饋和JavaScript執(zhí)行錯誤(如果有的話)會幫助GPT-4改進程序。

通過提供智能體當前的狀態(tài)和任務,GPT-4會告訴程序是否完成了任務。

此外,如果任務失敗了,GPT-4還會提出批評,建議如何完成任務。

自我驗證

其次,Voyager通過在向量數(shù)據(jù)庫中存儲成功的程序,逐步建立一個技能庫。每個程序可以通過其文檔字符串的嵌入來檢索。

復雜的技能是通過組合簡單的技能來合成的,這會使Voyager的能力隨著時間的推移迅速增長,并緩解災難性遺忘。

第三,自動課程會根據(jù)智能體當前的技能水平和世界狀態(tài),提出合適的探索任務。

例如,如果它發(fā)現(xiàn)自己在沙漠而非森林中,就學習采集沙子和仙人掌,而不是鐵。

具體來說,課程是由GPT-4基于「發(fā)現(xiàn)盡可能多樣化的東西」這個目標生成的。

自動課程

實驗

接下來,讓我們看一些實驗!

團隊將Voyager與其他基于LLM的智能體技術進行了系統(tǒng)性的比較,比如ReAct、Reflexion,以及在Minecraft中廣受歡迎的AutoGPT。

在160次提示迭代中,Voyager發(fā)現(xiàn)了63個獨特的物品,比之前的SOTA多出3.3倍。

尋求新奇的自動課程自然會驅(qū)使Voyager進行廣泛的旅行。即使沒有明確的指示,Voyager也會遍歷更長的距離(2.3倍),訪問更多的地形。

相比之下,之前的方法就顯得非常「懶散」了,經(jīng)常會在一小片區(qū)域里兜圈子。

地圖探索率

那么,經(jīng)過終身學習后的「訓練模型」——技能庫,表現(xiàn)如何呢?

團隊清空了物品/護甲,生成了一個新的世界,并用從未見過的任務對智能體進行了測試。

可以看到,Voyager解決任務的速度明顯比其他方法更快。

值得注意的是,從終身學習中構(gòu)建的技能庫不僅提高了Voyager的性能,也提升了AutoGPT的性能。

這表明,技能庫作為一種通用工具,可以有效地作為一個即插即用的方法來提高性能。

零樣本泛化

此外,與其他方法相比,Voyager在解鎖木工具上快了15.3倍,石工具快8.5倍,鐵工具快6.4倍。而且擁有技能庫的Voyager是唯一解鎖鉆石工具的。

技能樹掌握情況(木工具 → 石工具 → 鐵工具 → 鉆石工具)

目前,Voyager只支持文本,但在未來可以通過視覺感知進行增強。

在團隊進行的一個初步研究中,人類可以像一個圖像標注模型一樣,向智能體提供反饋。

從而讓Voyager能夠構(gòu)建復雜的3D結(jié)構(gòu),比如地獄門和房子。

結(jié)果表明,Voyager的性能優(yōu)于所有替代方案。此外,GPT-4在代碼生成方面也明顯優(yōu)于GPT-3.5。

消融實驗

結(jié)論

Voyager是第一個由LLM驅(qū)動、可以終身學習的具身智能體。它可以利用GPT-4不停地探索世界,開發(fā)越來越復雜的技能,并始終能在沒有人工干預的情況下進行新的發(fā)現(xiàn)。

在發(fā)現(xiàn)新物品、解鎖Minecraft技術樹、穿越多樣化地形,以及將其學習到的技能庫應用于新生成世界中的未知任務方面,Voyager表現(xiàn)出了優(yōu)越的性能。

對于通用智能體的開發(fā)來說,無需調(diào)整模型參數(shù)的Voyager是可以作為一個起點的。

關鍵詞:

别揉我奶头~嗯~啊~| 少女たちよ在线观看动漫在线观看 | 啊哈~给我~啊(H)| 国色精品卡一卡2卡3卡4卡在线| 欧美国产成人久久精品| 性丰满ⅩXXOOO性FREE| 99国内精品久久久久久久漫画 | 丝袜灬啊灬快灬高潮了AV| 一二三四免费观看在线中文版| 高雅人妻被迫沦为玩物| 久久亚洲欧美日本精品| 天天夜碰日日摸日日澡性色AV | 亚洲一线产区和二线产区的区别 | EEUSS影院WWW在线观看| 国产偷窥熟女精品视频大全| 蜜臀色欲AV在线播放国产日韩| 婷婷综合另类小说色区| 50岁露脸老熟女88AV| 国产色视频网站免费| 人妻熟妇乱又伦精品视频| 亚洲色偷无码一区二区蜜桃AV| 成人欧美一区二区三区性视频| 久久久久亚洲AV无码专区| 乌克兰少妇VIDEOS高潮| GOOD电影网韩国三级无码| 精品久久久久久国产牛牛| 日日澡夜夜澡人人高潮| 最新国产在线拍揄自揄视频| 国产午夜成人无码一区二区| 日本WV一本一道久久香蕉| 一出一进一爽一粗一大视频免费的| 国产精品Ⅴ无码大片在线看| 欧美色成人综合天天影院| 亚洲色成人中文字幕网站| 国产精品国产AV片国产| 欧美国产成人精品一区二区三区| 亚洲乱码日产一区三区| 国产办公室沙发系列高清| 欧美成人性生活视频| 亚洲色欲综合天堂亚洲| 国产精品亚洲АV无码播放| 秋霞午夜无码鲁丝片午夜精品| 一本色道无码不卡在线观看| 国产乱妇乱子在线播视频播放网站 | 亚洲AV日韩AV无码污污网站| 粉嫩粉嫩一区性色AV片| 欧美顶级METART裸体全部自| 亚洲中文字幕精品无码AV | 尤物爆乳AV导航| 精品一区二区三区无码免费直播| 人妻夜夜爽天天爽欧美色院| 亚洲一区二区三区乱码AⅤ| 白丝制服被啪到喷水很黄很暴力| 精品人妻一区二区三区| 我把护士日出水了视频| 成人美女黄网站18禁免费| 内射中出日韩无国产剧情| 一边亲着一面膜下奶韩剧| 和岳每晚弄的高潮嗷嗷叫视频| 天天摸日日摸狠狠添| 赤裸羔羊Ⅲ致命快感| 欧美最猛黑人XXXX黑人猛交98| 中国BGMBGMBGM老妇网站| 久久99精品国产99久久6尤物 | 天天做天天爱天天综合网2021| 成人无码AⅤ在线播放| 欧美日韩在线视频| 中文字幕人乱码中文字幕| 久久久亚洲欧洲日产国码是AV| 亚洲国产成人AⅤ毛片奶水| 国产人与禽ZOZ0性伦| 玩50岁四川熟女大白屁股直播| 大香伊蕉人在播放2019| 韩国av一区二区| 偷拍中国熟妇牲交| 国产激情一区二区三区成人| 熟妇的荡欲乱色欲av浪潮| 大肉大捧一进一出视频| 日韩一区二区三区无码影院 | 野花高清完整版免费观看视频电视 | WWWXXX国产| 琪琪网三级伦锂电影| CHINESETUBE国产在线| 内射人妻无码色AV天堂| 99久久99久久精品国产片| 欧美XXXX做受性欧美88| 99久久99精品久久久久久| 欧美人妻少妇精品久久黑人| JAPANESEHD熟女熟妇| 欧洲VODAFONEWIFI喷| 波多野42部无码喷潮在线| 日本熟妇人妻XXXXX视频| 俄罗斯6一12泑女精品| 天堂中文АⅤ在线| 国产精品三级AV三级AV三级| 性生交大片免费看淑女出招| 狠狠色伊人亚洲综合网站野外| 亚洲精品国精品久久99热| 久久久久久久久精品中文字幕 | 国产成人精品日本亚洲语音| 无码精品一区二区三区视频色欲网| 国产老妇伦国产熟女老妇视频| 亚洲AV无码国产精品色午| 精品国精品无码自拍自在线 | 熟女高潮喷水一区二区三区| 国产成人无码AV在线影院 | А√在线中文网新版地址在线| 色综合天天综合欧美综合| 国产旡码高清一区二区三区| 亚洲A∨国产AV综合AV网站| 后Λ式动态后Λ式动态图AV| 一对一大尺度聊天APP安装| 蜜臀AV免费一区二区三区| XXXXXL日本17上线| 少妇BBWBBW高潮| 国精产品W灬源码1688网站| 亚洲亚洲人成无码网WWW| 内射丰满熟妇18p一区二区| 成年免费A级毛片无码| 无码专区人妻系列日韩精品少妇| 精品国产迷系列在线观看| 中文字幕日韩人妻不卡一区| 日本少妇ASS浓精PICS| 国产又爽又黄又舒服又刺激视频 | 最新高清无码专区| 日韩人妻无码精品专区综合网| 国产精品亚洲专区无码破解版 | 天天影视色香欲综合久久| 皇上撞着小公主的小说叫什么| 中国又粗又大XXXXBBBB| 日本一卡2卡3卡4卡| 国产又粗又猛又爽又黄的网站 | 秋霞电影院yy2933| 国产山东熟女48嗷嗷叫| 中美日韩精品激情无码AV| 日本一线二线三线四线五线| 国产在线视频www色| 中文国产成人精品久久| 色欲av伊人久久大香线蕉影院| 精品国产一区二区AV片| JAPONENSISFES中国| 性色A码一区二区三区天美传媒| 邻居少妇人妻HD高清大乳在线| 成人永久免费福利视频免费| 亚洲精品国产自在久久 | 末发育女AV片一区二区| 国产成人无码区免费A∨视频网站| 亚洲人成网站18禁止一区| 人妻AV中文字幕久久| 好爽好湿好硬好大免费视频| AV无码久久久久久不卡网站| 小12箩利洗澡无码视频网站| 麻豆国产MV视频| 国产7色在线 | 国产| 一本大道香蕉大L在线吗视频| 色欲AV久久一区二区三区久| 久久久久亚洲精品中文字幕 | 日本黄色网址日本| 精品深夜AV无码一区二区老年| 暗交小拗女一区二区三区三州| 亚洲产国偷v产偷v自拍浪潮AV| 欧美性猛交XXXⅩ乱大交| 国产在线精品一区二区三区直播| BGMBGMBGM老少配| 亚洲高清中文字幕在线看不卡| 精品少妇人妻AV免费久久久| 东京热无码一区二区三区AV | 16ⅤIDE0SEX性欧| 亚洲AV日韩精品久久久久| 秋霞人妻无码中文字幕| 精品性高朝久久久久久久| 丰满少妇发泄14P| 中文字幕人妻在线中字| 亚洲AV成人无码一二三| 日本黑人乱偷人妻中文字幕| 久久久久琪琪去精品色无码| 国产精品高清一区二区三区人妖| 69久久夜色精品国产69| 亚洲国产精品VA在线观看香蕉| 色妞AV永久一区二区国产AV| 免费无码AV一区二区| 狠狠躁狠狠躁东京热无码专区 | 97色偷偷色噜噜男人的天堂| 亚洲国产天堂久久综合网| 熟女人妇 成熟妇女系列视频| 欧美成人精品一区二区| 精品人亚洲成A人片在线观看无码专区| 粉嫩大学生无套内射无码卡视频 | 亚洲乱码日产精品一二三| 偷窥熟女大屁股对白视频| 热爆料-热门吃瓜-黑料不打烊| 久久综合九色综合欧美98| 国产无遮挡免费真人视频在线观看| YY8090理论三级在线观看| 亚洲国产欧美在线观看片不卡| 天天躁日日躁狠狠躁日日躁| 区二区三区国产精华液区别大吗| 蜜桃视频一区二区三区在线观看| 国内大量揄拍人妻在线视频| 一女被两男吃奶玩乳尖|