人人干97-人人干操-人人干狠狠操-人人干美女-国产人妖在线-国产人妖在线播放

幻覺?馬斯克TruthGPT也搞不定,OpenAI聯合創始人直言很復雜 焦點觀察
時間:2023-05-04 09:37:28  來源:引領外匯網  
1
聽新聞

OpenAI如何打擊幻覺?

編者按:本文來自微信公眾號“新智元”(ID:AI_era),作者:新智元,編輯:桃子 拉燕,創業邦經授權發布。


(資料圖片僅供參考)

大模型的幻覺問題,就連馬斯克搬出TruthGPT也搞不定。

上個月,馬斯克瘋狂呼吁叫停超級AI研發6個月。

還沒等多久,老馬就坐不住了,直接官宣推出一個名為TruthGPT的AI平臺。

馬斯克曾表示,TruthGPT將是一個「最大的求真人工智能」,它將試圖理解宇宙的本質。

他強調,一個關心理解宇宙的人工智能不太可能滅絕人類,因為我們是宇宙中有趣的一部分。

然而,「幻覺」,到現在還沒有哪個語言模型能夠搞定。

最近,OpenAI聯合創始人便解釋為什么TruthGPT的遠大理想的實現是如此地困難。

TruthGPT理想是泡沫?

馬斯克的X.AI想要建立的TruthGPT,是一種誠實的語言模型。

這么做,直接將矛頭對準ChatGPT。

因為,此前,像ChatGPT這樣的AI系統經常產生錯誤輸出等經典幻覺案例,甚至支持某些政治信仰的報道。

雖然ChatGPT可以讓用戶更多控制語言模型去解決問題,但「幻覺」仍然是OpenAI、谷歌以及未來馬斯克的人工智能公司必須處理的核心問題。

OpenAI聯合創始人兼研究員John Schulman在他的演講「RL和Truthfulness – Towards TruthGPT」中討論了這些挑戰以及如何應對這些挑戰。

為啥有「幻覺」?

根據Schulman的說法,幻覺大致可以分為兩種類型:

1. 「模式完成行為」,即語言模型無法表達自己的不確定性,無法質疑提示中的前提,或者繼續之前犯的錯誤。

2. 模型猜測錯誤。

由于語言模型代表一種知識圖譜,其中包含來自其自身網絡中訓練數據的事實,因此微調可以理解為學習一個函數,該函數在該知識圖譜上運行并輸出token預測。

例如,微調數據集可能包含「星球大戰的類型是什么?」這個問題,以及答案「科幻」。

如果這些信息已經在原始訓練數據中,即它是知識圖譜的一部分,那么模型不會學習新信息,而是學習一種行為——輸出正確答案。這種微調也被稱為「行為克隆」。

但問題是,如果問題是關于「Han Solo的衍生電影的名字是什么」出現在微調數據集中。

但如果答案「Solo」不是原始訓練數據集的一部分(也不是知識圖譜的一部分),即使網絡不知道答案,它也會學習回答。

使用實際上正確但不在知識圖譜中的答案進行微調,從而教會網絡編造答案——即產生「幻覺」。相反,用不正確的答案進行訓練會導致網絡隱瞞信息。

因此,理想情況下,行為克隆應始終基于網絡知識,但創建或評估數據集的人類工作者來說,通常不知道這種知識,例如指令調優。

根據Schulman的說法,當其他模型創建微調數據集時也存在這個問題,就像羊駝公式的情況一樣。

他預測,具有較小知識圖譜的較小網絡,不僅會學會使用ChatGPT的輸出給出答案和遵循指令,而且學會更頻繁地產生幻覺。

OpenAI如何打擊幻覺?

首先,對于簡單的問題來說,語言模型大部分情況下能預測自己是否知道答案,還能表達不確定性。

因此,Schulman表示,微調數據集的時候,必須得讓模型學會怎么表達不確定、怎么應對前提被更改的情況,以及錯誤被承認的情況。

要把這些情況的實例喂給模型,讓它們學習。

但是模型在時機方面還是欠練,也就是說,它們并不知道該何時執行這些操作。

Schulman表示,這就是強化學習(RL)該出場的地方了。比如,基于人類反饋的強化學習(Reinforcement Learning with Human Feedback,RLHF)。

應用RL,模型就可以學習「行為邊界」,學會何時做出何種行為。

而另一個難題,則是檢索和引用來源的能力,例如通過WebGPT中所展示的能力,或者最近在ChatGPT的瀏覽器插件中所呈現的機制。

問題在于,有了復制行為的能力和RLHF,為什么ChatGPT還會產生幻覺?

原因在于問題本身的難易。

雖然上述方法對于簡短的問題和答案效果不錯,但對于ChatGPT中常見的長格式設置就會出現其他問題了。

一方面,完全錯誤的答案也不太可能,大部分情況都是錯的和對的混在一起。

在極端情況下,可能就是100行代碼中的一個錯誤而已。

在其他情況下,這些信息在傳統意義上并不能說是錯的,而是有誤導性的。因此,在像ChatGPT這樣的系統中,人們很難根據信息量或者正確性來衡量輸出的質量。

但這種衡量對于旨在訓練復雜行為邊界的RL算法卻非常重要。

目前,OpenAI依托于RLHF的基于排名的獎勵模型,該模型能夠預測它認為兩個答案中哪個更好,但不會給出有效的信號來明確哪個答案好了多少、信息量大了多少或正確了多少。

Schulman表示,它缺乏向模型提供反饋以學習精細行為邊界的能力。而這種精細的行為邊界,才是有可能解決幻覺的道路。

此外,此過程還會因為RLHF標記過程中的人為出錯而變得更加復雜。

因此,雖然Schulman將RL視作減少幻覺的重要方式之一,但他認為仍然存在許多還沒解決的問題。

除了前面提到的獎勵模型究竟需要什么樣子才能引導正確的行為之外,RLHF目前僅依賴于人類的判準。

這可能會使知識的生成變得更加困難。因為對未來的預測有時會導致不那么令人信服的表述。

然而,Schulman認為,知識的生成是語言模型的下一個重要步驟,同時,他認為對未來的預測和給出推理規則等問題的理論構建,是亟待解決的下一類開放性問題。

Schulman說,一種可能的解決方案是,用其他AI模型來訓練語言模型。

OpenAI也認為,這種方法對于AI對齊來說,很有意義。

ChatGPT架構師

作為ChatGPT架構師,John Schulman早在2015年還在讀博士學位的他,就加入OpenAI成為聯合創始人之一。

在一次采訪中,Schulman解釋了自己加入OpenAI的原因:

另外,據Schulman透露,OpenAI將人類反饋強化學習這一方法 (RLHF)引入ChatGPT的想法可以追溯到17年了。

當時,也是OpenAI的成員,曾發表了一篇論文「從人類偏好中進行深度強化學習」就提到了這一方法。

論文地址:https://arxiv.org/pdf/1706.03741.pdf

OpenAI安全團隊之所以致力于這項工作,是因為想讓自己的模型符合人類的偏好ーー試圖讓模型真正傾聽人類意見,并試圖做人類想做的事情。

在GPT-3完成訓練的時候,然后Schulman決定加入這股潮流,因為他看到了整個研究方向的潛力。

當被問到第一次使用ChatGPT時,第一反應是什么的時候,Schulman的話語中透露著「無感」。

還記得去年ChatGPT橫空出世,讓許多人瞬間炸腦。

而在OpenAI內部沒有人對ChatGPT感到興奮。因為發布的ChatGPT是一個基于GPT-3.5較弱的模型,那時候同事們在玩轉GPT-4了。

對于未來人工智能下一前沿領域看法,Schulman稱,AI在更艱難的任務上不斷進步,然后,問題就來了,人類應該做些什么,在哪些任務下,人類可以在大模型幫助下有更大影響力,做更多的工作。

參考資料:

https://the-decoder.com/elon-musks-truthgpt-is-complicated-says-openai-co-founder/

本文(含圖片)為合作媒體授權創業邦轉載,不代表創業邦立場,轉載請聯系原作者。如有任何疑問,請聯系editor@cyzone.cn。

關鍵詞:

小S货又想挨C了叫大声点| 蜜臀AV无码一区二区三区| 亚洲日韩中文字幕无码专区| 里番本子侵犯肉全彩无码| A级毛片无码免费真人久久| 视频视频APP在线看| 激情五月综合 香亚洲| 中文字幕日本乱码仑区在线| 日本久久久WWW成人免费毛片丨| 国产精品无码成人午夜电影 | 日韩人妻一区二区三区蜜桃视频| 国产精品一区二区在线观看| 亚洲午夜无码久久久久小说| 欧美日韩一区二区综合| 国产夫妻CCCXXX久久久| 亚洲一区日韩高清中文字幕亚洲| 欧美乱妇高清无乱码| 国产精品后入内射日本在线观看| 亚洲乱色伦图片区小说| 欧洲熟妇色XXXXⅩ欧洲老妇色 | А√天堂资源在线地址BT| 无码免费毛片手机在线无卡顿 | 激情内射亚洲一区二区三区爱妻| 自慰无码一区二区三区| 日韩欧美一区二区三区视频| 国内毛片毛片毛片毛片毛片毛片毛片毛片毛片毛片毛片毛片 | 色噜噜狠狠色综合久色AⅤ网黑| 国产亚洲AV片在线观看播放 | 娇妻在卧室里被领导爽电影| 99久久精品国产波多野结衣| 无码久久一区二区| 老师掀起裙子让我挺进| 丰满人妻被公侵犯完整版| 亚洲精品AⅤ无码精品| 欧美日韩亚洲中文字幕一区二区三| 国产精品久久久久久久久鸭| 一区二区三区国产精华护肤品| 久久久精品无码中文天美 | 亚洲AV成人深夜一区午夜网站| 乌克兰性猛交ⅩXXX乱大交| 国产成人午夜高潮毛片| 亚洲熟妇av一区二区三区浪潮| 欧美性猛交XXXX乱大交丰满| 性欧美人与ZOZOXXXX视频| 少妇内射高潮福利炮| 久久99久久99精品中文字幕 | 亚洲综合一区国产精品| 日韩精品人妻系列无码AV东京| 狠狠色成人一区二区三区| YSL小金管水蜜桃色| 亚洲AV无码专区亚洲AV漫画| 欧美人与性动交XXⅩXX| 含羞草实验室隐藏路线| 把腿张开让老子臊烂你的视频| 亚洲国产AⅤ天堂久久| 人妻少妇无码精品专区| 交换朋友夫妻客厅互换4韩国| 白人极品少妇XXXⅩ做受| 亚洲欧美在线制服丝袜国产| 日韩免费高清大片在线| 久久久久久久女国产乱让韩 | 神里凌华被焯出白水视频| 两个男人吮她的花蒂和奶水视频| 男女嘿咻激烈爱爱动态图| 亚洲 欧美 中文 日韩AⅤ| 男人扒开女人下面猛进猛出 | 精品国产AV 无码一区二区三区| А√天堂中文最新版在线种子| 亚洲国产精久久久久久久| 日本伊人色综合网| 精品国内自产拍在线观看| 成年无码AV片在线免缓冲| 亚洲午夜久久久久久噜噜噜| 少妇太爽丰满一区二区| 野兽的夜晚第四季忘不掉的前任 | 国产AV成人一区二区三区高清| 再深点灬舒服灬太大了下载| 无码人妻丰满熟妇区毛片| 欧美黑人又大又粗XXXXX| 河南妇女毛深深的沟WCD| 成人无码区免费AⅤ片WWW| 在线观看激情无码成人AV| 小嫩妇里面又嫩又紧| 人妻一区二区视频| 久久亚洲美女精品国产精品| 国产精品自在欧美一区| 被滋润的少妇疯狂呻吟| 野花日本大全免费观看10中文| 乌克兰13一14处A交| 欧洲FREEXXXX性少妇播放| 久久久久久精品无码人妻| 国产精品久久久久乳精品爆| らだ天堂√在线WWW| 一本加勒比波多野结衣| 亚洲AV成人无码网站| 揉着我的奶从后面进去视频| 女高中生自慰污污网站| 久久EE热这里只有精品| 国产猛男GAY1069视频| 菠萝菠萝蜜免费播放视频| 中文国产成人精品久久| 国产成人A∨麻豆精品| 国产亚州精品女人久久久久久| XOXOXO性ⅩYY欧美69| 野花社区韩国视频WWW了| 希露薇の繁殖计划游戏| 日韩AV一区在线观看| 女的用嘴巴吃鸡会得HPV| 久久久WWW成人免费精品| 国产未成女一区二区三区| 高清成人爽A毛片免费| AV香港经典A毛片免费观看 | 国产成人无码18禁午夜福利P| japanese国产在线观看| 尤物AV无码国产在线看| 亚洲大尺度专区无码浪潮AV| 玩弄丰满少妇人妻视频| 日韩精品无码AV成人观看| 欧美国产一区二区三区激情无套| 久久久久亚洲精品成人网| 叫吧宝贝我想听你叫什么| 国产女人高潮抽搐叫床视频| 放荡的熟妇高清视频| 凹凸国产熟女精品视频| 中文字日产幕码三区的做法大全 | 亚洲精品1卡2卡三卡23卡| 无码人妻久久一区二区三区免费| 日韩免费无码人妻波多野| 欧美性爱一区二区三区四区| 免费夜里18款禁用B站软粉色| 久久久久久精品精品免费| 精品国产成人亚洲午夜福利| 国产日韩亚洲大尺度高清| 国产WW久久久久久久久久| 大象1区一品精区搬运机器| 拔萝卜视频免费播放在线观看 | 在线看片无码永久AV| 亚洲日韩欧美成人一区二区三区 | 亚洲日本一线产区二线区| 亚洲AV综合色区无码三区30p| 无码专区人妻系列日韩精品| 天堂АⅤ在线最新版在线| 丧尸 湿润 粗大 快感 变异| 人人爽天天碰狠狠添| 漂亮人妻沦陷精油按摩| 欧美大肚子孕妇疯狂作爱视频 | 8x8x熟妇一区二区三区| 亚洲AⅤ永久无码一区二区三区| 挺进邻居人妻雪白的身体| 少妇爆乳无码专区网站| 日韩国产成人无码AV毛片| 人人妻人人妻人人片色AV| 青青草A免费线观A| 欧洲美女黑人粗性暴交视频| 欧美激情在线播放| 女人18毛片A级毛片| 内射人妻深入内射| 女口述第一次放进去的感受| 内射爽无广熟女亚洲| 尿眼BDSM奇特虐| 女儿男朋友是妈妈的爱豆的电视剧| 免费无码又爽又刺激软件下载直播 | 欧美黑人又粗又大久久久| 男女交性视频无遮挡全过程| 免费无码又爽又刺激软件下载直播| 乱码一线二线三线新区破解版| 么公的粗大挺进了我的密道| 美女张开腿黄网站免费| 免费免APP看大片视频播放器| 免费无码AV一区二区三区| 妺妺窝人体色WWW聚色窝| 女人被弄到高潮叫床免| 欧美人禽猛交乱配视频网站| 欧美亚洲国产SUV| 日本大肚子孕妇交XXX| 日日狠狠久久偷偷色综合| 少妇人妻激情乱人伦| 天天躁日日躁狠狠躁退| 无码中文国产不卡视频| 亚洲AV蜜桃永久无码精品| 亚洲精品成人网久久久久久| 亚洲熟妇中文字幕日产无码| 永久亚洲成A人片777777| 自慰喷水高清毛片AV片| FREE性欧美18ⅩXOO极品| 波多野结衣一区二区三区AV高清| 东北妇女精品BBWBBW| 国产好大好硬好爽免费不卡| 国产三级在线观看完整版| 黑人上司好猛我好爽中文字幕| 精品浪潮av一区二区三区| 久久亚洲精品无码观看| 女人三A级毛片视频| 日本丰满熟妇乱子伦| 上司人妻互换HD无码| 午夜.DJ高清免费观看视频| 亚洲AV无码一区二区密桃精品| 亚洲色偷偷综合亚洲AV伊人| 中文字幕人妻无码一夲道| JIZZJIZZ欧美69巨大|