<nav id="4uuuu"></nav>
  • <tr id="4uuuu"></tr>
  • <tr id="4uuuu"></tr>
  • <tfoot id="4uuuu"><dd id="4uuuu"></dd></tfoot>
    • <noscript id="4uuuu"><optgroup id="4uuuu"></optgroup></noscript>

      久久精品福利网站免费,亚洲色大情网站WWW在线观看,久久水蜜桃网国产免费网手机 ,男女性高视频免费观看国内,老色鬼第一页av在线,久久久久精品婷婷

      有效加速還是超級(jí)對(duì)齊?

      陳永偉2023-12-04 18:07

      陳永偉/文

      “百時(shí)政變”背后的謎團(tuán)

      兩周前, OpenAI公司經(jīng)歷了一場(chǎng)“百時(shí)政變”:11月16日晚,OpenAI的CEO山姆·奧特曼(Sam Altman)收到了公司首席科學(xué)家伊利亞·薩斯克維爾(llya Sutskever)的短信,約他在第二天談一談。11月17日,奧特曼如約而至,卻驚訝地發(fā)現(xiàn)薩斯克維爾邀他參加的并不是一次私人談話,而是一場(chǎng)“鴻門宴”。除了董事長(zhǎng)兼總裁格雷格·布羅克曼(Greg Brockman)之外,整個(gè)OpenAI的董事會(huì)悉數(shù)到會(huì),并當(dāng)場(chǎng)宣布了解雇奧特曼的決定。隨后,布羅克曼也收到了董事會(huì)的來(lái)信,被通知他已經(jīng)被逐出了董事會(huì)。就這樣, OpenAI最有權(quán)勢(shì)的二人就在董事會(huì)的這次突然襲擊中被“繳械”了。

      在遭到廢黜之后,奧特曼游說(shuō)各方勢(shì)力,以尋求力量來(lái)幫助其“復(fù)辟”。最終,在OpenAI員工的集體請(qǐng)?jiān)福约拔④浀耐獠繅毫χ拢瑠W特曼在11月21日又重新成為了OpenAI的CEO,而先前驅(qū)逐他的董事們則反過(guò)來(lái)被他驅(qū)逐。最令人感到吊詭的是,在七百多位OpenAI員工要求奧特曼回歸的公開聯(lián)名信中,簽名的也有向其“逼宮”的薩斯克維爾。

      一場(chǎng)轟轟烈烈的政變就這樣結(jié)束了,從開始到結(jié)束,總共不過(guò)短短的104個(gè)小時(shí)。然而,圍繞著這場(chǎng)未遂“政變”的議論并沒(méi)有就此終結(jié):既然奧特曼本人受到公司內(nèi)外如此的看好和擁戴,董事會(huì)當(dāng)初究竟為何要強(qiáng)行將其開除?董事會(huì)此前稱開除奧特曼是因?yàn)樗?ldquo;在和董事會(huì)的溝通中始終不坦誠(chéng)”,但這樣的一個(gè)解釋怎么看都似乎是過(guò)于草率了,奧特曼究竟向董事會(huì)隱瞞了什么?他這樣做又是為了什么?

      神秘的Q*模型

      正在人們猜測(cè)事件的真相時(shí),一則勁爆的消息出現(xiàn)在了網(wǎng)上。據(jù)報(bào)道,OpenAI首席技術(shù)官米拉·穆拉蒂(Mira Murati)向員工透露,在董事會(huì)開除奧特曼之前,有幾位內(nèi)部工作人員致信OpenAI的董事會(huì),警告他們公司此前在Q*模型取得的突破有可能會(huì)對(duì)人類造成威脅。而這一封信很可能是導(dǎo)致董事會(huì)決心罷免奧特曼的直接導(dǎo)火索。

      這個(gè)被傳得神乎其神的Q*模型究竟是什么呢?它其實(shí)是薩斯克維爾主持研發(fā)的一個(gè)項(xiàng)目,其前身是2021年開始立項(xiàng)的GPT-Zero。由于OpenAI本身并沒(méi)有對(duì)外界披露關(guān)于Q*模型的細(xì)節(jié),因而外界對(duì)于這個(gè)模型的討論主要還是基于猜想:

      一種猜想認(rèn)為,Q*模型的名稱似乎暗示了它是基于所謂的Q學(xué)習(xí)模型的。Q學(xué)習(xí)算法是強(qiáng)化學(xué)習(xí)算法的一種,當(dāng)人們使用這種算法時(shí),無(wú)需對(duì)環(huán)境進(jìn)行建模,智能體可以自動(dòng)通過(guò)估計(jì)動(dòng)作-狀態(tài)組合的“質(zhì)量”來(lái)進(jìn)行學(xué)習(xí)決策。舉例來(lái)說(shuō),我們可以讓一個(gè)機(jī)器人用Q算法來(lái)走迷宮。在這種算法之下,它將嘗試不同的路線來(lái)找到通往出口的最快路徑。通過(guò)不斷的試錯(cuò),機(jī)器最終會(huì)得到一個(gè)策略,也就是所謂的“Q表”(Q-table),告訴它從迷宮中的每個(gè)位置采取的最佳行動(dòng)。而在這個(gè)學(xué)習(xí)的過(guò)程中,所有的步驟都依賴于機(jī)器與環(huán)境的互動(dòng),研究人員無(wú)需進(jìn)行干預(yù)。

      需要指出的是,Q學(xué)習(xí)模型的思維和OpenAI在訓(xùn)練GPT時(shí)使用的“人類反饋強(qiáng)化學(xué)習(xí)”(Reinforcement Learning from Human Feedback,即RLHF)模型有很大的不同。后者的學(xué)習(xí)過(guò)程在很大程度上還需要人類的幫助,因而它的效率相對(duì)較低,但一旦在學(xué)習(xí)過(guò)程中發(fā)現(xiàn)了問(wèn)題,人類可以及時(shí)地進(jìn)行干預(yù);相比之下,Q學(xué)習(xí)算法的學(xué)習(xí)效率要高得多,但與此同時(shí),由于整個(gè)學(xué)習(xí)過(guò)程都是由機(jī)器自動(dòng)完成的,因而如果發(fā)生了問(wèn)題,人們也很難進(jìn)行干預(yù)。

      另一種猜想則認(rèn)為,解開Q*模型神秘面紗的關(guān)鍵可能在它的曾用名,即GPT-Zero上。熟悉AI發(fā)展史的朋友應(yīng)該很容易看出來(lái),GPT-Zero這個(gè)名字其實(shí)是在向Alpha-Zero致敬。雖然和Alpha-Go同為DeepMind的產(chǎn)品,但Alpha-Zero的特點(diǎn)是十分突出的:Alpha-Go是基于人類已有的棋譜訓(xùn)練的,雖然它的學(xué)習(xí)量很大,但終歸是有限的;而Alpha-Zero則會(huì)自動(dòng)合成棋譜來(lái)進(jìn)行學(xué)習(xí),因而從理論上,它的學(xué)習(xí)空間是無(wú)限的。

      當(dāng)然,也有人猜測(cè),Q*模型或許是Q學(xué)習(xí)算法和合成數(shù)據(jù)的綜合。如果這種猜測(cè)是正確的,那就意味著智能體將可以在沒(méi)有人類任何干預(yù)的情況下進(jìn)行一種“永動(dòng)機(jī)”式的學(xué)習(xí):自己生產(chǎn)學(xué)習(xí)材料,自己探索模型,再利用模型進(jìn)行學(xué)習(xí)。從理論上講,只要投入的運(yùn)算資源足夠,那么它的智能水平就會(huì)出現(xiàn)爆炸性的增長(zhǎng)——并且,這種“爆炸”還可能是持續(xù)的。

      在這樣的情況下,如果AI出現(xiàn)了“覺(jué)醒”,擁有了自己的意識(shí),那么人類面對(duì)的將可能是一個(gè)智能遠(yuǎn)遠(yuǎn)凌駕于自己之上的新型硅基生命。假如它萌發(fā)出了什么不利于人類的想法,人類將很難有抵擋的能力。或許正是因?yàn)檫@個(gè)原因,所以才有了那封內(nèi)部工作人員寫給董事會(huì)的警告信。

      現(xiàn)在的問(wèn)題是,為什么董事會(huì)在接到了警告信之后,就決定了要拿下奧特曼?而帶領(lǐng)董事會(huì)完成這一切的為什么是薩斯克維爾?這一點(diǎn),很可能源于兩人對(duì)技術(shù)和社會(huì)關(guān)系的認(rèn)識(shí)沖突。

      奧特曼是有效加速主義者嗎?

      在現(xiàn)在的AI圈內(nèi),奧特曼經(jīng)常被認(rèn)為是一名“有效加速主義者”。

      什么是“有效加速主義”(Effective Accelerationism)呢?它是一種關(guān)于技術(shù)和社會(huì)關(guān)系的哲學(xué)思想。從名稱就可以看出,它和所謂的“加速主義”有著深厚的淵源。

      早在1967年,美國(guó)科幻大師羅杰·澤拉茲尼(Roger Zelazny)在其小說(shuō)《光明之王》(Lord of Light)中提出了一種被稱為“加速主義”的理念,這種理念認(rèn)為,要改變社會(huì)就必須改變社會(huì)對(duì)于技術(shù)的態(tài)度。在上世紀(jì)六七十年代,這種理念非常具有影響力,包括德勒茲、利奧塔在內(nèi)的著名哲學(xué)家都曾對(duì)其進(jìn)行過(guò)闡發(fā)。在這個(gè)階段,加速主義帶有十分明顯的左翼色彩,持這種觀點(diǎn)的人普遍認(rèn)為資本主義阻礙了技術(shù)的發(fā)展,應(yīng)當(dāng)通過(guò)技術(shù)發(fā)展來(lái)埋葬資本主義,發(fā)展出新的人類社會(huì)形態(tài)。

      到了上世紀(jì)八九十年代,英國(guó)右翼哲學(xué)家尼克·蘭德(Nick Land)重新發(fā)掘了“加速主義”的內(nèi)涵,他放棄了左翼加速主義者的斗爭(zhēng)觀念,認(rèn)為應(yīng)當(dāng)在資本主義邏輯中加速前進(jìn)。在他看來(lái),資本主義從來(lái)沒(méi)有被完全的釋放,而是總被政治阻礙著。每一個(gè)文明都在加速?zèng)_向最終的大災(zāi)難。政治組織總是在試圖阻擋這個(gè)進(jìn)程,但并不能改變最終的結(jié)局。人類的選擇就是自己主動(dòng)加速?zèng)_向這個(gè)大災(zāi)難的結(jié)局。

      在蘭德之后,包括薩迪·普蘭特(Sadie Plant)、馬克·費(fèi)希爾(Mark Fisher)在內(nèi)的一批激進(jìn)哲學(xué)家加入了蘭德的隊(duì)伍,并和他一起總結(jié)出了加速主義的內(nèi)核,即“資本主義+技術(shù)”。

      從根本上看,現(xiàn)在在硅谷流行的“有效加速主義”可以被視為是加速主義思想的一個(gè)延續(xù)。但是由于它融入了很多物理學(xué)、生物學(xué),以及“超人類主義”(Transhumanism)哲學(xué)的內(nèi)容,所以其內(nèi)涵更為豐富,從形式上看,也顯得更為“科學(xué)化”。

      例如,在網(wǎng)上廣為流傳的《關(guān)于e/acc原則和教義的說(shuō)明》(Notes on e/acc principles and tenets)中就宣稱有效加速主義的基礎(chǔ)是熱力學(xué)第二定律。根據(jù)這個(gè)定律,宇宙是一個(gè)不斷膨脹和優(yōu)化的過(guò)程。在有效加速主義者看來(lái),人類社會(huì)也滿足這個(gè)定律,不過(guò)和在自然界不同,熱力學(xué)第二定律在社會(huì)領(lǐng)域的作用過(guò)程中,所謂的“技術(shù)資本”(technocapital)起到了關(guān)鍵的作用。這里說(shuō)的“技術(shù)資本”,是一種超越人類個(gè)體的智力形式。在有效加速主義者看來(lái),正是技術(shù)資本主導(dǎo)了社會(huì)的演化,塑造了包括人工智能奇點(diǎn)在內(nèi)的重要事件。相比之下,人類則只是技術(shù)資本實(shí)現(xiàn)其目的的過(guò)程中用到的“齒輪”(cogs)。基于這種“科學(xué)”信念,有效加速者認(rèn)為,有效加速運(yùn)動(dòng)并不是一場(chǎng)社會(huì)運(yùn)動(dòng),甚至也不是一種意識(shí)形態(tài),而只是一種對(duì)真理的承認(rèn)。無(wú)論是現(xiàn)實(shí)中的官僚體系、技術(shù)治理,還是任何試圖控制技術(shù)的力量,都妨礙了人們承認(rèn)真理,因而都需要被革除。

      雖然從哲學(xué)上看,有效加速主義可謂玄之又玄,但落到實(shí)踐上,它卻十分簡(jiǎn)單。一言以蔽之,就是不顧一切地加速技術(shù)的發(fā)展。我們知道,在技術(shù)進(jìn)步的過(guò)程中,可能產(chǎn)生很多問(wèn)題。比如,基因技術(shù)的發(fā)展可能會(huì)造成很多倫理學(xué)的困境,而人工智能的發(fā)展則可能會(huì)帶來(lái)大量的技術(shù)性失業(yè)。那么,有效加速主義者會(huì)如何看待發(fā)展中出現(xiàn)的這種問(wèn)題呢?他們的答案很簡(jiǎn)單,就是對(duì)其視而不見。因?yàn)樵谒麄兊恼軐W(xué)中,技術(shù)資本是高于人類的存在,所以當(dāng)面臨技術(shù)發(fā)展帶來(lái)的各種變化時(shí),主動(dòng)適應(yīng)變化就是人類的義務(wù),人的利益或者其他的任何理由都不應(yīng)該成為阻礙技術(shù)發(fā)展的理由。

      由于硅谷的創(chuàng)業(yè)者們大多是技術(shù)發(fā)燒友,因而有效加速主義倡導(dǎo)的技術(shù)至上思想很容易獲得很多人的認(rèn)同。現(xiàn)在的問(wèn)題是,奧特曼真的像人們傳說(shuō)的那樣,也是一位有效加速主義的支持者嗎?關(guān)于這一點(diǎn),其實(shí)是存在一些爭(zhēng)議的。因?yàn)樵诤芏鄨?chǎng)合,奧特曼都表達(dá)了對(duì)AI發(fā)展可能帶來(lái)的各種問(wèn)題的憂慮。在美國(guó)國(guó)會(huì)召開的聽證會(huì)上,他甚至公開呼吁對(duì)AI進(jìn)行監(jiān)管。

      不過(guò),越來(lái)越多的證據(jù)開始表明,奧特曼的這些舉動(dòng)其實(shí)只是作為商人的逢場(chǎng)作戲。比如,奧特曼曾經(jīng)公開表示,他在有效加速者的聚集地——e/acc論壇有一個(gè)秘密的賬號(hào)。當(dāng)然,人們將奧特曼視為一個(gè)加速主義者的主要理由是他在現(xiàn)實(shí)中對(duì)技術(shù)表現(xiàn)出的激進(jìn)態(tài)度。例如,其實(shí)在OpenAI推出GPT之前,微軟、谷歌等大型企業(yè)都在內(nèi)部開發(fā)類似的AI項(xiàng)目。然而,就在這些公司紛紛出于倫理考慮控制項(xiàng)目開發(fā)的進(jìn)度時(shí),奧特曼卻不顧這些,讓OpenAI搶先上線了GPT。后來(lái),出于改進(jìn)GPT性能的需要,他又讓GPT率先接入了網(wǎng)絡(luò),從而讓AI可以實(shí)時(shí)接受最新的信息。在很多人看來(lái),奧特曼的這一系列激進(jìn)行為已經(jīng)清晰無(wú)疑地說(shuō)明了他作為一個(gè)有效加速主義者的真相。所謂“聽其言,觀其行”,相比于任何的言語(yǔ),這些行為的證據(jù)似乎是更具有說(shuō)服力的。

      超級(jí)對(duì)齊主義者的選擇

      和傾向于有效加速主義的奧特曼不同,領(lǐng)導(dǎo)OpenAI政變的薩斯克維爾則是“超級(jí)對(duì)齊”(Superalignment)的信奉者。

      在當(dāng)下的AI圈,對(duì)齊(Alignment)是一個(gè)備受關(guān)注的概念。雖然關(guān)于這個(gè)概念的定義,不同的文獻(xiàn)存在著一些細(xì)微的差異,但大致上講,它指的是通過(guò)對(duì)AI系統(tǒng)的行為進(jìn)行引導(dǎo),讓其能夠符合設(shè)計(jì)者的意圖。

      乍一看,對(duì)齊似乎并不是一件難事——畢竟,AI的程序都是由人類設(shè)計(jì)者編制的,只要選擇合理的目標(biāo)函數(shù)、制定合理的行為準(zhǔn)則,就可以讓它按照設(shè)計(jì)者的意志行事。然而,事實(shí)并沒(méi)有那么簡(jiǎn)單:

      第一,設(shè)計(jì)者本人經(jīng)常很難精確表述自己的意圖,因而AI當(dāng)然就很難真正做到按照其意志行事。比如,在科幻小說(shuō)中,設(shè)計(jì)者經(jīng)常會(huì)給AI設(shè)定一些諸如“保護(hù)人類安全”、“讓人類幸福”等宏大任務(wù),但對(duì)于“安全”、“幸福”這些詞語(yǔ),即使人類本身也無(wú)法精確界定和表述。在這樣的情況下,如果讓AI執(zhí)行這些任務(wù),它就可能做出一些人們并不期望的事情。舉例來(lái)說(shuō),為了保證人類的絕對(duì)安全,它們可能將人類像動(dòng)物一樣圈養(yǎng)起來(lái);而為了讓人們幸福,它們則可能會(huì)直接在人類腦子里插上電極,不斷刺激分泌多巴胺的腺體。

      第二,人們?cè)谠O(shè)計(jì)AI的過(guò)程中,經(jīng)常難以完全顧及其程序可能產(chǎn)生的所有后果,因而AI在執(zhí)行其設(shè)定的程序時(shí),可能帶來(lái)很多意料之外的后果。從事AI對(duì)齊工作的人在論及這一點(diǎn)時(shí),經(jīng)常會(huì)引用雅各布斯的恐怖小說(shuō)《猴爪》(The Monkey's Paw)。這個(gè)小說(shuō)講了這樣一個(gè)故事:懷特夫婦意外地得到了一個(gè)擁有魔力的猴爪,猴爪可以實(shí)現(xiàn)他們的三個(gè)愿望。懷特夫婦先許了一個(gè)愿,想要一百英鎊。這個(gè)愿望很快實(shí)現(xiàn)了——第二天,他們?cè)诠S上班的兒子出了意外,被卷進(jìn)機(jī)器慘死,作為賠償,工廠主給了他們一百英鎊。兒子的身故讓懷特夫婦十分悲傷,于是他們向猴爪許第二個(gè)愿,想讓自己的兒子回來(lái)。這個(gè)愿望也實(shí)現(xiàn)了,但回來(lái)的兒子早已不是一個(gè)鮮活的人,而是一具行尸走肉。這讓這對(duì)老夫妻非常害怕,于是他們向猴爪許了第三個(gè)愿,讓兒子消失。在許下這個(gè)愿望后,他們的兒子就消失了。在上面這個(gè)故事中,懷特夫婦一共向猴爪許下了三個(gè)愿望,而猴爪也如他們所愿,實(shí)現(xiàn)了這三個(gè)愿望。不過(guò),這些愿望的實(shí)現(xiàn)并沒(méi)有如他們所設(shè)想的那樣給他們帶來(lái)境況的改善,相反,還讓他們失去了自己的愛子。

      在AI對(duì)齊問(wèn)題中,AI就像是那個(gè)可以幫人實(shí)現(xiàn)愿望的猴爪,它可以幫助人們?nèi)ネ瓿珊芏嘧约弘y以完成的任務(wù)。然而,如果AI在完成任務(wù)的過(guò)程中不擇手段,那就可能像故事中的猴爪那樣,不僅不會(huì)給人們帶來(lái)幸福,反而會(huì)給人帶來(lái)災(zāi)難。

      第三,在很多時(shí)候,人的目標(biāo)是多樣的,因而當(dāng)他把這些目標(biāo)傳遞給AI時(shí),會(huì)對(duì)不同的目標(biāo)賦予一定的權(quán)重,在這種情況下,AI出于優(yōu)化的考慮,可能過(guò)度重視那些被賦予高權(quán)重,并且容易被檢查的目標(biāo),而忽略了其余目標(biāo)。舉例來(lái)說(shuō),對(duì)于一個(gè)用來(lái)輔導(dǎo)孩子學(xué)習(xí)的AI,人們會(huì)希望它既能幫助孩子提升分?jǐn)?shù),也能幫助孩子提升學(xué)習(xí)能力。很顯然,在這兩個(gè)目標(biāo)中,前一個(gè)是更容易量化的,并且在通常情況下,它也會(huì)被人們賦予更高的權(quán)重。因而,在AI執(zhí)行任務(wù)時(shí),就會(huì)優(yōu)先照顧這個(gè)目標(biāo),讓孩子不斷刷題、輔導(dǎo)他們各種解題的技巧,而這一切對(duì)于提升孩子的真實(shí)學(xué)習(xí)能力可能并沒(méi)有什么幫助。

      基于上面的幾個(gè)問(wèn)題,要讓AI真正地按照設(shè)計(jì)者的意圖行事可能并沒(méi)有人們想象的那么容易。

      除此之外,還有一個(gè)更重要的問(wèn)題也困擾著人們,那就是所謂的“對(duì)齊”究竟應(yīng)該是向誰(shuí)“對(duì)齊”。現(xiàn)實(shí)中,人們的利益訴求是多方面的,關(guān)于某一個(gè)具體的任務(wù),他們對(duì)各種實(shí)現(xiàn)途徑的偏好并不相同。此時(shí),如果要讓AI去為眾多的人服務(wù),它就會(huì)陷入一仆多主的困境。

      為了讓AI可以成功實(shí)現(xiàn)對(duì)齊,人們已經(jīng)做了很多的努力,并形成了很多種不同的思路。比如,在訓(xùn)練ChatGPT時(shí),OpenAI就采用了RLHF的思路,即用人類的反饋來(lái)糾正AI的行為。據(jù)報(bào)道,為了實(shí)現(xiàn)這種訓(xùn)練,OpenAI曾雇傭了上萬(wàn)名人類訓(xùn)練員,針對(duì)ChatGPT對(duì)敏感問(wèn)題的回復(fù)進(jìn)行打分。通過(guò)這種方式,ChatGPT就可以從大量的人類反饋中逐漸摸索出人類對(duì)于特定問(wèn)題的主流看法,并用它來(lái)指導(dǎo)自己的行為。RLHF成功的關(guān)鍵之一,就是要將人類的反饋有效地反映到AI的報(bào)酬函數(shù)上,從而改變AI的激勵(lì)。然而,有時(shí)候人的觀察會(huì)出現(xiàn)偏差,因而他們反饋給AI的激勵(lì)也就不正確。更有甚者,AI出于最大化其報(bào)酬函數(shù)的目的,還可能故意利用人類訓(xùn)練員的觀察缺陷,對(duì)其進(jìn)行欺騙。

      針對(duì)這樣的情況,一些AI從業(yè)人士建議用 “超級(jí)對(duì)齊”來(lái)對(duì)AI系統(tǒng),尤其是超級(jí)AI系統(tǒng)(Superintelligent AI System)進(jìn)行對(duì)齊。這種策略的基本思路就是先創(chuàng)建一個(gè)“大致相當(dāng)于人類水平的自動(dòng)對(duì)齊研究員”(automated human-level alignment researcher),然后用它來(lái)執(zhí)行針對(duì)AI的對(duì)齊工作。換言之,就是在執(zhí)行對(duì)齊工作的過(guò)程中,將那些更適合由AI完成的工作盡可能交由AI來(lái)自動(dòng)完成,而人類則僅負(fù)責(zé)其中最為關(guān)鍵的那一部分,以此來(lái)盡可能提升對(duì)齊的效率。目前,這種對(duì)齊思路已經(jīng)得到了一些AI企業(yè)的推崇。例如,OpenAI就在今年7月啟動(dòng)了一個(gè)超級(jí)對(duì)齊項(xiàng)目,而主持這個(gè)項(xiàng)目的正是薩斯克維爾和另一位科學(xué)家簡(jiǎn)·雷克(Jan Leike)。

      薩斯克維爾曾在很多場(chǎng)合表達(dá)過(guò)對(duì)他主持的這個(gè)項(xiàng)目的重視。比如,在Youtube上的一個(gè)訪談中,薩斯克維爾曾把未來(lái)的超級(jí)AI比作核電站。在他看來(lái),就像人們需要投入大量的資源來(lái)防止核電站的意外泄漏一樣,為了防止超級(jí)AI可能對(duì)人類造成的危害,必須在對(duì)齊工作上投入充足的資源。

      有意思的是,對(duì)于奧特曼呼吁監(jiān)管AI的表態(tài),人們將信將疑;而對(duì)于薩斯克維爾對(duì)對(duì)齊的重視,人們則愿意選擇相信。我想,人們的這個(gè)判斷,很大程度上是基于薩斯克維爾過(guò)去的背景作出的。薩斯克維爾是被譽(yù)為“深度學(xué)習(xí)之父”的杰弗里·辛頓(Geoffrey Hinton)的學(xué)生,辛頓本人就十分重視對(duì)齊問(wèn)題。

      到此為止,我們就可以大致腦補(bǔ)出薩斯克維爾之所以要在開始帶頭驅(qū)逐奧特曼,隨后又愿意請(qǐng)?jiān)福屍浠貧w的原因了:如果奧特曼真是一名有效加速主義者,那么他就會(huì)力主放棄一切對(duì)GPT發(fā)展的阻礙;即使他對(duì)有效加速主義的信仰并不那么強(qiáng)烈,單純從一位企業(yè)家的立場(chǎng)出發(fā),他也未必會(huì)同意人為延緩自己產(chǎn)品的發(fā)展。而作為超級(jí)對(duì)齊的信仰者,薩斯克維爾顯然不會(huì)讓奧特曼在這種在他看來(lái)會(huì)關(guān)乎人類存亡的問(wèn)題上舉棋不定。尤其是當(dāng)他看到Q*模型的突飛猛進(jìn),已經(jīng)展現(xiàn)出超級(jí)AI的趨勢(shì)時(shí),就不得不事急從權(quán),聯(lián)合其他幾位董事發(fā)動(dòng)了政變。然而,當(dāng)他看到,在驅(qū)逐了奧特曼之后,OpenAI本身就出現(xiàn)了分崩離析,自己的超級(jí)對(duì)齊項(xiàng)目也將面臨破產(chǎn)。而與此同時(shí),奧特曼以及OpenAI的大量人才則可以很容易加盟微軟等其他企業(yè),從而將超級(jí)AI項(xiàng)目繼續(xù)下去。如果情況照此發(fā)展,那么超級(jí)AI的失控可能會(huì)來(lái)得更快。相比于這樣的情況,把奧特曼重新請(qǐng)回來(lái),讓他繼續(xù)支持超級(jí)對(duì)齊項(xiàng)目,或許反而是一個(gè)更好的折中方案。

      第三條道路:d/acc

      接著,讓我們將關(guān)注的焦點(diǎn)轉(zhuǎn)到一個(gè)更為重要的問(wèn)題上:在AI技術(shù)日新月異,超級(jí)AI似乎近在眼前的今天,我們究竟應(yīng)該秉承有效加速主義的態(tài)度,任由技術(shù)的發(fā)展,還是堅(jiān)持超級(jí)對(duì)齊的觀點(diǎn),堅(jiān)持AI的發(fā)展必須以符合人類的意圖?

      從我個(gè)人的角度出發(fā),我并不完全贊同上面兩種觀點(diǎn)中的任何一個(gè)。相比于它們,我更贊同以太坊創(chuàng)始人維塔利克·布特林(Vitalik Buterin)所倡導(dǎo)的d/acc。在d/acc這個(gè)詞中,acc是加速的縮寫。所以,我們不難看出,它其實(shí)是另一個(gè)版本的加速主義。其中的d,則有很多種解釋,比如可以解釋為“防御”(defensive)、“去中心化”(decentralized)、“民主化”(democratic)等。把d和acc放在一起,就是一種主張用去中心化、民主化的防御機(jī)制去應(yīng)對(duì)發(fā)展中的問(wèn)題。

      按照歷史的經(jīng)驗(yàn),雖然技術(shù)的發(fā)展一定會(huì)帶來(lái)各種各樣的問(wèn)題,但從總體上講,它帶來(lái)的利一般是會(huì)大于弊的。因而,即使如加速主義者所言,人類在技術(shù)發(fā)展的過(guò)程中并不是主角,但作為配角的他們總體上也是可以從這個(gè)過(guò)程中獲益的。反過(guò)來(lái),拒斥技術(shù)的發(fā)展,不僅需要很大的成本,還可能錯(cuò)過(guò)提升生活水平的機(jī)會(huì),因而是得不償失的。從這個(gè)角度看,不發(fā)展反而是最大的風(fēng)險(xiǎn),加速主義的總體思路并沒(méi)有錯(cuò)。

      那么,如何應(yīng)對(duì)AI加速發(fā)展過(guò)程中出現(xiàn)的問(wèn)題呢?是用超級(jí)對(duì)齊嗎?我個(gè)人認(rèn)為,并不合適。在超級(jí)對(duì)齊當(dāng)中,最為關(guān)鍵的是要確保用于執(zhí)行AI對(duì)齊的自動(dòng)AI研究員本身已經(jīng)是對(duì)齊的。但諷刺的是,它是否已經(jīng)做到了這一切,評(píng)判權(quán)卻掌握在一小部分專家手里。事實(shí)上,從OpenAI事件我們可以看出,這個(gè)被人們寄予希望的善良AI甚至不能代表整個(gè)OpenAI董事會(huì)的一致利益,更遑論全人類了。

      相比之下,d/acc通過(guò)分布式技術(shù),一方面讓更多的人共同參與到AI對(duì)齊當(dāng)中,用民主方式對(duì)AI的行為進(jìn)行判定;另一方面則對(duì)AI可能產(chǎn)生的問(wèn)題筑造起更多的防御壁壘,則似乎可以在保證技術(shù)充分發(fā)展的同時(shí),更好地讓AI實(shí)現(xiàn)對(duì)“人類價(jià)值”的對(duì)齊,也可以更好預(yù)防對(duì)齊失敗所帶來(lái)的災(zāi)難性后果。從這個(gè)角度看,它似乎是一個(gè)更為折中,也更為穩(wěn)妥的AI發(fā)展方案。

      熱新聞

      久久精品福利网站免费
      <nav id="4uuuu"></nav>
    • <tr id="4uuuu"></tr>
    • <tr id="4uuuu"></tr>
    • <tfoot id="4uuuu"><dd id="4uuuu"></dd></tfoot>
      • <noscript id="4uuuu"><optgroup id="4uuuu"></optgroup></noscript>