經(jīng)濟(jì)觀察網(wǎng) 記者 錢玉娟 連續(xù)7年參與世界人工智能大會(huì)(下稱“WAIC”)的周伯文,今年以全新的角色——上海人工智能實(shí)驗(yàn)室主任現(xiàn)身。
上海人工智能實(shí)驗(yàn)室是中國(guó)人工智能領(lǐng)域新型科研機(jī)構(gòu)的領(lǐng)頭羊。在7月4日的WAIC 2024開幕式論壇上,周伯文代表上海人工智能實(shí)驗(yàn)室,提出了一個(gè)技術(shù)主張——人工智能45°平衡律。
周伯文分析,總體上,AI模型在安全能力方面的提升,遠(yuǎn)遠(yuǎn)落后于性能的提升。從研究是否體系化,以及人才密集度、商業(yè)驅(qū)動(dòng)力、算力投入度等方面看,安全方面的投入遠(yuǎn)遠(yuǎn)落后于AI能力。這種失衡導(dǎo)致AI的發(fā)展是跛腳的。
周伯文建議,行業(yè)應(yīng)該追求可信AGI(通用人工智能),以兼顧安全與性能。AI安全優(yōu)先,但又能保證AI性能長(zhǎng)期發(fā)展的技術(shù)體系,即為人工智能45°平衡律。平衡是指短期可以有波動(dòng),但不能長(zhǎng)期低于45°(如同現(xiàn)在),也不能長(zhǎng)期高于45°(這將阻礙發(fā)展與產(chǎn)業(yè)應(yīng)用)。這就要求強(qiáng)技術(shù)驅(qū)動(dòng)、全流程優(yōu)化、多主體參與以及敏捷治理。
實(shí)現(xiàn)人工智能45°平衡律有多種技術(shù)路徑。上海人工智能實(shí)驗(yàn)室在探索的路徑是可信AGI的“因果之梯”,它將可信AGI的發(fā)展分為三個(gè)遞進(jìn)階段:泛對(duì)齊、可干預(yù)、能反思。
泛對(duì)齊主要包含當(dāng)前最前沿的人類偏好對(duì)齊技術(shù);可干預(yù)主要包含通過對(duì)AI系統(tǒng)進(jìn)行干預(yù),探究其因果機(jī)制的安全技術(shù);能反思則要求AI系統(tǒng)不僅追求高效執(zhí)行任務(wù),還能審視自身行為的影響和潛在風(fēng)險(xiǎn)。
周伯文稱,目前AI安全和性能技術(shù)發(fā)展主要停留在第一階段,部分在嘗試第二階段。要真正實(shí)現(xiàn)AI的安全與性能平衡,必須完善第二階段并勇于攀登第三階段。
除了在AI的安全與性能平衡方面提出全新主張,周伯文還強(qiáng)調(diào)大模型的通專融合,即將大規(guī)模的人工智能模型(大模型)與特定領(lǐng)域的專業(yè)知識(shí)(專用模型)進(jìn)行整合,以提高模型的效率、準(zhǔn)確性和適用性。
在周伯文看來,大模型當(dāng)前在專業(yè)能力的進(jìn)展上極其緩慢,同時(shí)帶來了能源消耗、數(shù)據(jù)消耗、資源消耗。而通專融合是通往AGI的戰(zhàn)略路徑。
他希望,通過通專融合,AI不只可以提出科學(xué)假設(shè),還可以掌握科學(xué)知識(shí)、分析實(shí)驗(yàn)結(jié)果、預(yù)測(cè)科學(xué)現(xiàn)象,進(jìn)而在反思的基礎(chǔ)上,提升AI提出科學(xué)假設(shè)的能力。
周伯文在產(chǎn)學(xué)研的深厚積累使得他的主張一直廣受關(guān)注。
早前在美國(guó)擔(dān)任IBM人工智能基礎(chǔ)研究院院長(zhǎng)的周伯文,歸國(guó)后加入京東集團(tuán),成為了京東發(fā)力AI的靈魂人物。他為京東組建起了技術(shù)委員會(huì),并主導(dǎo)京東云與AI兩大事業(yè)部數(shù)年。
2021年,周伯文離開京東,在北京成立了銜遠(yuǎn)科技有限公司(下稱“銜遠(yuǎn)科技”),聚焦生成式AI的產(chǎn)業(yè)應(yīng)用落地。
當(dāng)時(shí),中國(guó)的產(chǎn)業(yè)界鮮少有人對(duì)這一前沿技術(shù)展開探索。當(dāng)2022年末ChatGPT如一只蝴蝶在大洋彼岸煽動(dòng)起翅膀,引致國(guó)內(nèi)卷起AI大模型的創(chuàng)業(yè)浪潮時(shí),周伯文已經(jīng)扎根其中摸索了一年有余。
2022年5月,周伯文被聘為清華大學(xué)電子工程系長(zhǎng)聘教授、清華大學(xué)惠妍講席教授。
2023年7月,周伯文在接受經(jīng)濟(jì)觀察網(wǎng)專訪時(shí)表示,自己是“非共識(shí)者”,更主張AI技術(shù)探索與產(chǎn)業(yè)經(jīng)濟(jì)的耦合。
基于技術(shù)要有商業(yè)化閉環(huán)的思維,周伯文帶領(lǐng)銜遠(yuǎn)科技自主研發(fā)了品商大模型和多模態(tài)大模型“摹小仙”,雙模型在2024年1月末通過了備案,并在4月末實(shí)現(xiàn)了模型應(yīng)用產(chǎn)品的首發(fā)。
彼時(shí),周伯文回顧了自己過去20多年專注在做的兩件事:一是探索人工智能的終極之路,二是思考如何將通用人工智能和產(chǎn)業(yè)相結(jié)合。
周伯文在本屆世界人工智能大會(huì)提出的兩大主張,正與此一脈相承。