經(jīng)濟(jì)觀察網(wǎng) 記者 錢玉娟
9月25日下午,阿里云宣布開源通義千問140億參數(shù)模型Qwen-14B及其對話模型Qwen-14B-Chat,供全社會免費商用。阿里云透露,70億參數(shù)的Qwen-7B等模型開源至今,短短一個半月時間里,下載量已突破百萬量級。如今,用戶既可以從中國大模型開源社區(qū)魔搭社區(qū)內(nèi)直接下載14B模型,也可以通過阿里云的靈積平臺訪問和調(diào)用模型。
據(jù)了解,阿里云的靈積平臺上,除了自研的通義千問大模型外,還托管著百川、姜子牙、Stable Diffusion、ChatGLM-v2等行業(yè)大模型。
“我們是一個開源的模型社區(qū),希望給不同的開發(fā)者、企業(yè)更多的選擇。”阿里云CTO周靖人接受經(jīng)濟(jì)觀察網(wǎng)記者采訪時稱。周靖人說,“今天只做一個非常foundation(基礎(chǔ))的model(模型),跟我們實際的應(yīng)用場景會有很多的距離。”他希望團(tuán)隊更為重要的一件事是:幫助開發(fā)者和企業(yè)用好模型。
基于此,通義千問選擇對自研大模型開源,目的是為開發(fā)者、企業(yè)后續(xù)使用提供一個選項,周靖人表示,“不同場景根據(jù)自身需求,選擇不一樣規(guī)模的模型來應(yīng)用于自己的開發(fā)環(huán)境里。”
伴隨模型參數(shù)以及整體容量和能力的增加和提升,14B模型會比7B模型在某些長尾領(lǐng)域表現(xiàn)出更強(qiáng)的認(rèn)知能力、推理能力等,周靖人指出“14B模型在模型微調(diào)和模型應(yīng)用方面會更具性價比。”
不只是阿里云走上了大模型開源之路,全球以及中國市場上很多廠商都在做出這一選擇,IDC中國高級分析師程蔭稱,“模型開源會讓更多的人接觸到大模型技術(shù),從而降低技術(shù)學(xué)習(xí)和使用的門檻和成本,促進(jìn)大模型在行業(yè)內(nèi)的廣泛應(yīng)用。”
行業(yè)開源開放確實是趨勢,但“讓AI更普惠”這句話在周靖人看來,實現(xiàn)起來并不容易。
“只做開源也不行,不做開源更不行。”周靖人強(qiáng)調(diào),當(dāng)下大模型生態(tài)需要在技術(shù)創(chuàng)新的同時也要更及時地觸達(dá)中小企業(yè)和個人開發(fā)者。
“未來可能會形成一種開源模型和商業(yè)模型并存的格局。”程蔭分析,開源模型會促進(jìn)更多生態(tài)的形成,降低訓(xùn)練模型的巨大成本,為創(chuàng)業(yè)型企業(yè)、開發(fā)者們帶來更多機(jī)會。