經(jīng)濟(jì)觀察網(wǎng) 記者 沈怡然 7月7日,繼百度、阿里、騰訊、科大訊飛等科技企業(yè)之后,華為首次公布了自研的AI大模型盤古3.0。
該成果是在今日舉辦的2023華為開發(fā)者大會上公布的,主要研發(fā)方是華為云。根據(jù)華為常務(wù)董事、華為云CEO張平安介紹,不同于ChatGPT等通用人工智能大模型,盤古大模型是一個(gè)面向垂直行業(yè)的大模型系列,已經(jīng)迭代到3.0版本。
技術(shù)上看,盤古3.0為客戶提供100億參數(shù)、380億參數(shù)、710億參數(shù)和1000億參數(shù)的系列化基礎(chǔ)大模型,匹配客戶不同場景、不同時(shí)延、不同響應(yīng)速度的行業(yè)多樣化需求。已經(jīng)初步運(yùn)用在政務(wù)、煤礦、鐵路、氣象、金融領(lǐng)域。
張平安介紹了幾個(gè)應(yīng)用案例,例如在金融領(lǐng)域,盤古金融大模型可以對銀行的各種操作、政策、案例文檔進(jìn)行預(yù)訓(xùn)練,能根據(jù)客戶的問題,為柜臺工作人員自動(dòng)生成流程和操作指導(dǎo),將原來需要平均5次的操作降低為1次,辦結(jié)時(shí)間縮短5分鐘以上。
例如盤古鐵路大模型能精準(zhǔn)識別現(xiàn)網(wǎng)運(yùn)行的67種貨車、430多種故障,無故障圖片篩除率高達(dá)95%,成為貨運(yùn)列檢員身邊有力的數(shù)字助手,將列檢員從每日數(shù)百萬張的“圖海”檢測中解放出來。
目前,中國在AIGC研發(fā)上仍然處于起步階段,文心一言、訊飛星火、通義千問、商湯“商量”等通用大模型應(yīng)用先后面世,相比之下,圍繞生物醫(yī)藥、金融、工業(yè)等垂直行業(yè)大模型的研發(fā)進(jìn)度稍慢,因?yàn)楹笳咴趯I(yè)數(shù)據(jù)收集、場景適配、定制化等方面難度更高。
和其他行業(yè)大模型有所不同,盤古3.0是個(gè)采用分層解耦設(shè)計(jì)的大模型系列集。據(jù)張平安介紹,華為云在底層準(zhǔn)備了五個(gè)基礎(chǔ)大模型,包括自然語言、視覺、多模態(tài)、預(yù)測、科學(xué)計(jì)算,滿足行業(yè)場景中的多種技能需求。
在五個(gè)基礎(chǔ)大模型之上,華為云開發(fā)了N個(gè)行業(yè)大模型,張平安表示,既可以提供使用行業(yè)公開數(shù)據(jù)訓(xùn)練的行業(yè)通用大模型,包括政務(wù)、金融、制造、礦山、氣象等大模型;也可以基于行業(yè)客戶的自有數(shù)據(jù),在盤古大模型的基礎(chǔ)層上,為客戶訓(xùn)練自己的專有大模型。
在此之上,華為云開發(fā)了更多細(xì)化場景的模型,包括政務(wù)熱線、網(wǎng)店助手、先導(dǎo)藥物篩選、傳送帶異物檢測、臺風(fēng)路徑預(yù)測等具體行業(yè)應(yīng)用或特定業(yè)務(wù)場景。
以系列的形式推出大模型,意味著更高的基礎(chǔ)算力要求。張平安表示,華為云上線了單集群2000P Flops算力的昇騰AI云服務(wù),落地在烏蘭察布和貴安。此外,在大模型訓(xùn)練過程中經(jīng)常會遇到GPU故障,研發(fā)人員不得不經(jīng)常重啟訓(xùn)練,時(shí)間長,代價(jià)大。昇騰AI云服務(wù)可以提供更長穩(wěn)的AI算力服務(wù),千卡訓(xùn)練30天長穩(wěn)率達(dá)到90%,斷點(diǎn)恢復(fù)時(shí)長不超過10分鐘。
京公網(wǎng)安備 11010802028547號