4月8日,人工智能大模型技術高峰論壇在杭州蕭山開幕。
證券時報·e公司從現(xiàn)場了解到,出席此次活動的嘉賓,不僅包括多位重量級院士嘉賓,華為云人工智能領域首席科學家田奇也現(xiàn)身,并就人工智能發(fā)展趨勢、盤古大模型的進展及應用等熱點話題,在會上進行了分享。
大模型是未來AI生態(tài)的核心
今年以來,人工智能持續(xù)在全球升溫,在這輪新的人工智能浪潮中,田奇稱,人工智能發(fā)展,已經(jīng)從局部探索,走向千行百業(yè)。AI正在走進企業(yè)核心生產(chǎn)系統(tǒng),開始創(chuàng)造更大價值;人工智能行業(yè)滲透率提速,2026年將達到20%。
在田奇看來,人工智能發(fā)展趨勢呈現(xiàn)兩大特點:首先是從小模型到大模型;其次是人工智能與科學技術的交匯。
據(jù)介紹,大模型成為應對AI領域應用碎片化的一種方式。這種方式下,提高了模型泛化能力,減少了對于領域數(shù)據(jù)標注的依賴和模型微調(diào);模型復雜度(參數(shù)個數(shù))持續(xù)爆發(fā),不到半年增長了10倍,達到了1750億。
同時,大模型有可能收編高度定制化的小模型,導致市場向大模型集中。這主要是因為,開發(fā)大模型資金門檻高,開發(fā)和訓練一次,需要1200萬美元;技術門檻高,具有對AI框架深度優(yōu)化和超強的并行計算能力。
另外,大模型正在改變AI產(chǎn)業(yè)的規(guī)劃與格局。比方說,牽引AI產(chǎn)業(yè)快速收斂,構建AI產(chǎn)業(yè)的底座;匯聚和沉淀行業(yè)生態(tài)及開發(fā)者生態(tài),形成產(chǎn)業(yè)生態(tài)黏性。
AI在哪些科學計算場景能發(fā)揮“尖刀”作用?“工業(yè)、氣象、能源、生物醫(yī)學等眾多領域,都受到了人工智能的深刻影響。”田奇稱,大模型是連接技術生態(tài)和商業(yè)生態(tài)的橋梁,是未來AI生態(tài)的核心。
“AI for Industries是人工智能新的爆點”
除了行業(yè)的發(fā)展趨勢,田奇也談到了盤古大模型的進展和趨勢。田奇稱,華為盤古大模型正在推動人工智能開發(fā)從“作坊式”到“工業(yè)化”升級。
據(jù)介紹,2019-2021年,華為開始了盤古大模型的立項研發(fā),并在2021年4月份開發(fā)出了盤古基礎大模型,隨后又陸續(xù)發(fā)布了多個盤古行業(yè)大模型系列。譬如,2021年9月份,開發(fā)了盤古藥物分子大模型;2022年6月,盤古礦山大模型;2022年11月份,盤古氣象、海浪、金融OCR等領域大模型發(fā)布。
“大模型是AI產(chǎn)業(yè)快速發(fā)展的必然選擇,行業(yè)正在從‘大煉模型’轉(zhuǎn)向‘煉大模式’。”田奇稱,傳統(tǒng)AI時代,不同場景對應不同小模型,一個場景一個模型,模型參數(shù)小,泛化性差。大模型時代,大模型吸取海量知識,適配多業(yè)場景,多個場景一個模型,模型參數(shù)大,泛化性強。
譬如,GPT-2,參數(shù)為15億,到了GPT-3,參數(shù)為1750億。盤古大模式,參數(shù)達到了千億級。Switch Transformer,參數(shù)已達到了16000億。多參數(shù),可以掌握海量知識背后的邏輯,有極高泛化能力;同時,還可以降低研發(fā)成本,自監(jiān)督學習,減少標注數(shù)據(jù),解決人工標注成本高,周期長,準確度不高問題。
據(jù)介紹,華為盤古大模型,具有優(yōu)秀的泛化能力,可以充分挖掘數(shù)據(jù)內(nèi)的聯(lián)系,達到更高的泛化性能;高效樣本篩選能力,可以海量無標注樣本篩選,節(jié)省80%以上人力標注代價;小樣本/零樣本能力,自動化數(shù)據(jù)增強,數(shù)據(jù)挖掘算法,實現(xiàn)零訓練樣本下缺陷樣本識別,較傳統(tǒng)方法發(fā)現(xiàn)率提升2-3倍;低門檻AI開發(fā),提供自動化工作流,自動數(shù)據(jù)處理,自動化調(diào)參,自動化生成模型,減少對AI開發(fā)工程師專業(yè)依賴。
“AI for Industries(工業(yè)人工智能)是人工智能新的爆點,盤古行業(yè)大模型正在加速落地,賦能千行百業(yè)智能升級。”田奇稱。