近日,圍繞火爆全網的ChatGPT話題,聯想集團CTO、高級副總裁芮勇博士接受了《中國計算機學會通訊》(CCCF)的專訪,并分享了對ChatGPT等大模型的看法。芮勇表示,聯想新IT架構將在AI新范式加速智能化變革的過程中繼續發揮重要作用。除了基礎架構之外,聯想還在考慮AIGC技術在產品和業務里的應用。
從大模型到AGI還有多遠?
ChatGPT是OpenAI GPT系列中為對話場景優化的語言模型,屬于Foundation Models,即基礎模型,簡稱為“大模型”。芮勇將它的特點概括為“一大三多”:一大是指參數規模大,是千億參數級別的超大型人工智能模型;三多是指利用多來源、多模態、多任務的互聯網規模海量數據進行訓練。
芮勇認為,大模型首先在內容理解領域大獲成功,例如BERT問世時刷新了11項自然語言理解任務的記錄,最近又在內容生成領域取得了矚目成就,也就是AIGC。
對于外界普遍關心的大模型是否催生了AI新范式,芮勇給出的答案是,簡單來講,AI范式的轉變,是從“針對特定任務,更新預訓練模型”(small models + fine-tuning)轉換到“根據上下文提示自動理解并執行各類任務,無需更新模型參數或架構”(large models + in-context learning)。
ChatGPT的成功,讓業界看到了由大模型通往AGI (通用人工智能) 的曙光,不過,芮勇認為,大模型能走多遠,前景到底如何,是否能實現“多任務,多模態,多化身的大一統”,目前還頗有爭議。
他進一步解釋,近幾年大模型有了突破式進展,很多人持樂觀態度。從Gartner技術成熟度曲線可以看到,大模型目前處于“期望膨脹階段”(Peak of Inflated Expectations) 。人們對它的期望很高,但也應該看到,大模型尚未解決的問題還很多。比如谷歌版的ChatGPT,取名Bard,首次公開展示就出現回答結果不準確的問題,導致公司市值一天之內蒸發超1000億美元。此外,對話機器人生成句子里包含的信息無法溯源,甚至包含偏向性和冒犯性言論等等。可見,通往AGI的道路還很漫長。
聯想在大模型普及中發揮怎樣的作用?
大模型的興起,為進行智能化變革的企業帶來了很多新的機遇。芮勇以聯想為例進行了介紹。聯想借鑒大模型背后的基礎性算法,將小樣本學習應用到基于計算機視覺的產品缺陷檢測當中,提升了質檢系統對新產品和新產線的快速遷移能力;此外,聯想還將強化學習技術和人機協作的理念應用到供應鏈優化當中,使得供應鏈在劇烈變化的環境中,不斷提升韌性。
對于聯想將在AI新范式和大模型普及中發揮怎樣的作用,芮勇表示,長遠來看,很有可能AI新范式(large models + in-context learning)與舊范式(small models + fine-tune)共存,或是相互結合,而不會單個范式一統天下。聯想將充分發揮“端-邊-云-網-智”新IT架構的優勢,來支撐新舊范式的結合與轉換。聯想提出的新IT架構,既致力于推動自身的智能化變革,也著眼于賦能各行各業的智能化轉型。AI模型對運行環境需求越來越高,例如云-邊-端的高度協同,異構計算與負載均衡、設備之間的互聯互通、數據安全與隱私保護、模型本身的伸縮性與擴展性等等。聯想在這些方面都有著深厚的技術積累,新IT架構在AI新范式加速智能化變革的過程中也會繼續發揮重要作用。
除了基礎架構之外,聯想還在考慮AIGC技術在產品和業務里的應用。比如,在智能設備中對跨模態的生成模型進行優化和裁剪,使之能加載到手機或平板上實現個性化內容生成。在智能解決方案方面,我們考慮把AIGC用于新產品營銷與新客戶觸達。目前,大模型還沒有與知識有效結合,我們正在研究數據驅動與知識驅動相結合的方法,即Hybrid Learning來改進大模型的不足。另外,在大模型落地過程中,也需要徹底解決對環境變化或是新領域、新任務的自適應問題,即Adaptive Learning,這些都是聯想人工智能的探索方向。
相關稿件