學習或挑戰ChatGPT的“正確姿勢”,或許還是在更基礎、更底層的原始創新中尋找力量。一些中國企業在芯片、操作系統、AI大模型等方面持續投入,并且有所產出,ChatGPT的出現,也是中國AI企業加速奔跑,迎來新一輪發展的契機。
最近,AI(人工智能)圈一股以“ChatGPT”為核心的熱潮從美國“硅谷”涌入中國。
2022年11月底,初創公司OpenAI發布了名為ChatGPT的對話式聊天機器人模型,一經推出,便在網絡上迅速走紅。美國科技公司微軟的聯合創始人比爾·蓋茨高度評價這項技術,認為它的出現不亞于互聯網和個人電腦(PC)的誕生。
進入2023年,微軟推新,谷歌入局,“ChatGPT”熱潮迅速升溫,國內的科技巨頭也陸續涌入潮中。ChatGPT發布后,包括百度、科大訊飛、京東等在內的多家企業紛紛公布自己在AI領域的布局。
近日,360創始人周鴻祎在一場直播中表示,如果企業搭不上ChatGPT這班車,很可能會被淘汰。確實,作為一個現象級的應用(模型),ChatGPT的出現為AI領域的技術發展和產業布局帶來新的變化。
回溯ChatGPT的誕生過程,可以發現這是一個創業團隊先“活下來”,再實現“服務所有人”目標的故事,這也是一個從某個企業閉環研發到整個行業開源共創的AI大模型,更是一個利用超大數據、超強算力、超強算法“喂養”出來的跨越式AI產品,是量變引起質變的產物。
梳理人工智能產業的歷史和現實,可以看到數據背后是廣泛的應用場景,算力背后靠的是完善的信息基礎設施,算法背后需要深厚的人才儲備。這些方面中國已經有所準備,甚至可以說已經積累了龐大的數據、算力和人才優勢。而在ChatGPT浪潮洶涌而至時,盲目跟風、“Copy To China”早已落伍,甚至只是在應用層面“搭車”也顯得不合時宜。
學習或挑戰ChatGPT的“正確姿勢”,或許還是在更基礎、更底層的原始創新中尋找力量。一些中國企業在芯片、操作系統、AI大模型等方面持續投入,并且有所產出,ChatGPT的出現,也是中國AI企業加速奔跑,迎來新一輪發展的契機。
ChatGPT潮涌
“今天我們推出了ChatGPT,嘗試在這里與它交談”。
2022年11月30日,熱潮來襲。OpenAI首席執行官山姆·阿爾特曼當天發布了一則推特,推特中除了上述文字,還包括一個鏈接,任何人都可以點擊鏈接、注冊賬戶,免費與ChatGPT交談。
與Siri、小愛同學等語音助手類似,ChatGPT也是人機交互應用的一種。但在與ChatGPT“對話”的過程中,人們發現它的“智慧程度”遠超其他的人工智能機器人。除了聊天,ChatGPT被網友們用來寫文案、翻譯文本、為代碼糾錯,甚至用來編寫代碼。
據OpenAI官網介紹,ChatGPT能夠連續回答問題、承認錯誤、質疑不正確的前提和拒絕不適當的請求。“第一次,它(指ChatGPT)答錯了,我告訴它正確信息后,再問同樣的問題,它的答案就被改正了過來了。”一位曾嘗試與ChatGPT對話的程序員對記者說,“它甚至為此對我說‘抱歉’”。
憑借出色的表現,ChatGPT僅用兩個月便吸引了超過1億用戶的關注,一躍成為20年來互聯網領域增長最快的消費類應用。
北京時間2月7日凌晨,美國科技巨頭谷歌緊急入局,宣布基于LaMDA大模型的人工智能對話式機器人“Bard”正在進行內測。次日,微軟宣布推出由ChatGPT支持的最新版本Bing搜索引擎和Edge瀏覽器,熱潮升溫并迅速觸及中國。
就在谷歌官宣Bard內測的當天下午,百度官宣了大模型新項目“文心一言”(ERNIE Bot),并表示預計在3月完成內測。隨后一段時間,阿里巴巴、360、科大訊飛、騰訊等多家國內企業紛紛表示對AI技術發展的關注。2月10日,京東云宣布旗下言犀人工智能應用平臺將推出產業版ChatGPT--ChatJD。
從科技巨頭,到行業龍頭,中國企業競逐AI賽道,AIGC(利用人工智能技術來生成內容)等人工智能概念在股市一路狂飆,雖然在監管出手后很快平息躁動,但漲勢依然存在。中信證券研究報告認為,ChatGPT在全球的流行正在推動AIGC產業化全面提速,將引領創成式AI新變革。
“ChatGPT”熱潮涌動,正處于冷靜期的人工智能投資和產業布局迎來小陽春。
用大數據、大算力、強算法“喂養”
商企入局,資本關注。“ChatGPT”熱潮涌動的背后,是AI大模型的一次場景化落地。“ChatGPT的成功,意味著AI大模型之路的發展成熟。”中國信通院云計算與大數據研究所所長何寶宏日前在一篇評論文章中寫道。
AI大模型是人工智能邁向通用智能的里程碑技術,模型可以自動從數據中學習知識,提升性能。GPT是OpenAI推出的AI大模型系列。從2018年到2022年,OpenAI先后迭代并推出了GPT-1、GPT-2、GPT-3和InstructGPT,此次發布的ChatGPT就是在GPT-3的基礎上通過指令微調后得到的。
2022年初,OpenAI團隊開始用GPT-3構建ChatGPT。據《財富》雜志報道,通過GPT-3訓練ChatGPT的過程并不順利,對話的效果并不理想,因此OpenAI決定將ChatGPT放到“野外”供大眾使用。
結果,2022年年底ChatGPT實現了現象級的傳播,這出乎制作團隊所料。“這絕對令人驚訝。”OpenAI首席技術官米拉·穆拉蒂在接受媒體采訪時說。OpenAI用了5年時間在GPT大模型迭代上完成了一場自我革命,在對話的場景中實現爆發。
“ChatGPT通過一種非常簡單的對話方式,構造了非常好的應用場景。”360創始人周鴻祎認為,ChatGPT提供的這些應用場景非常貼近大多數人日常的剛需和痛點,所以它才會火起來,能出圈。
出圈是偶然的,但ChatGPT的成功卻并非偶然,“OpenAI在GPT系列模型的基礎上,對算法、算力、數據等人工智能關鍵要素都進行了一定的升級和優化。”中國信通院云計算與大數據研究所人工智能部副主任董曉飛說。
在算法層面,ChatGPT的基礎是世界上最強大的LLM(大語言模型)之一——GPT-3,同時引入了基于人類反饋的強化學習方法,提高了對話的質量。“從GhatGPT的表現上來看,它的精確性和整個性能效果確實提高了。”董曉飛說。
同時,AI的訓練和使用也需要強大的算力支持。ChatGPT的訓練是在微軟云上進行的,在全球云計算市場,微軟云的市場份額排名第二。高水平、高市場份額,再加上芯片技術的高速發展,這都為ChatGPT的橫空出世奠定了堅實的算力基礎。
除了算法和算力,AI大模型的進步迭代,需要大量的數據進行訓練。2020年發布的GPT-3,其訓練參數量已經達到了驚人的1750億個,“大量的數據被反復‘喂’給ChatGPT。”一位目前在北京大學從事人工智能研究的博士生對記者說。
而且,ChatGPT的訓練成本支出巨大。據Lambda Labs首席科學官Chuan li介紹,擁有1750億個參數的GPT-3單次訓練成本達到460萬美元。在知乎上,網友在討論ChatGPT時,也都認為它很“燒錢”。因此,可以說ChatGPT是一個靠大算力、高成本,用大規模的數據“喂”出來的AI模型。
董曉飛指出,雖然國內外企業在算法研發上基本保持同等水平,但國內更注重大模型技術與行業場景的融合,對于數據標注和模型訓練等高成本的人力投入更為謹慎。
“我們真正缺乏的是技術積累,包括數據怎么清洗、標注以及模型的結構設計,怎么訓練、推理,這個地方很多都需要經驗和積累。”網上一篇爆火的《ChatGPT專家深度解讀》這樣解釋。
搜狐創始人張朝陽在一場直播中說:“ChatGPT的產生是量變到質變的過程,積累了很多年,涉及到算力要有多少服務器,知識庫、標注等很多問題,若沒有這些能力的公司跟風入局,會消耗掉許多資源。”
把握優勢,競逐“生成式AI”浪潮
熱潮已經襲來,有技術基礎的企業在強勢突圍,沒有技術基礎的企業準備發力,尚待進場。而等熱潮退去,能否留在場上,還需看清自己的優勢和短板。
ChatGPT是AIGC的一種實現。董曉飛認為,在AIGC的大模型建設和應用層面,國內企業在技術基礎和創新環境上都存在著相對優勢。
首先,國內持續投入大模型研發、技術基礎扎實。目前,阿里達摩院的多模態大模型M6參數量已達10萬億,是全球最大的AI預訓練模型;華為盤古、百度文心等大模型的參數量都超過了千億,其中百度文心模型參數量已經達到2600億,不遜于GPT-3。“國內有關企業、研究機構近幾年在大模型方面已經有了技術積淀。”董曉飛說。
其次,國內加快“產業數字化轉型”、實現人工智能與實體經濟融合等政策為人工智能提供了創新發展環境。近日,國務院國資委印發《關于做好2023年中央企業投資管理進一步擴大有效投資有關事項的通知》,指出要加大對5G、人工智能、數據中心等新基建投入。近年來,我國發布了一系列政策文件,為人工智能核心技術攻關、產品落地應用以及探索發展新模式新路徑提供支持。
把握優勢的同時,也要看到目前面臨的一些挑戰。如AI領軍人才相對短缺,AI與實體經濟的融合程度仍需進一步加深等等。對此,董曉飛建議,要特別關注一些底層技術的發展,如大模型框架、算法等,還要進一步拓展AI的應用場景。同時他也表示,要進一步提升大眾對AI的認知,“這對于AI的發展是有好處的。”
但董曉飛也指出,基于大模型的聊天機器人成本投入巨大,“企業前期投入需保持一定的謹慎,且需要看清方向。”
中國新一代人工智能發展戰略研究院發布的《中國新一代人工智能科技產業發展報告(2022)》數據顯示,中國人工智能企業布局側重在應用層和技術層。其中,應用層人工智能企業數占比最高,達85.18%;技術層和基礎層企業數分別占比12.41%和2.41%。由此可以看出,我國人工智能發展在應用層面有較大優勢。
在董曉飛看來,ChatGPT的成功出圈模式為企業提供了大模型、生成式AI、智能對話等技術的商業化應用路徑,尤其將助力“生成式AI”通過更多形式實現在更多行業的探索和應用。
“目前來看,國內大模型開發廠商一是布局以大模型為基礎的通用對話、生成等能力;二是將其能力整合到搜索引擎、智能客服、智能音箱等產品線中;三是通過能力調用為中小企業滿足具體場景落地需求。”董曉飛說。
隨著ChatGPT的爆火,隨之而來的安全、隱私保護、知識產權等問題也值得關注。“目前國外出現有學生使用ChatGPT寫論文作弊的情況。模型使用大量的數據進行訓練,也存在使用過程中可能提供他人創作的侵權行為風險。”董曉飛認為,如何防止ChatGPT類產品的濫用對社會產生潛在負面影響亟須得到重視,“更希望我們目前的一些主流企業、科研機構,在生成式AI上發力,能引領新時代的AI發展。”(中青報·中青網見習記者 賈驥業 記者 王林)
相關稿件