提問“外感風寒推薦哪些方劑”,系統在幾秒鐘內就能列出麻黃湯、桂枝湯等方劑與具體成分;提問“身體濕氣重有哪些危害”,系統也能快速給出全面解答、提出飲食調理等治療方法……走進天津天開高教科創園5號樓,天大智圖(天津)科技有限公司的工作人員正忙碌地對“海河·岐伯”中醫藥大模型展開內測。公司研發總監徐大為說,在人工智能輔助下,大模型能為臨床醫生提供內容更廣泛、更全面的輔助診療建議,進一步提高中醫診療效率。
提出問題,迅速獲得專業回答;輸入需求,在線進行服裝設計;提供圖紙,自動完成冰箱組裝……近期在天津舉辦的2024世界智能產業博覽會上,一批聚焦工業、制造業應用的垂直領域大模型成為與會人士關注的焦點。
推動大模型更加深入賦能工業制造業,是人工智能行業發展的重要方向。但由于供需不匹配、數據難獲得、算力水平低等問題,工業大模型當前的發展速度和規模仍受制約。面對人工智能“百模大戰”風起云涌的現實環境,工業大模型如何聚焦細分領域、加速創新破局?
工業大模型發展如火如荼
隨著新一代人工智能技術的發展,基于大模型的生成式人工智能以學習能力強、處理速度快、服務個性化等優勢,成為智能科技領域的“寵兒”,尤為吸睛。
作為海爾卡奧斯工業互聯網平臺在人工智能領域的前沿科技成果,卡奧斯工業大模型COSMO-GPT亮相2024世界智能產業博覽會。在產品發布環節,卡奧斯工業智能研究院執行院長秦承剛分享了卡奧斯工業大模型在助力工業企業優化工藝、流程、成本、效率等方面的功能。
“通過對開源大模型進行微調訓練,卡奧斯工業大模型COSMO-GPT注入了562個工業數據集,擁有300多萬條高質量工業數據、3900多個機理模型和200多個專家模型,推理準確率達到了96%以上,意圖識別準確率達到了85%以上。”秦承剛說。
羚羊工業大模型也吸引了許多觀眾駐足體驗,他們紛紛就“地效翼船的工作原理是什么”“生產制造焊條要依據哪些標準”等話題進行提問,大模型都能第一時間回復。在大模型的工業視覺質檢助手中,上傳一張圖片,輸入“識別沒有戴安全帽的人”,系統很快就能準確進行判斷。
羚羊工業互聯網股份有限公司總裁徐甲甲說,羚羊工業大模型是以訊飛星火認知大模型的通用能力為核心技術底座,結合工業場景實際需求打造的大模型,具有工業文本生成、工業知識問答、工業理解計算、工業代碼生成、工業多模態等核心能力,可以從海量數據和大規模知識中持續進化,實現從提出、規劃到解決問題的全流程閉環。
“過去一年,大模型的長足進步使得信息分發獲取、內容生產、全自然交互都顯現出極大不同,逐步改變著科研范式、產業形態與市場競爭格局。”科大訊飛股份有限公司董事長劉慶峰表示,隨著“底座”能力的提升,不少技術進展將能與大模型“通”“?!苯Y合,賦能行業發展。
不同于通用大語言模型,研發工業領域垂類大模型需要大量生產工藝、質量檢測等核心數據。菲特(天津)檢測技術有限公司創始人曹彬回憶,最初,企業雖依靠長期實踐積累了大量工業數據,但并沒想到這竟會成為公司發展的一筆寶貴財富。
“現在,這些數據成了我們技術創新的‘核心秘籍’?!辈鼙蛘f,依托數據優勢與核心算法平臺,企業研發的工業垂類大模型就像生產線上的專家“智囊團”與實時“診療師”,針對生產瓶頸與設備故障迅速“對癥下藥”、答疑解難,并提出優化生產調度和調整工藝參數的建議,推動產品提質升級、幫助企業降本增效。去年,該公司實現營業收入2.33億元,收入連續三年快速增長。
工業和信息化部賽迪研究院發布的數據顯示,2023年,中國生成式人工智能的企業采用率已達15%,市場規模約為14.4萬億元。專家預測,2035年生成式人工智能有望為全球貢獻近90萬億元的經濟價值,其中中國將突破30萬億元。
“未來,通過發揮數據要素的‘融合劑’和‘催化劑’作用,現有業態和數字業態將得以進一步跨界融合,衍生疊加出新環節、新鏈條、新活動形態,推動產業升級?!碧旖蚶砉ご髮W計算機科學與工程學院教授王勁松說。
多重短板制約規?;瘧?/strong>
業內人士表示,以基礎大模型為技術底座、以工業應用為切入點推動AI行業發展已成為業內共識,但目前供需不匹配、數據難獲得、算力水平低等問題仍在制約大模型進一步發揮賦能效用。
——不夠“聰明”,部分產品僅能“打醬油”。多位受訪人士表示,大模型在制造業領域應用潛力巨大,但目前不少大模型仍難以匹配適應企業生產的實際需要。佛山市順德區捷通數碼科技有限公司總經理廖偉權表示,企業的智能監控終端產品需要進行視覺訓練,若有大模型幫助,可大幅提高效率,但目前市面上可用的大模型產品有限。
部分政務大模型聲稱具有工業相關內容,但其專業化水平相對較低。360集團創始人周鴻祎說,一些大模型在企業和政府內部應用時,使用者會發現其不僅缺乏行業深度,對業務也并不熟悉?!斑@些大模型一般是基于互聯網上的公開數據訓練而成的,往往難以滿足實際需求。”
——“各自為戰”,數據要素流動難。大規模數據是大模型能力的基礎保障,但目前數據體系建設仍存在多項短板。國家智能網聯汽車創新中心首席科學家李克強表示,受限于工業場景碎片化、工業領域訓練數據采集整理困難等問題,單一企業開發的大模型往往存在數據量不足、完備性不夠等問題,導致大模型與行業融合應用難。王勁松認為,盡管我國擁有海量的數據資源,但是數據“孤島”和數據“煙囪”問題依然嚴峻,迫切需要找到突破口、打破數據壁壘。
同時,數據隱私與版權等問題也在一定程度上制約了數據的流動?!艾F在的知識已經被大模型解構甚至‘像素化’了,很難直觀地看出大模型產生的內容參考引用了哪些知識、信息或藝術風格?!鼻迦A大學新聞與傳播學院教授沈陽表示,隨著AI對人類的理解越來越全面深入,其對人類隱私的侵犯也會越來越直接和嚴峻,在數據交易過程中數據版權的保護也會更加困難,這使得數據確權問題成為一項挑戰。
——算力“卡殼”,公共云占比較低。大模型發展背后必須有龐大的算力基礎作為支撐。專家表示,公共云是破解我國“人工智能+”時代算力“供不上、用不起”的重要抓手,能以資源利用效率最大化的方式,讓更多的用戶享受普適普惠的算力服務,但目前公共云發展仍存在不少短板。國家信息中心發布的《“人工智能+”時代公共云發展模式與路徑研究》顯示,2018年至2022年,我國在用數據中心機架總規模年均增速超過30%,但2022年上架率僅58%,低于全球平均水平。
國家信息中心信息化和產業發展部主任單志廣認為,目前我國算力利用率仍不高,公共云占比較低尤其制約了大模型規?;瘧?。
加速破局尚需多方合力
專家認為,隨著人工智能技術和應用領域持續拓展,政府、企業等各方仍需積極參與,推出更多滿足各行業需要的垂直大模型,推動產業轉型升級和高質量發展。
首先,加快推進數據要素市場建設。2023年底,國家數據局等17部門聯合印發《“數據要素×”三年行動計劃(2024—2026年)》,旨在推動建設人工智能高質量數據集,并鼓勵社會公益機構、大模型企業、新型數商積極參與,為大模型加速發展奠定了制度基礎。王勁松認為,應加快構建重要領域數據資源基礎庫,加速完善面向現代化產業體系建設的數據開發開放和流通使用制度體系和服務生態。在保證安全的前提下,加速建設數據要素市場,加強數據供給激勵,給予數據采集、加工、流通、應用等不同環節相關主體一定的試錯空間,鼓勵面向數據要素價值實現的科技創新和產業創新,著力推動數據高質量供給與數據創新性應用的雙向賦能和快速迭代,為發展新質生產力拓展要素配置空間。
其次,依托開發者團隊為產業賦能。劉慶峰認為,打造一支覆蓋各行業的開發者團隊,是實現大模型為產業賦能的重要保障。據介紹,2023年5月6日“訊飛星火”正式發布以來,已新增超過273萬開發者,其中大模型直接相關的開發者數量超過52萬,企業級用戶超過32萬。秦承剛也表示,打造人工智能開放創新平臺至關重要,只有通過一系列應用場景的大規模實踐,根據用戶需求反復驗證和優化,才能形成符合工業轉型和高質量發展需要的智能體,從而進一步復制推廣。
再次,專注單一領域,把大模型做小?!白罱撓搿⑻O果、微軟、三星都在把模型做小,要讓模型上電腦、上手機、上汽車。塊頭越做越小,能力越變越強?!敝茗櫟t說,目前,不宜再追求一個大模型解決所有的問題,而需強調術業有專攻,讓一個大模型解決一個專業問題,再由多個專業大模型組合起來一起為政府和企業工作?!爸灰悸忿D變了,過去限制大模型走進政府和企業的很多問題都會迎刃而解?!?/p>
聯想集團董事長兼CEO楊元慶也認為,將小參數的大模型部署在政府和企業內部,可以保證數據安全。他表示,公共智能與私域智能共存、互補構成的“混合式人工智能”,將成為大勢所趨。最佳路徑是打造人工智能個人終端設備,擁有強大的本地異構算力,還能夠建立個人知識庫,連接開放的人工智能應用生態,從而帶來新的巨大增長機遇。
相關稿件