原標題:京東推出言犀大模型數百億條數據扎根產業應用
工人日報—中工網記者 車輝
7月13日,京東言犀大模型在2023京東全球科技探索者大會暨京東云峰會上推出。與通用大模型相比,這一源于產業、服務產業的大模型,融合70%通用數據與30%數智供應鏈原生數據,具有“更高產業屬性、更強泛化能力、更多安全保障”的優勢,致力于深入零售、物流、金融、健康、政務等知識密集型、任務型產業場景,解決真實產業問題。
為夯實產業應用,京東推出了一套大模型的完整工具,包括支撐大模型研發的基礎設施——言犀AI開發計算平臺、向量數據庫、混合多云操作系統云艦、高性能存儲平臺云海、軟硬一體虛擬化引擎京剛等核心產品。
依托京東言犀大模型,以及京東在產業和供應鏈側的優勢,京東還發布了兩大服務平臺,包括全新升級的優加DaaS和言犀智能服務平臺,以及面向零售、金融、城市、健康、物流五大領域的行業解決方案。
京東集團CEO許冉表示:“京東的大模型技術演進,遵循了京東的技術追求:成本、效率、體驗、可信、普惠、突破。成本、效率和體驗是從京東的經營理念傳承而來,也是零售的第一性原理。可信、普惠和突破則是技術服務于產業和社會的承諾。”
京東相信,京東關于技術追求的內涵,在以大模型為代表的AI技術領域,能夠讓產業伙伴更加放心和低門檻地使用技術創新的成果,幫助技術走出實驗室和公司的圍墻,真正推動行業生產效率的提升,在產業場景發揮更大價值。
“大模型真正實現自己的價值,一定是在產業應用中。”許冉表示,大模型的價值=算法×算力×數據×產業厚度的平方。“前三個指標固然重要,但技術在產業場景落地應用,創造實際價值才是關鍵。當產業效率和產業的邊界拓展得到質的提升以后,大模型才有了更重要的實際價值和意義,這將不亞于又一次工業革命。”
“從產業端切入大模型,如同從北坡攀登技術珠峰,道路雖然更加艱難,卻有更波瀾壯闊的風景。”許冉說。
產業場景是京東非常擅長的領域。京東作為一家新型實體企業,自身發展就來自產業場景歷練,擁有包括零售、物流、科技、健康、工業、產發等豐富的產業布局。這為京東積累下每年數百億條優質交互數據,訓練言犀大模型的數據庫,就由70%通用數據和30%供應鏈原生數據組成。
深厚的產業數據積累,以及千行百業Know-How,成為京東布局大模型的核心優勢,訓練出的大模型天然具備“產業基因”。此外,言犀大模型還具備行業泛化能力,并能夠保障客戶在云上云下安全使用。
“數智供應鏈訓練了產業大模型,而大模型則依托供應鏈深入產業”,京東集團技術委員會主席、京東云事業部總裁曹鵬如是說。
對于大模型的應用實踐,京東也有明確的“三步走”規劃。目前,京東云已經基于內部實踐構建了通用大模型;到今年年底這段時間,京東將經由高度復雜場景大規模錘煉,迭代出扎實的產業服務;預計在2024年初,會將大模型能力向外部嚴肅商業場景開放。目前,京東已經走到第二步,并在內部取得了豐富的實踐成果。
相關稿件