狂飆200天,中國門徒不寫詩只做事。
文|《中國企業家》記者 趙東山
編輯|李薇
大模型創業狂飆200多天后,中國探索者們的心態,從理想亢奮來到現實落地。
在此之前,AI大模型的創業在其公司本身之外,還被賦予了民族情緒、時代風口等更多的意義——面對通用大模型ChatGPT的橫空出世,中國創業者們壯志未酬很快達成共識:如何打造一個中國版的OpenAI和ChatGPT。
毫無疑問,ChatGPT是今年的世界頂流。因為它,OpenAI網站的流量在4月份就超過了18億,進入了全球流量排名前20。然而,網絡分析公司Similarweb公布的數據顯示,在狂飆半年后,ChatGPT的訪問量首次出現負增長,6月份的訪問量環比下滑9.7%。
ChatGPT流量驟降引發全球科技界對AI產業泡沫化風險的擔憂和討論,《經濟學人》雜志甚至做出“越大越好的AI之路快行不通了”的論斷。而成為“中國版ChatGPT”的想法,也在和中國創業圈漸行漸遠。
金沙江創始合伙人朱嘯虎在朋友圈寫道:“不要迷信通用大模型,因為明年GPT-3.5就成commodity(通用基礎設施),而三年后,GPT-4也會是。對于大部分創業者,場景優先,數據為王!”
從業者們心態變化的同時,大模型創業市場已經開始出現分野。
中國的大模型企業們已經不再執著于“成為中國的OpenAI”這種理想化目標,也不再癡迷于對參數模型和算力的追求,他們有了更務實的答案,也更注重其對實際產業場景中的問題解決。
AI大模型的競逐迎來了新的賽道節點
集體務實
今年年初,攜程創始人、董事局主席梁建章開始接觸ChatGPT。近些年,他以人口學家的身份活躍在學界和企業界,不過他也曾是中國最早和最小的程序員,也差點成為人工智能方向的博士。
13歲時梁建章設計了一個寫格律詩的程序獲得全國大獎,15歲考入復旦大學少年班,畢業后赴美國留學并在21歲獲得喬治亞理工學院電腦系碩士學位。22歲那年正在攻讀博士的梁建章,突然意識到理論知識的局限性,選擇放棄讀博入職美國甲骨文。
ChatGPT的出現,讓梁建章慶幸自己當年沒有繼續念人工智能博士,因為“所有的這些自然語言處理的算法,都一下被它(ChatGPT)全部打敗了”。他回憶,剛開始接觸ChatGPT的時候,“非常非常震驚”,第二個感覺是謙卑,“我們最后做出來最智能的算法,竟然是跟人腦的生物構造那么的接近”。
梁建章開始思考AI大模型與攜程業務的結合點。
在梁建章看來,智能社會背景下,旅游業作為“難以自動化的精神需求行業”,其需求會隨著整體社會富裕程度的提升而增多,在經濟中的占比也會擴大。他將目光鎖定在旅游行業的垂直大模型上。
過去半年,來自攜程各個業務的成員組成攜程大模型技術團隊。在大模型研發初期,攜程根據大模型的戰略要求進行了組織架構調整,并形成了包括通用技術團隊、內容策略團隊、榜單團隊等不同部門,根據大模型產品的不斷升級迭代對技術團隊進行適配。
梁建章表示,攜程會不遺余力地為大模型投入,“長遠對我們的客戶或者是商戶有價值的,我們就應該非常堅定地投資下去。這個(大模型)非常新,技術團隊不斷優化他們的投資數額,但是我們不設限。”
攜程在7月中旬正式發布了旅游行業垂直大模型問道。問道篩選了200億非結構性旅游數據,結合攜程現有的結構性實時數據,以及攜程歷史訓練的機器人和搜索算法,進行了自研垂直模型的訓練,“同時,我們投入了巨大人力對旅行通用回復內容進行生成和校驗。”梁建章強調。
在問道發布前,攜程已經進行內測,客服人員王蕓明顯感覺自己的工作發生了很大的變化。以前,她一天要接150多個電話,為客人解答售后訂單取消、行李丟失等問題;如今,王蕓轉型成行前推薦客服,從幕后走進直播間,為網友提供旅行前需要準備的服務和建議。
在梁建章看來,通用大模型的基礎上,解決旅游行業準確率的問題依然是關鍵:“旅游是個重消費的行業,即使規劃節省了半小時,但推薦的酒店或者行程結果可能有5%的幾率是錯的。”因此,相較于ChatGPT那樣的通用大模型,梁建章更看重垂直大模型的機會。
雖然在參數上不及通用大模型,也沒有通用大模型對算力等條件的苛刻要求,但垂直大模型對數據和場景提出了更高的要求。
問道大模型訓練中最大的挑戰是真實場景下,用戶獲取旅游信息過程中,多輪交互數據的搜集和清洗,數據量和數據準確性需要不斷修正,特別是旅游行業變化巨大,三年前的目的地信息到現在有可能已經全部過時,特別是疫情對全球旅游業的影響更是加劇了數據的時效性。
和攜程一樣,越來越多的公司把大模型的賽道放到了垂直領域。
京東交出的言犀大模型答卷,也將產業大模型作為重要特征。在京東集團新CEO許冉看來,過去的人工智能技術發展,曾經數次臨近應用爆發的邊緣,但最終往往曇花一現,而技術沒有在產業端形成扎實的應用是重要的原因之一。
在7月7日華為盤古大模型3.0的發布會上,華為云CEO張平安更是直言,“盤古大模型沒有時間作詩和聊天。參數再多、對話能力做得再好,但如果解決不了實際問題,也沒有多大用處。”
騰訊至今還沒有公布通用大模型混元的進展,但卻高調公布了行業大模型路線,一口氣拋出10大行業超過50個解決方案。騰訊副總裁、騰訊政企業務總裁李強同樣表示:“通用大模型不是模型應用的唯一方向,面向垂直產業的模型會成為大模型價值的引爆點。”
心態轉變
大模型創業者心態轉變的一個顯性的節點,是從王慧文被確診抑郁癥,其創辦的光年之外被美團收購開始。大家突然意識到,即便是那個曾經眾望所歸、被寄予厚望的明星公司,也可能因為各種意外的出現而不得不停止。
就在半年前,一夜之間其他風口似乎都消散了,只有大模型是C位。中國科技圈的創業者與投資人,紛紛飛往硅谷向OpenAI學習,張一鳴、馬化騰、王興,這些巨頭的一號位或者決策中心人物,一夜間回到剛創業時的亢奮、好奇狀態,深夜閱讀論文、交流技術。
那時候,似乎每個中國大模型探索者思考問題的角度都是帶著家國情懷的。面對ChatGPT的快速迭代,中國創業者們給自己設定的目標都是如何在多少時間內實現反超。
李彥宏稱,“百度文心一言在研發階段時,百度技術團隊曾與ChatGPT進行對比測試,當時差距是40分的水平,一個月能追得上”;王小川也表示,將在年底做出中國最好的大語言模型。
360創始人周鴻祎在此前接受《中國企業家》的采訪時說道,大模型已不是商業競爭的維度了,如果中文互聯網的封閉性和移動互聯網導致的APP之間的數據孤島問題未能解決,很可能導致人工智能引擎訓練的局限性,進而可能導致中美之間新一輪AI革命的代際差距。
關于為什么沒有在中國誕生OpenAI這樣的公司,中國的企業家們甚至在當時開始反思,過往國內的人工智能探索過于實用主義了,一切以KPI為導向,以至于大家根本沒有那樣的投入決心和耐心,而因此錯過了這樣的重要節點。
激情之下,在百度文心一言打響第一槍之后,超過80個AI大模型在半年內涌現,僅在上海舉辦的2023世界人工智能大會上就出現了30多個大模型,用“百模大戰”來形容當下大模型的火熱一點也不夸張。
但我們真的需要這么多大模型嗎?我們到底需要什么樣的大模型?
事實上,李彥宏很早便提出,“創業公司重新做一個ChatGPT其實沒有多大意義。我覺得基于這種大語言模型開發應用機會很大,沒有必要再重新發明一遍輪子,有了輪子之后,做汽車、飛機,價值可能比輪子大多了。”
京東集團技術副總裁何曉冬同樣從一開始意識到,“大模型要有價值的話,得落在產業上,而且最好是產業價值大的領域,這樣才能真正成為一個長期可持續的事兒,否則就可能會成為曇花一現的東西。”
新的變量
就在國內創業者們苦苦為AI大模型探索時,扎克伯格的一記大招給這個本就瞬息萬變的領域帶來了新的變量。
北京時間7月19日凌晨,Meta發布了開源大模型Llama 2,再次引爆了AI圈:Llama 2不僅性能不輸GPT-3,而且免費、開源,還可商用。Llama 2是Meta今年3月初發布的Llama模型的后續版本。
隨后的微軟Inspire合作伙伴大會上,微軟CEO薩提亞·納德拉宣布了Meta與微軟合作的消息,這項合作讓Llama 2可以運行在微軟的云服務Microsoft Azure上。與此同時,亞馬遜AWS云也加入與Meta的合作中。
Llama 2對大模型創業者的意義在于,就像安卓系統之于APP開發一樣,開發者不用重復造輪子了,直接用最低的成本獲得大模型的基礎設施使用,從而可以更加聚焦自身的產業場景。
這在某種程度上也意味著,對于大多數創業者而言,選擇聚焦產業垂直應用被證實確實是一條更具實用價值的道路。
不過,不同于通用大模型,產業大模型對行業參與者也提出了不同的門檻和要求:一方面,產業大模型要求開發者具備一定技術積累和實力;另一方面,產業大模型也要求操盤者具備豐富的產業應用實踐場景。
梁建章告訴《中國企業家》:“通用大模型最重要的指標可能是,多少的參數或者是用多少的GPU等等,但垂直大模型,大語言模型只是其中的一個組成部分,它還有和其他數據的結合,包括人工的校驗等等,這些是更重要的。最終指向是不是可以把客戶的這些提問、問答來檢驗效率提升了多少,準確性、可靠性提升了多少。”
“旅游最大問題就是可靠性,這確實比AI作詩、寫文章、寫小說可能更復雜,也是一項長期的工作,凡是可以把這個提升到80%、90%,95%,甚至99%的事情,都是值得有必要做的。”梁建章最后表示。
相關稿件