◎智谷趨勢| 王延鶴
只有視頻化才能生存
隨意打開一個APP,最顯眼的位置,放的都是視頻。
花花世界迷人眼。前100位的APP里,69個都有視頻類功能。
想想看,你每天花多少時間刷視頻?
根據《中國網絡視聽發展研究報告(2023)》統計 ,短視頻人均單日使用時長,超過2.5小時。
信息嚴重過剩,讓我們的注意力也成為一種稀缺資源。
你把時間花在哪里,命運就在哪里。
懂得這個道理的企業和品牌,紛紛開始做內容、做直播,給產品添加視頻功能。
最樸實的想法,就是存量競爭時,通過視頻化吸引用戶。
短短5年,中國短視頻用戶,從6.48億增長到10.12億;
2022年,中國視頻直播帶貨規模約3.5萬億,在網上零售額占比高達25.4%;
出門逛街,服裝店老板娘、燒烤攤大爺,都架著手機在直播;
周杰倫辦線上演唱會,有1億人觀看,大家一起唱“故事的小黃花,從出生那年就飄著”;
就連外賣軟件也在搞直播,看菜品、發紅包,來段脫口秀。
在注意力經濟時代,只有視頻化才能生存。
8月22日,火山引擎視頻云&AIGC技術大會召開。
大會主題是“視象新生”,火山引擎作為抖音的技術底座,要向全行業展現當前視頻創新、變革的源動力。
火山引擎總裁譚待認為:
隨著全行業視頻化的演進,營銷,知識、商業和空間的交互體驗也正在被重塑。
意思是說,視頻從一種內容形態,變成必不可少的能力。
過去三年的現實困境,讓線上化、視頻化、數字化,成了必然的選擇。
肉眼可見的,視頻化對辦公、教育、醫療、汽車、金融等行業,帶去顛覆性的商業創新。
視頻會議、辦公軟件收獲了億級增長,頭部辦公APP用戶數突破6億;
遠程醫療發力,醫生通過視頻通話對患者提供診療,管理患者情況;
智能工廠里,定位、測量、質檢、監測、安全生產都要用到超高清視頻技術與5G、人工智能的結合;
24小時直播的數字人、大模型定制的AI員工,都開始上線;
視頻技術打破時空、創造體驗、提升效率、轉變商業思維的能力,在本質上,也是數字化革命的一個切面。
萬物皆可視頻化,轉變為數據流。這是機遇也是挑戰。
火山引擎提前捕捉趨勢,大會上發布了自研視頻編解碼芯片、BMF多媒體處理框架等全新技術,以及平行駕駛、虛擬直播間、VR直播等行業解決方案。
聽起來,有些不明覺厲?別著急。
簡單來說:火山引擎要把抖音的音視頻能力,向全行業開放了。
極限挑戰往往是最好的倒逼師
數據是最直觀的。
視頻在全網數據流量中的占比接近70%,增速還在攀升。
龐大的視頻直播需求,把視頻云變成了水電煤一般的基礎設施。預計到2024年,就會成為近千億級的大市場。
云計算作為一項商用服務,起源于亞馬遜,電商生意。
至今,亞馬遜還是全球最大的云服務商,云業務是其最賺錢的部門。
像亞馬遜和阿里云,為了應對雙十一、黑色星期五期間的流量高峰,儲備了大量冗余算力。
這些服務器平常閑置時,就可以作為基礎設施,租借給外部,幫企業低成本上云,不用自己搞IT。
之后,互聯網大廠又把自己先進的企業軟件、平臺能力、人工智能,都通過云計算打包成產品和服務,輸出給客戶。
眾多企業和云平臺綁定,就形成一個具備確定性的生態,也奠定了今天的云服務格局。
在視頻云的細分賽道,火山引擎最初也是服務字節跳動內部,尤其是抖音的視頻需求。
在2018年,抖音的日活用戶數超過1億。
每天要應對視頻播放、傳輸、畫質、交互、性能的多重挑戰,內部必須要組建能力消化、應對。
真刀真槍的實戰中,火山引擎視頻云應運而生。
現在各路企業都想通過視頻化,為自己多掙一點確定性。
聽起來容易,但如果企業自己搭建視頻平臺,首先是成本太高,其次缺乏成系統的成熟經驗,技術門檻也比預想的高。
有需求,就有服務。這就是火山引擎視頻云的想象空間。
歷史經驗告訴我們,極限挑戰往往是最好的倒逼師。
春晚、奧運會開幕式、世界杯這類大型賽事直播,也會創造短期流量洪峰。
火山引擎視頻云,就在2022年接受了抖音直播卡塔爾世界杯的挑戰。
賽場上,開始射門了。
火山引擎視頻云色彩增強對比示意圖
這1秒鐘,現場的畫面通過衛星,從卡塔爾傳輸到中國,抖音要瞬間將畫面壓縮、美化,傳輸給數以億計的設備,變成你手機上的720p、1080p、4K;
這1秒鐘,如果是4K50幀畫質,視頻大小接近50M,同時傳給上億人,線路承受不住。抖音將視頻編碼壓縮到10M,傳給你的手機再解碼,才避免被流量高峰沖垮;
這1秒鐘,工程師要將HDR信號轉換為SDR,對畫面上800萬個像素的色彩、亮度、對比度進行“美顏”;
這1秒鐘,他們要用自研的RTM直播技術,把直播的延時降到半秒,讓所有人能同步看到比賽結果;
整場世界杯,火山引擎累計支持了106億人次的直播觀看,決賽觀看人數高達2.3億。
射門進球,全場歡呼。屏幕上是1秒鐘,火山引擎幕后十年功。
這些在流量高峰中突破的技術,也會逐步開放到視頻云的產品里,變成向外輸出的能力。
今天,抖音的日活已超過6億,2022年抖音電商同比增長了80%。可以說,火山引擎每分每秒都在極限測試,不斷解決、試錯、交付、迭代。
火山引擎視頻云想向B端企業證明,自己的增長飛輪、確定性能力,是可以對外輸出的。
想要開動引擎,讓命運的齒輪轉動起來。
火山引擎到底想輸出什么樣的硬實力呢?這要看產業的需求,以用戶為中心嘛。
大會上提出,視頻技術面臨三個難以解決的矛盾:
首先,不管視頻要更高清,還是更低延時,核心都需要升級視頻編碼技術。
視頻標準每升級一代,技術復雜度就會提高十倍;視頻編碼每升級一代,質量碼率則減少50%,但視頻數據量擴展卻不止2倍;
編碼的迭代速度,追不上視頻數據量的增速,這是第一個矛盾。
其次,摩爾定律變慢了。視頻芯片處理和算力增長的速度,支撐不了大規模8K/VR直播和視頻數據的需求。
算力有上限,需求無極限,這是第二個矛盾。
第三個矛盾,是XR/VR技術興起,虛擬現實與現實世界融合,將帶來新的沖擊。
面對這三大矛盾,結合眾多企業的訴求,火山引擎重新構建了“一站式音視頻產品矩陣”。
最底座的算力層,是視頻處理的基礎。
視頻需求的快速膨脹,倒逼火山引擎的算力底座,完成了從通用計算到異構計算的轉型。什么意思呢?
什么是異構計算?
好比一支足球隊,隊員有不同的特長,擅長不同的攻防位置。
算力也一樣,不同的芯片和處理器,擅長不同的任務。比如說,CPU擅長通用計算,GPU適合圖形渲染、深度學習,FPGA擅長網絡加速、數據處理。
異構計算就是讓不同的芯片組隊,在應對視頻任務時,發揮更高效率。
火山引擎在大會上發布的自研芯片,就是一塊擅長視頻編解碼的芯片。
在處理視頻時,1臺搭載這塊自研芯片的服務器,轉碼能力與百臺CPU服務器相當;壓縮效率比目前主流的硬件編碼器,提升了30%以上。
并且,這塊芯片提前為未來設計,具備支持HDR和8K超高清視頻的能力。
對企業來說,成本大大降低。
而在框架模型層面,火山引擎聯合英偉達,共同打造了BMF多媒體處理框架。
這又是什么呢?
簡單地說,BMF框架就像一個裝滿工具的工具箱。
裝滿了視頻化需要的所有技術,比如視頻編解碼、智能處理、視頻分析、圖像生成。
它就是火山引擎過去3-4年,沉淀的全鏈路視頻能力,目前已投入使用,每天要處理數以億計的視頻。
和過去的視頻處理平臺相比,BMF的優勢在于:
幫助企業將各種視頻處理能力和解決方案協同工作,快速實現視頻化落地;
支持從生產到消費的各種視頻應用場景,包括視頻轉碼、云編輯、移動端后處理,特別是AI帶來的視頻增強、視頻質量分析等功能;
提供多語言開發支持,使開發更加方便,提高效率。
這個框架已經全面開源了,包括它的框架層,9個開箱即用的案例,以及超過20個API范例。
在應用層面,火山引擎的行業解決方案,就給了開發者拿來即用、有方法論的視頻化能力。
比如說,已經在抖音落地的互動直播營銷解決方案。
就把整個直播鏈路都數據化了,這是要教給你,在視頻領域使用數據驅動的增長方法。
讓你一目了然,針對性增加互動、優化方式,直接提升直播轉化率和營收水平。
今年蘋果推出Vision Pro后,又為VR市場加了一把火;AI大模型的發展,也為數字人、虛擬直播的大規模應用,鋪好了路。
火山引擎在Pico VR的實踐基礎上,打造了8K級、360度的VR直播全鏈路解決方案。
這降低了VR內容的制作門檻,企業能在Vision Pro、Pico等設備里,上線自己的VR應用。
而火山引擎專門打造的虛擬直播間解決方案,也能打造數字人主播、虛擬直播場景和AR場景。
當然,直播技術是火山引擎的老本行了。除了直播,他們在過去幾年也與行業合作,打造更加產業級的視頻應用。
比方說,自動駕駛的核心技術,其實就是AI、視頻處理、實時傳輸。
火山引擎的視頻處理、高速傳輸技術,就很適合與自動駕駛公司合作。
將音視頻處理速度提升一個量級,這就是火山引擎的遠程車控方案。
毫末智行與火山引擎共同構建的遠程車控方案,把汽車視頻處理速度提升了一個量級。
在車載視頻監控、哨兵模式、遠程理賠、快遞到車等任務中,把視頻延時壓縮到90毫秒,幾乎是實時同步了。
這讓自動駕駛、遠程操控,又突破了一個技術難點。同樣的技術,也可以用到機器人、智能制造里,依賴視頻視覺技術處理的地方。
再比如說,今年火遍全球的AI大模型。
近期,火山引擎首次把AIGC視覺大模型,用來修復老電影的。
老電影用膠片保存,時間久了都會是“全損”畫質。
所謂修復工作,其實就是把膠片數字化,再一幀幀畫面“P圖”:清污、補接、處理劃痕、顏色調整。
一部90分鐘的電影,畫面有十幾萬幀,如果都靠人力P圖,顯然耗時費力、成本高昂。
而通過視覺大模型,對修復效果實現了大幅度的提升,并且能規模化、高效率進行修復工作。
火山引擎也宣布,要修復100部香港老片,將《A計劃》《笑傲江湖》《蜀山·新蜀山劍俠》等經典都提升到4K畫質。
可以說,圍繞視頻化中臺,火山引擎深入了新一代數字基礎設施的底座,并與千行百業建立了關系,成為一個扎根視頻技術的新生態。
字節跳動視頻架構負責人王悅表示:
當技術面臨瓶頸,也許我們可以換一種姿勢奔跑,從算力,體驗和交互不同維度突破;
基于抖音等業務大規模實踐打磨,燃燒沉淀自己,把火種傳遞給更多人。
結語
現在你知道,火山引擎想輸出什么樣的能力了吧?
在視頻時代的上半場,人們看到了技術對娛樂、電商、社交、教育帶來的改變。
在如今的下半場,變化的是什么?大家需要什么?? ? ??
是線上化嗎?實時化?體驗感?? ?
本質,還是效率的提升。
追求效率提升,追求增長,追求穩定,這才是大家的共同訴求。
你只要嘗過甜頭,轉變了眼界,才發現原來可能性還有很多。
走出一條數字化路徑后,火山引擎,也想成為確定性的創造者。
相關稿件