AI大模型空前火爆,應用服務加速,正在走進人們的工作和生活。其中,大語言模型(LLM)以其在圖像、語音、自然語言處理等方面表現出的卓越能力,使其成為最重要的AI技術之一。 作為中國AI服務器市場的TOP3和中國領先的計算產品方案提供商,寶德堅持技術創新,基于英特爾AI軟硬件技術基礎等打造多樣性的AI算力和解決方案,為AI產業快速發展和AI大模型落地應用做出積極的貢獻。
英特爾?至強?CPU Max系列,大語言模型工作負載的實力擔當
一直以來,英特爾以廣泛的AI硬件和軟件組合助力大語言模型的普及,推動AI發展惠及各行各業。其中,第四代英特爾?至強?可擴展處理器以其原生AI加速能力和全面提升的整體性能,充分滿足大模型工作負載以及復雜AI計算場景的需求。
第四代英特爾?至強?可擴展處理器具有英特爾高級矩陣擴展(AMX)的AI加速功能,有全新的指令集與電路設計,可幫助諸如圖像識別、對象探測等任務中的張量處理獲得多倍效率提升,并可用于INT8、BF16等不同數據格式以加速深度學習訓練和推理工作負載等多種類型的AI模型,性能高達上一代10倍。
英特爾?至強?CPU Max系列
在此基礎上,英特爾?至強?CPU Max系列更是大模型的算力擔當,它每顆CPU提供64GB的高帶寬內存(HBM2E),兩顆共128GB,有效解決大語言模型工作負載經常受到內存帶寬限制的窘境。數據顯示,其針對建模、人工智能、深度學習、高性能計算 (HPC) 和數據分析等實際工作負載的性能提升了 4.8 倍。
基于英特爾?至強?CPU Max系列的寶德服務器,為大模型推理應用提供澎湃算力
寶德自研雙路服務器PR2715E
寶德自研雙路服務器PR2715E,支持兩顆英特爾?至強?CPU Max系列,以比較基礎的32核心+64GB HBM緩存的Max 9462為例,該產品就可輕松支持60B參數下8路推理需求。它采用CPU+GPU異構計算設計,有8個標準PCIe5.0插槽,可以支持8張單寬或3張雙寬包括英特爾?GPU Flex系列的GPU計算卡,強大的AI算力和安全技術,能夠為大模型AI推理工作負載加速和護航。另外,該機型有32個DDR5內存插槽,最大可支持8TB,支持400Gb/s高速網絡,優化低延遲應用體驗;它最大支持12個2.5”( 3.5”)和4個后置2.5 ” SATA/SAS/NVMe熱插拔硬盤,或24個2.5”SATA/SAS/NVMe和2個后置2.5 ”SATA/SAS熱插拔硬盤,支持內置1個M.2(NVMe/SATA),保障了整機性能的強勁可靠。此外,PR2715E支持液冷散熱方案,通過選用冷板液冷方案,可以有效減少AI大模型算力集群和數據中心的整體碳排放和顯著降低客戶TCO(總體擁有成本)。
寶德四子星服務器PR2745TE
尤其值得一提的是,寶德四子星服務器PR2745TE,在2U 機架中提供多達 4個雙路節點和高容量存儲,使得它1臺服務器就可以支持多達八顆英特爾?至強?CPU Max系列,從而完美支持60B參數下32路推理需求。而且,它在2U規格內提供超常的吞吐量、存儲、網絡、I / O、內存和處理能力,形成一個靈活的平臺,為要求苛刻的AI、高性能和橫向擴展等工作負載提供強勁動力。PR2745TE為簡化部署和維護而設計,并以最高質量組裝,以確保最大容量的連續操作。客戶可以通過它提供的解決方案滿足最具挑戰性的IT 需求,并受益于特殊的總擁有成本(TCO)。 作為業界雙子星/多子星服務器的首創,寶德四子星服務器久經市場考驗,已經幫助AI用戶、數據中心、 高性能計算和云計算環境的客戶獲得了來自數據中心資源的強大競爭優勢,也將是大模型推理應用堅實的算力基礎之一。
相關稿件