為生產級 AI 打造安全且具成本效益的基礎架構

VCF 9.1 協助企業以更低的成本、更強的安全性和開放的硬體生態系統,加速 AI 工作負載部署

【台灣,2026年5月6日】專注於設計、開發並提供多樣化半導體及基礎架構軟體解決方案的全球科技領導廠商博通(Broadcom Inc.,NASDAQ:AVGO)今日宣布推出針對生產級(Production)AI 工作負載所設計的 VMware Cloud Foundation(VCF)9.1,提供安全且兼顧成本效益的基礎架構 。VCF 9.1 提供了一個具備 AI 與 Kubernetes 原生特性的私有雲平台,整合了跨 AMD、Intel 與 NVIDIA 的安全性與混合運算基礎架構支援,讓企業能夠以明顯較低的成本、更強的安全性和自由選擇同級最佳 GPU 與 CPU 硬體的彈性,來部署推論(inference)與代理式(agentic) AI 應用。

根據博通《2026年私有雲展望》報告預覽版顯示,私有雲仍是生產級 AI 的首選平台。超過一半(56%)的受訪企業正在或計劃在私有雲上運行生產級推論。更重要的是,用於生產級推論的公有雲使用率僅為41%,較去年同期下降15%。此外,62% 的 IT 主管表示非常或極度擔憂生成式(generative)AI 基礎架構的成本,而且有 36% 的主管表示 AI 正推動對資料保護、隱私、安全控制以及風險管理的新需求。

VMware Cloud Foundation 透過智慧軟體為生產工作負載提供了比公有雲更好的替代方案,可最大限度地提高現有伺服器的基礎架構效率,同時提供生產級 AI 部署所需的架構控制和法規遵循。VMware Cloud Foundation 9.1 讓企業在部署包括推論和代理式 AI 在內的生產級工作負載時能實現以下效益:

  • 透過智慧記憶體分層技術,在運行 AI 和非 AI 混合工作負載的叢集中,最高可降低 40% 的伺服器成本¹;
  • 透過提升 AI 資料管線(data pipelines)的壓縮和重複資料刪除技術,最多可降低 39% 的儲存總擁有成本(TCO)¹;
  • 大規模運行 AI 工作負載時,最多可降低 46% Kubernetes 維運成本¹;
  • 叢集升級速度提升 4 倍,機群容量增加 2 倍,可快速擴充 AI 基礎架構¹。

博通資深副總裁暨 VMware Cloud Foundation 部門總經理 Krish Prasad 表示:「隨著更多的企業轉向 AI 以提升競爭優勢,他們面臨三個關鍵挑戰:資料與 IP 隱私疑慮、急遽攀升的基礎架構成本,以及他們對代理式 AI 時代的準備就緒程度 。VCF 9.1 是解決這三個挑戰並提供最先進私有 AI (Private AI) 基礎架構的單一統一平台 。我們為 AI 實現了零信任(zero-trust )安全,透過智慧基礎架構優化和硬體選擇來降低成本,並提供在同一平台上靈活運行代理式工作流與加速推論的能力 。」

針對 AI 工作負載的大規模高效基礎架構

VCF 9.1 在既有基礎架構上最大化虛擬機(VM)與容器化 AI 工作負載的密度,同時大幅降低維運複雜性 。透過智慧化資源管理與自動化維運,企業可以在現有伺服器上部署更多生產工作負載,在分散式環境中高效拓展,並降低在硬體短缺與成本高漲期間對昂貴基礎架構擴建的需求。主要功能包括:

  • 智慧資源最佳化:可透過先進的記憶體分層與新一代 AI 資料管線儲存壓縮來實現,最大化提高 AI 資料管線的基礎架構利用率,從而在不影響效能或無需昂貴的硬體更新的情況下,實現更高的 AI 工作負載密度。
  • 大規模自動化機群營運:管理能力提升一倍至5,000 台主機,並在分散式與實體隔離(air-gapped)環境中提供快 4 倍的叢集升級速度,在支援 AI 基礎架構快速擴展的同時,也消除手動修補的負擔。
  • 用於AI 隔離的多租戶基礎架構:可使企業和服務供應商能夠在具有嚴格安全邊界狀況下,在共享基礎架構上運行多個 AI 專案和客戶,最大程度地利用昂貴的 GPU 和 CPU 資源,同時支援敏感模型的資料主權。
  • 開放的生態系整合:提供跨 AMD 與 NVIDIA 的多加速器 GPU 選擇,支援主流的 AMD 與 Intel CPU 平台,並可透過 Arista Universal Cloud Network 實現基於標準的 EVPN 和 VXLAN 互通性,展現 VCF 致力於提供生產級 AI 所需的高效連接和運算靈活性的承諾。    
  • AI 工作負載提供高速網路:透過對 NVIDIA ConnectX-7 網路卡和 NVIDIA BlueField-3的強化型 DirectPath I/O功能的支援,實現 AI 工作負載的高速網路連接。這項增強功能可實現高速、多主機 AI 模型訓練和資料傳輸,這對於要求苛刻的生成式AI 工作負載至關重要。
  • 虛擬化負載平衡與安全:透過 VMware Avi Load Balancer2 與 VMware vDefend2虛擬化負載平衡和安全功能,消除了 AI 推論端點和代理式應用程式對硬體設備的需求,進而降低資本支出,並同時提供了企業級韌性和自動化生命週期管理。

高速應用交付:用於 AI、容器與虛擬機的現代化工作負載平台

VCF 9.1 提供一個統一的平台,透過在單一基礎架構層執行推論工作負載、代理式應用程式、容器化服務與傳統虛擬機,加速 AI 應用部署,進而消除維運分散和管理獨立堆疊的成本,同時提供了生產級 AI 所需的開發速度和平台治理。主要功能包括:

  • 專為 AI 打造的 Kubernetes 規模和效能,與預覽版相比¹,叢集規模提高了 2.6 倍,部署速度加快了 70%,升級時間縮短了 75%,並可實現無縫擴展,進而為生產級 AI 服務實現了零停機時間。
  • 混合運算管理,可在統一平台上高效處理 CPU 密集型代理式 AI 工作流程與 GPU 加速推論,有效解決代理式工作負載在工作流程執行和決策編排時,對 CPU 的需求遠高於 GPU 的現實問題。
  • AI 可觀測性和治理功能,可提供詳細的指標,包括首次 token 獲取時間、token 吞吐量以及跨多種加速器類型的 GPU 利用率,使企業能夠透過精確的硬體利用率監控來最大化基礎架構投資報酬率;同時,集中式策略注入和資料主權控制功能可確保 AI 合規性執行和安全的模型存取。
  • 即時應用程式堆疊藍圖:可將多虛擬機應用程式封裝為可重複使用模板,從而實現環境的快速部署,這不僅消除了手動配置的錯誤,防止開發、測試和生產環境之間的配置漂移,同時加快了基礎架構的交付速度。

針對 AI 資料主權與治理的零信任架構

VCF 9.1 在基礎架構層整合安全機制,從虛擬機管理程式(hypervisor)到應用程式,全面保護 AI 工作負載、專有模型和訓練資料。 透過提供零信任分段、主權復原和無須額外工具的持續修補功能,VCF 強化了生產級 AI 部署所需的安全性,這是公有雲環境無法比擬的。主要功能包括:

  • 地端勒索軟體復原,可提供隔離的復原環境與整合的驗證工具,包括新增對 CrowdStrike Falcon® Endpoint Security 的支援,這可保護 AI 模型和訓練資料等重要的智慧財產,免受跨境移動的影響,同時避免在危機復原期間產生巨額頻寬費用。
  • 持續合規執行2,是透過對工作負載和 VCF 堆疊組件進行集中監控和自動化預期狀態修復,確保符合監管要求,使企業在無需人工干預或額外使用合規工具的情況下,即可證明生產級AI 部署已做好稽核準備。
  • 零停機時間即時修補功能,可支援高達 80% 的使用場景無需主機遷移或維護窗口,這消除了對生產級 AI 推論服務與代理式應用程式的干擾,確保這些需要持續可用性的服務能滿足服務等級協定的要求1
  • 零信任橫向安全2首次將分散式 IDS/IPS 保護擴展到 Kubernetes AI 工作負載,為分散式推論提供高達 9 Tbps 的威脅檢測效能,並為私有雲和網路應用程式提升了 5 倍的應用程式辨識能力¹。
  • 透過自動化實現自助式安全2可提供集中式標記、預先定義安全設定檔、委派防火牆配置和入口網頁應用程式安全,使企業和服務供應商能夠在不增加操作複雜性或使用碎片化安全工具鏈的情況下安全的部署 AI。

客戶與合作夥伴證言

Systems for Malayala Manorama Co Ltd. 資深總經理 V V Jacob 表示:「在公有雲上分析多年的新聞存檔成本高昂,且價格難以預測,這使得 AI 專案難以規劃。透過在我們既有的 VMware Cloud Foundation 基礎架構上部署 VCF Private AI Services,就可直接在私有雲上運行 AI 驅動的內容摘要、標題生成和編輯輔助功能。 我們相信這將為我們提供保護編輯來源所需的隱私和安全保障,同時還能提供地端私有雲基礎架構所具備的成本可預測性。」

Notruf Niederösterreich 技術主管 Alexander Hopfgartner 表示:「透過在 VMware Cloud Foundation 上統一管理我們的虛擬機與容器,我們提高了營運效率並提升了整體可用性。 VMware vSphere Kubernetes Service 作為 VCF 內建的 Kubernetes 運行時,可讓我們的維運團隊輕鬆部署、擴展和管理我們最重要的應用程式。」

AMD 運算與企業 AI 副總裁 Kumaran Siva 表示:「隨著企業將 AI 從實驗階段推至生產環境,他們需要能夠在廣大的生態系中大規模地提供高效能、高效率和高靈活性的基礎架構。AMD 企業級 AI 解決方案可整合 VMware Cloud Foundation 9.1,實現可擴展、高性價比的 AI 工作負載,協助客戶部署推論和代理式 AI,以滿足生產環境所需的效能表現、安全性和資料主權要求。」

Arista Networks EOS 軟體和服務副總裁暨總經理 Jeff Raymond 表示:「Arista Networks 和博通都秉持著對開放、基於標準的網路架構的根本承諾,為企業在生產級 AI 基礎架構方面提供真正的架構自由和選擇。Arista Universal Cloud Network 與 VMware Cloud Foundation 9.1 之間的 EVPN 和 VXLAN 互通性,能夠提供生產級 AI 所需的開放性和高效能表現。透過基於標準的 ESX-to-fabric 直接連接,企業可建構具擴展性的 AI 基礎架構的網路架構,同時降低資本支出和營運成本。」

CrowdStrike全球雲端和技術聯盟合作夥伴副總裁Chris Stewart表示:「AI 工作負載如今已成為主要攻擊目標,而未經驗證的復原是企業無法承受的風險。透過CrowdStrike與VMware Cloud Foundation 的整合,企業可以更快地阻斷攻擊,在復原之前驗證環境是否真正乾淨,並防止再次感染,這對於保護高價值模型和資料至關重要,同時也能確保對主權和合規性的全面掌控。」

Intel 美洲區銷售企業副總裁 Caitlin Anderson 表示:「VMware Cloud Foundation 9.1 針對 Intel® Xeon® 6 處理器進行了進一步優化,充分釋放了高密度、AI 就緒平台的全部潛力。透過原生整合 Intel® QuickAssist 技術,不僅能加速加密的 vMotion 遷移,同時還能釋放寶貴的運算資源 。我們將繼續攜手合作,致力於提供優異整體擁有成本的創新技術,協助客戶加速其 AI 和容器現代化轉型之旅 。」

NVIDIA 企業軟體副總裁 John Fanelli 表示:「企業需要能在維持資料主權與控制權的同時,提供突破性 AI 效能的基礎架構。我們與博通的合作,將 NVIDIA Blackwell 架構(包括配備 BlueField-3 的 RTX Pro 伺服器與 NVIDIA Blackwell HGX 平台)以及高速 DirectPath I/O 技術引進 VMware Cloud Foundation。這讓組織能夠以他們對公有雲所期望的相同效能來部署私有 AI ,並對其模型與資料擁有完全的掌控。這次合作應對了生產級 AI 的現實需求:既要有卓越的算力,也要有企業級的治理。」

其他資源

註1- 基於博通內部估算或測試的結果,可能會有所變更。 2026年4月。

註2- VCF進階服務需另行購買。

###

關於博通

博通(Broadcom Inc.,Nasdaq:AVGO)是全球科技領導廠商,致力於為全球組織的複雜、關鍵任務需求設計、開發並提供半導體及基礎架構軟體解決方案,並結合長期的研發投資與卓越的執行力,提供規模化的優異技術。博通是一家美國德拉瓦州的企業,總部位於美國加州帕羅奧圖(Palo Alto)。瞭解更多博通的訊息,請瀏覽 www.broadcom.com

Broadcom、脈衝商標和 Connecting Everything Broadcom 的商標。「Broadcom」是指 Broadcom Inc. /或其子公司,其他商標均屬於其各自所有者的財產。