基礎架構升級力挺AI 實現落地先解資料瓶頸

2026-04-07
生成式人工智慧(GenAI)與大型語言模型(LLM)的應用日益廣泛,企業正迎來前所未有的數位轉型契機,這股浪潮也對傳統資料中心帶來了嚴峻的考驗。多數企業啟動AI專案,最先投入的往往是模型、算力與GPU伺服器,到了落地階段才發現,拖慢進度的關鍵通常在於資料本身的處理效率。

生成式人工智慧(GenAI)與大型語言模型(LLM)的應用日益廣泛,企業正迎來前所未有的數位轉型契機,這股浪潮也對傳統資料中心帶來了嚴峻的考驗。多數企業啟動AI專案,最先投入的往往是模型、算力與GPU伺服器,到了落地階段才發現,拖慢進度的關鍵通常在於資料本身的處理效率。

當企業各式非結構化內容送進訓練、推論與檢索增強生成(RAG)流程時,資料已不再只是靜態存放在後端,還必須經過搬移、同步、治理、向量化與保護,才能真正成為AI可用資產。過去被視為後端支撐的儲存平台,正快速升高為資料流動、治理與供應效率的核心樞紐。

NetApp台灣技術總監許宏俊表示,AI對資料中心帶來最直接的衝擊,在於整體基礎設施壓力同步放大,尤其電力、機房空間與資料處理效率,已成為企業推進AI時最先碰到的現實限制。他觀察,早年虛擬化曾讓企業資料中心明顯精簡,許多原本分散的工作負載得以集中處理,機房規模與耗電量也因而下降;但AI工作負載的特性剛好相反,高密度GPU運算帶動更高的電力與傳輸需求,資料中心重新面臨擴張壓力,而儲存系統也不再只是容量承載者,還必須確保資料能以足夠效率送入運算流程,否則再強的算力也難以轉化為實際產出。

隨著AI帶動資料中心的電力、空間與資料處理壓力同步上升,儲存扮演的角色已由容量供應者,轉向在成本、效能與資料效率之間取得平衡的基礎平台。許宏俊指出,NetApp長年投入重複資料刪除、資料壓縮等資料減量機制,本質上就是希望在既有硬體條件下提升儲存效率,以減少空間佔用與耗電需求。這類能力在傳統資料中心時代已具價值,到了AI時代更成為企業評估基礎架構投資效益時不可忽視的一環。

資料供應效率牽動AI專案成敗

相較於巨量資料(Big Data)時代較偏重資料集中承載與保存,AI時代的儲存角色已明顯改變。許宏俊表示,企業現在要處理的,已不只是把資料存下來,而是要把資料有效率地送到GPU伺服器、AI平台與RAG流程中。這意味資料不只要保存,還要複製、同步、治理、向量化,甚至要在不同執行環境之間持續流動。也因此,企業面臨的問題不再是容量不夠,而是資料在進入AI流程前,須經歷資料工程作業,任何一段卡住,都可能讓專案延誤甚至失敗。

他特別提到,當資料進入AI使用情境後,重複與膨脹問題會變得更加明顯。企業原本存放在資料湖(Data Lake)的原始資料,往往還要再萃取一份到新的AI儲存環境,用於訓練、推理或知識檢索;若再加上向量化處理,資料量還可能進一步放大。根據他在實務中觀察,資料完成向量化後,空間規模可能來到原始資料的8到10倍。這個數字未必適用所有場景,但它點出一個很關鍵的現象,也就是AI專案的成本壓力,很多時候並非來自模型本身,而是來自資料前處理、資料複本與資料治理流程。

統一資料平台提高擴充與治理彈性

談到企業接下來三年的資料平台設計方向,許宏俊建議,切勿再把資料平台視為單一協定、單一設備或單一專案的附屬元件,而要把它當成可隨應用成長而延展的統一底座。他指出,大型客戶實務上常同時需要三種資料存取模式。其一是網路檔案系統(NFS),適合大量檔案型資料與研發共享場景。其二是iSCSI介面,較適合容器化資料庫與區塊型儲存的工作負載。其三則是物件儲存(Object Storage),也就是產業慣稱的S3相容模式,適合影像、日誌、文件與各式可擴充中繼資料(Metadata)的資料場景。

不過,真正的重點不在於企業是否全面押注某一種協定,而在於是否理解不同工作負載的資料特性。許宏俊以金融與製造情境為例說明,若企業想分析歷史保單、影像檔或產線照片,單靠傳統檔案屬性很難支撐進階分析;但若資料經過中繼資料整理,就能依年齡區間、條件、產線位置、時間序列或品質狀態快速萃取出需要的資料集。這也是物件儲存與AI結合的實用價值。ONTAP已可提供S3物件存取,並支援S3用戶端與既有NAS資料並存使用。

NetApp台灣技術總監許宏俊表示,企業推進AI不能只看GPU算力,資料供應效率、共享架構與治理能力,才是資料中心能否順利支撐AI落地的關鍵。

但他也提醒,物件儲存不是萬靈丹。因為物件模式涉及更多中繼資料處理,其延遲特性與高效能區塊或檔案工作負載不同,若誤把所有資料都往同一種協定塞,最終仍會在應用端碰到效能瓶頸。因此,企業真正需要的,是可在同一資料平台下並存多種協定、並讓資料依熱度與成本自動移動的架構。也正因如此,許宏俊認為,NetApp在AI時代的角色,更接近資料管理平台。以NetApp AI Data Engine(AIDE)為例,這項方案的定位就是把資料探索、整理、同步、治理、即時向量化與語意搜尋整合進同一條AI資料流程,並透過專用的節點協助資料處理與中繼資料管理。

對企業而言,AIDE的意義不只是多一套新工具,而是試圖把原本分散在資料複製、資料目錄、敏感資訊遮罩、向量資料庫與AI平台串接等多個環節的作業整合起來。許宏俊認為,現階段多數AI專案的障礙,不在模型取得,而是資料工程涉及太多不同工具與團隊協作,最終讓專案啟動速度過慢、資料品質不穩,或治理責任無法落實。若能先把資料流程平台化,企業才有機會把概念驗證的AI應用,擴大範疇到更多營運場景。


追蹤我們Featrue us

本站使用cookie及相關技術分析來改善使用者體驗。瞭解更多

我知道了!