基礎架構升級力挺AI　實現落地先解資料瓶頸

2026-04-07

洪羿漣

生成式人工智慧（GenAI）與大型語言模型（LLM）的應用日益廣泛，企業正迎來前所未有的數位轉型契機，這股浪潮也對傳統資料中心帶來了嚴峻的考驗。多數企業啟動AI專案，最先投入的往往是模型、算力與GPU伺服器，到了落地階段才發現，拖慢進度的關鍵通常在於資料本身的處理效率。

當企業各式非結構化內容送進訓練、推論與檢索增強生成（RAG）流程時，資料已不再只是靜態存放在後端，還必須經過搬移、同步、治理、向量化與保護，才能真正成為AI可用資產。過去被視為後端支撐的儲存平台，正快速升高為資料流動、治理與供應效率的核心樞紐。

NetApp台灣技術總監許宏俊表示，AI對資料中心帶來最直接的衝擊，在於整體基礎設施壓力同步放大，尤其電力、機房空間與資料處理效率，已成為企業推進AI時最先碰到的現實限制。他觀察，早年虛擬化曾讓企業資料中心明顯精簡，許多原本分散的工作負載得以集中處理，機房規模與耗電量也因而下降；但AI工作負載的特性剛好相反，高密度GPU運算帶動更高的電力與傳輸需求，資料中心重新面臨擴張壓力，而儲存系統也不再只是容量承載者，還必須確保資料能以足夠效率送入運算流程，否則再強的算力也難以轉化為實際產出。

隨著AI帶動資料中心的電力、空間與資料處理壓力同步上升，儲存扮演的角色已由容量供應者，轉向在成本、效能與資料效率之間取得平衡的基礎平台。許宏俊指出，NetApp長年投入重複資料刪除、資料壓縮等資料減量機制，本質上就是希望在既有硬體條件下提升儲存效率，以減少空間佔用與耗電需求。這類能力在傳統資料中心時代已具價值，到了AI時代更成為企業評估基礎架構投資效益時不可忽視的一環。

資料供應效率牽動AI專案成敗

相較於巨量資料（Big Data）時代較偏重資料集中承載與保存，AI時代的儲存角色已明顯改變。許宏俊表示，企業現在要處理的，已不只是把資料存下來，而是要把資料有效率地送到GPU伺服器、AI平台與RAG流程中。這意味資料不只要保存，還要複製、同步、治理、向量化，甚至要在不同執行環境之間持續流動。也因此，企業面臨的問題不再是容量不夠，而是資料在進入AI流程前，須經歷資料工程作業，任何一段卡住，都可能讓專案延誤甚至失敗。

他特別提到，當資料進入AI使用情境後，重複與膨脹問題會變得更加明顯。企業原本存放在資料湖（Data Lake）的原始資料，往往還要再萃取一份到新的AI儲存環境，用於訓練、推理或知識檢索；若再加上向量化處理，資料量還可能進一步放大。根據他在實務中觀察，資料完成向量化後，空間規模可能來到原始資料的8到10倍。這個數字未必適用所有場景，但它點出一個很關鍵的現象，也就是AI專案的成本壓力，很多時候並非來自模型本身，而是來自資料前處理、資料複本與資料治理流程。

統一資料平台提高擴充與治理彈性

談到企業接下來三年的資料平台設計方向，許宏俊建議，切勿再把資料平台視為單一協定、單一設備或單一專案的附屬元件，而要把它當成可隨應用成長而延展的統一底座。他指出，大型客戶實務上常同時需要三種資料存取模式。其一是網路檔案系統（NFS），適合大量檔案型資料與研發共享場景。其二是iSCSI介面，較適合容器化資料庫與區塊型儲存的工作負載。其三則是物件儲存（Object Storage），也就是產業慣稱的S3相容模式，適合影像、日誌、文件與各式可擴充中繼資料（Metadata）的資料場景。

不過，真正的重點不在於企業是否全面押注某一種協定，而在於是否理解不同工作負載的資料特性。許宏俊以金融與製造情境為例說明，若企業想分析歷史保單、影像檔或產線照片，單靠傳統檔案屬性很難支撐進階分析；但若資料經過中繼資料整理，就能依年齡區間、條件、產線位置、時間序列或品質狀態快速萃取出需要的資料集。這也是物件儲存與AI結合的實用價值。ONTAP已可提供S3物件存取，並支援S3用戶端與既有NAS資料並存使用。

NetApp台灣技術總監許宏俊表示，企業推進AI不能只看GPU算力，資料供應效率、共享架構與治理能力，才是資料中心能否順利支撐AI落地的關鍵。

但他也提醒，物件儲存不是萬靈丹。因為物件模式涉及更多中繼資料處理，其延遲特性與高效能區塊或檔案工作負載不同，若誤把所有資料都往同一種協定塞，最終仍會在應用端碰到效能瓶頸。因此，企業真正需要的，是可在同一資料平台下並存多種協定、並讓資料依熱度與成本自動移動的架構。也正因如此，許宏俊認為，NetApp在AI時代的角色，更接近資料管理平台。以NetApp AI Data Engine（AIDE）為例，這項方案的定位就是把資料探索、整理、同步、治理、即時向量化與語意搜尋整合進同一條AI資料流程，並透過專用的節點協助資料處理與中繼資料管理。

對企業而言，AIDE的意義不只是多一套新工具，而是試圖把原本分散在資料複製、資料目錄、敏感資訊遮罩、向量資料庫與AI平台串接等多個環節的作業整合起來。許宏俊認為，現階段多數AI專案的障礙，不在模型取得，而是資料工程涉及太多不同工具與團隊協作，最終讓專案啟動速度過慢、資料品質不穩，或治理責任無法落實。若能先把資料流程平台化，企業才有機會把概念驗證的AI應用，擴大範疇到更多營運場景。