人工智慧(AI)快速演進,已明顯改寫企業IT基礎設施的設計邏輯與資源配置方式。自2022年大型語言模型(LLM)與生成式技術邁向實用化以來,無論是大型企業、中型組織,甚至小型團隊,都能將機器學習與生成式應用導入日常營運。技術普及帶來的直接影響,就是資料生成量與資料使用量同步攀升。
群暉(Synology)系統事業群總監許智程表示,AI時代帶來的許多挑戰,其實不是新問題,而是既有資料中心的結構性課題,在AI工作負載與非結構化資料快速膨脹後被全面放大。最直接的改變,在於企業過去對資料生命週期的理解,已經不足以應付新興應用需求。如今資料不再只是被動保存的資產,而是會被模型反覆讀取、比對、重組、引用,甚至成為企業決策與自動化流程的重要依據。
許智程指出,AI帶來的衝擊可從兩個面向理解。其一是AI會持續生成大量新資料,企業如今不只產出文件,也會產出更多摘要、草稿、圖像、音訊、影片與中間成果,資料增速遠高於以往。其二則是既有歷史資料的角色發生改變。原本封存在企業內部的大量檔案,如今可能重新被送入AI系統,作為背景知識、搜尋素材或分析依據。換言之,AI同時提高了資料生成量,也提高了資料再利用率,兩者疊加之後,儲存在企業架構中的角色不再只是容量供應,而是支撐AI應用可用性與治理能力的基礎。
資料孤島放大AI落地阻力
許智程認為,AI時代最先浮現、也最容易被低估的問題,就是資料孤島。過去企業各部門或分公司,本來就可能各自維護檔案伺服器或獨立儲存環境,當時未必構成顯著障礙,因為多數部門僅使用自身資料,跨部門查詢與整合需求有限。但當企業導入AI之後,情況就完全不同。企業會期待AI具有更完整的全域視角,能夠理解跨部門文件、跨據點內容與不同格式的資料來源,進而提供更完整的回答,或支援跨流程分析。
一旦資料分散在不同位置,AI專案首先遇到的障礙必然是資料準備成本過高。許智程表示,現在很多企業在真正讓AI開始工作之前,光是資料蒐集、搬移、整併、權限確認,就已經消耗相當多時間。
另一個被放大的是非結構化資料的重要性。過去企業最在意效能的,主要是交易資料庫或核心業務系統這類結構化資料。相較之下,郵件、辦公文件、日誌等非結構化資料,雖然龐大卻未必長期維持高頻使用。AI出現之後,這類資料卻成為模型理解企業脈絡的重要來源。許智程表示,這意味著原本可能已經趨近於冷資料的內容,如今也可能被重新讀取,而且讀取範圍更廣、頻率更高。
這種轉變讓傳統封存邏輯面臨壓力。過去企業可以把久未使用的資料移往成本較低的儲存層,甚至放入磁帶作長期保存。但若這些資料隨時可能被AI存取,存放位置、回應時間與吞吐量就不能再用舊思維衡量。許智程直言,如今市場談AI儲存,核心就是高頻寬、低延遲與足夠的並行存取能力,因為AI需要的早已不只是把資料存放著,而是能在需要時快速取用。
除了效能之外,高可用性(HA)也被AI重新放大。過去企業談高可用性,多半聚焦在資料庫與核心交易系統,部分封存資料即使損壞,也未必立即造成營運影響。但AI時代不同,因為資料被重新賦予使用價值,任何資料中斷、毀損或無法存取,都可能直接浪費昂貴的AI運算資源,甚至影響模型輸出完整性。
分層架構與平台化成規劃重點
談到產品與架構設計時,許智程表示,群暉目前回應企業AI儲存需求,主要著眼於高效能雙主動架構、資料去重複、自動資料分層,以及平台化管理。以PAS7700為例,其定位為雙主動NVMe全快閃儲存系統,鎖定企業關鍵工作負載需求。對企業而言,這類產品的意義不只是提供更高效能,而是在AI資料存取量持續攀升的情況下,建立可兼顧穩定性、效率與擴充性的底層能力。
不過,許智程也強調,市場上高階NVMe全快閃與雙控制器架構產品並不少見,企業真正面對的現實問題仍是成本。因此,儲存平台不能只談極致效能,也必須考量企業是否能以合理成本取得穩定、高可用且足以支撐AI需求的架構。相較於一味把所有資料都推向最高速儲存層,他更強調分層思維的重要性。
群暉系統事業群總監許智程指出,AI時代的儲存規劃重點,已由單純容量擴充,轉向高可用性、分層架構、資料去重複與平台化管理。
他指出,AI時代不是所有資料都要放在最昂貴的全快閃層,而是要更精準規劃資料流動路徑。企業必須先釐清哪些資料會進入AI運算、何時進入、需要多快被讀取,再決定哪些資料應放在熱資料層,哪些資料適合維持在冷資料層。若系統具備自動分層能力,就能依據實際使用模式,把即將被取用的資料預先拉回高效能層,在成本與效能之間取得更實際的平衡。
除了硬體配置,許智程也建議企業未來採購儲存時,不應只看單一設備規格,而要改以平台化思維評估。原因在於,AI時代下的資料平台不只負責保存,也必須同時涵蓋保護、監控與調查能力。以群暉產品線來看,DiskStation Manager(DSM)定位為整合式作業系統,涵蓋檔案管理、資料保護、使用者管理、系統管理與安全防護等能力,Active Insight則提供集中監控、容量預測、登入活動分析、備份狀態追蹤與異常通知等功能,目的在於讓資料持續流動,並同時具備可治理、可保護與可供AI有效運用的能力。