Edge成企業AI代理主流　數位員工系統商機浮現

2026-06-24

韓揚銘

Gartner預測，2026年底將有40%的企業應用導入AI Agent，相較2025年不到5%的水準，一年之內成長八倍。AI Agent不再是少數大公司的專屬技術，也會漸漸成為一般企業的基礎AI架構中的標配。

根據Gartner的預測，2026年底有40%的企業應用將導入AI Agent，相較2025年不到5%的水準，一年之內成長八倍。在這樣的趨勢背後的邏輯是，AI Agent不再是少數大公司的專屬技術，也漸漸會成為一般企業的基礎AI架構中的標配。

對此，在硬體層面上看到，年初CES大展時，許多家廠商主打各種以NVIDIA GB10的私有雲方案做結合，表示若有合適的模型，便可於自家進行安裝和部署使用AI Agent。

從Cloud到Edge自主，AI部署邏輯正在遷移

除了調研機構的預測數字，Google於2026年4月正式發布Gemma 4模型方案，全面改以Apache 2.0授權的方式釋出，並為邊緣裝置設計提供了四款模型，分別是E2B、E4B，以及26B MoE與31B Dense。並且，在Gemma 4發展不久後，中國大陸的Qwen 3.6也相繼推出。而Qwen 3.6-35B-A3B的SWE-bench表現，特別在程式編碼上更是超過Gemma 4.0。

對此小模型表現，指向同一個新的產業變化，就是企業AI策略已從「選擇一個最強的雲端LLM」，開始轉向「挑選最適合自身場景的開源SLM小型語言模型，並開始實現Edge端部署」。

開源模型小型化成熟，企業選擇多模型落地執行

過去兩年產業普遍認為「參數規模決定能力上限」，但2026年的技術正在打破這個想法。隨著各種模型蒸餾、量化壓縮、剪枝技術的成熟，讓模型能以4至8倍壓縮比部署但精度僅微幅損失，使得SLM的概念從研究走向產品化。Gemma 4正是此一趨勢的指標，運用Gemma 4的模型完全可部署於手機、Raspberry Pi、NVIDIA Jetson Orin Nano等裝置，使得大型的LLM不見得就是適合企業的應用場景，藉由SLM的部署，Edge AI生態將進入多家競逐的成長期。

模型跑得動只是第一步，促發產業應用的關鍵之一是授權條款的全面鬆綁。過去Google Gemma採用自己的Gemma條款（Gemma Terms of Use），由於採用自訂授權而非Open Source Initiative（OSI）認可的標準協議，在法律定義上不被視為純粹的開源系列。然而，此次Gemma 4改採Apache 2.0，被視為一項重大變革，這意味著它提供了完全的商業彈性，允許開發者更自由地修改、分發與進行商業化應用。

因此，當企業使用各種Apache 2.0授權的模型時，可透過不同模型功能及專長，彈性調用最合適的模型，藉此避免模型被雲端公司限制，又或是被雲端模型公司強迫升級的情況。

並且，在資安上，開源模型Edge部署還解決了長期困擾的資料主權問題。當模型部署在企業自有伺服器、私有雲甚至邊緣裝置，敏感資料無須上傳第三方雲端，ISO 27001、個資法、歐盟GDPR的合規壓力明顯緩解；對於受金管會、衛福部嚴格監管的金融與醫療產業而言，這使原本受限於合規與資安要求，不敢使用LLM的產業，逐步有機會在自有設備與機房中落地部署AI。

不只Edge AI，還要轉變為Edge AI Agent來創造經濟價值

過去LLM大多仍停留在單輪推論的使用模式，然而AI Agent概念導入後，AI Agent可進一步使用工具，並具備反思與目標導向等特性，以此讓AI Agent獲得新一波殺手級應用的可能。

然而，企業AI Agent難以規模化的最大阻礙，並非技術能力，而是推論成本。當Agent必須每一步驟都呼叫雲端LLM API時，一次完整的多步驟任務（規劃、查詢、判斷、執行、驗證）可能產生數十次API呼叫，對於7×24小時運行的企業級Agent，每月推論帳單動輒數十萬元，即使使用較便宜的模型，企業仍須時時留意token用量，使得許多創新應用停留在想法或是PoC階段。對此，Edge AI加上開源小模型使得Edge AI Agent成真，當企業能在自家伺服器或Jetson等邊緣裝置上部署具Agent能力的模型，推論成本從「每token計費」變成「一次性硬體投資加電費」的情況，讓AI Agent在使用上可以實現7×24的推論，並且可解決資安與隱私疑慮等問題，以此具備「全天候、全流程、無限次呼叫」的可行性。

這不只是省錢，更是有可能創造新產值。OpenAI有一項著名的評測叫「GDPval」，以真實工作產出為基準，涵蓋法律文書、工程藍圖、客服對話、護理計畫等1,320項專業任務，每項任務由平均14年以上資歷的專家設計與驗證，單項任務人類專家平均耗時7至9小時，價值約400美元。會有這種評測主因在於LLM的能力已經不只是單純做上知天文、下知地理的知識性回答，而開始帶有「做事」的能力，也就是從原本的IQ（Intelligence Quotient）轉向AQ（Action Quotient）。這表示LLM的訓練也開始加上各種白領工作上的技術訓練，像是資料彙整、行程安排、財務分析等等。

當前小模型已具備實用能力，足可運行於無人車、機器人等邊緣裝置。圖為NVIDIA主攻機器人應用的Jetson Thor模組。（資料來源：NVIDIA）

而2025年10月所出的研究中，指出隨著模型能力的成長，在GDPval上的表現隨時間呈線性提升，目前最新的模型在交付品質上已接近業界專家。這項評測揭示的核心訊息是AI Agent的產出品質已經不是瓶頸，能夠在保密合規的情況下做到規模化部署才是，而走向Edge AI Agent的導入，將會是解開這道規模化瓶頸的鑰匙。當推論成本趨近於零，企業可以將AI Agent部署到過去「不值得派人處理」的工作環節中，讓原本要花費人力去處理的作業流程轉化為可量化的經濟產出。

換言之，AI Agent創造GDP的前提，需要的是運用Edge裝置和各種開源的模型，來讓部署成本夠低、場景覆蓋夠廣，如此才可達到數位員工的目的。

從算力提供走向「數位員工」解決方案輸出者

台灣在這波Edge AI與開源SLM浪潮中，具備一個全球少有的特殊結構組合。我國在硬體製造規模、伺服器與邊緣運算供應鏈完整性、與NVIDIA、AMD、Intel的緊密合作關係，再加上長年深耕製造、醫療、零售等垂直產業的系統整合經驗。若這樣的優勢組合最終僅停留在硬體銷售，軟體仍仰賴外部解決方案，便等於低估了台灣在此波產業變革中的戰略位置。在這樣的情況下，我們可否反思台灣是否有條件成為全球Edge AI Agent解決方案的關鍵輸出者，從「賣設備」升級為「賣數位員工」。

所謂「賣數位員工」是將Edge AI Agent以整合方案的形式交付給企業，一台預裝各種符合規格的開源SLM邊緣裝置，搭配已預先設計完成、能執行專屬場景任務的AI Agent，企業開箱即可部署一位不下班、不需雲端、資料不出公司的數位同仁。藉此硬體業者的轉型方向，是從「單機出貨」升級為「硬體加開源模型加垂直場景AI Agent」的整合方案，由原本提供運算力，轉變成為提供數位勞動力。如此走向新的軟硬整合，在Edge AI的時代下，重新掌握Edge AI Agent所帶來的商機。

＜本文作者：韓揚銘現任資策會MIC主任，專業於人工智慧與智慧製造產業研究，關注發展技術趨勢、應用與大廠策略研究。具十年以上產業與智庫研究經驗。曾任緯創資通資深產品/技術經理，國立中央大學、銘傳大學、醒吾科技大學兼任講師。資策會產業情報研究所（MIC）長期觀測高科技產業市場情報與發展趨勢，是臺灣資通訊產業與政府倚重的專業智庫。＞