Gartner預測,2026年底將有40%的企業應用導入AI Agent,相較2025年不到5%的水準,一年之內成長八倍。AI Agent不再是少數大公司的專屬技術,也會漸漸成為一般企業的基礎AI架構中的標配。
根據Gartner的預測,2026年底有40%的企業應用將導入AI Agent,相較2025年不到5%的水準,一年之內成長八倍。在這樣的趨勢背後的邏輯是,AI Agent不再是少數大公司的專屬技術,也漸漸會成為一般企業的基礎AI架構中的標配。
對此,在硬體層面上看到,年初CES大展時,許多家廠商主打各種以NVIDIA GB10的私有雲方案做結合,表示若有合適的模型,便可於自家進行安裝和部署使用AI Agent。
從Cloud到Edge自主,AI部署邏輯正在遷移
除了調研機構的預測數字,Google於2026年4月正式發布Gemma 4模型方案,全面改以Apache 2.0授權的方式釋出,並為邊緣裝置設計提供了四款模型,分別是E2B、E4B,以及26B MoE與31B Dense。並且,在Gemma 4發展不久後,中國大陸的Qwen 3.6也相繼推出。而Qwen 3.6-35B-A3B的SWE-bench表現,特別在程式編碼上更是超過Gemma 4.0。
對此小模型表現,指向同一個新的產業變化,就是企業AI策略已從「選擇一個最強的雲端LLM」,開始轉向「挑選最適合自身場景的開源SLM小型語言模型,並開始實現Edge端部署」。
開源模型小型化成熟,企業選擇多模型落地執行
過去兩年產業普遍認為「參數規模決定能力上限」,但2026年的技術正在打破這個想法。隨著各種模型蒸餾、量化壓縮、剪枝技術的成熟,讓模型能以4至8倍壓縮比部署但精度僅微幅損失,使得SLM的概念從研究走向產品化。Gemma 4正是此一趨勢的指標,運用Gemma 4的模型完全可部署於手機、Raspberry Pi、NVIDIA Jetson Orin Nano等裝置,使得大型的LLM不見得就是適合企業的應用場景,藉由SLM的部署,Edge AI生態將進入多家競逐的成長期。
模型跑得動只是第一步,促發產業應用的關鍵之一是授權條款的全面鬆綁。過去Google Gemma採用自己的Gemma條款(Gemma Terms of Use),由於採用自訂授權而非Open Source Initiative(OSI)認可的標準協議,在法律定義上不被視為純粹的開源系列。然而,此次Gemma 4改採Apache 2.0,被視為一項重大變革,這意味著它提供了完全的商業彈性,允許開發者更自由地修改、分發與進行商業化應用。
因此,當企業使用各種Apache 2.0授權的模型時,可透過不同模型功能及專長,彈性調用最合適的模型,藉此避免模型被雲端公司限制,又或是被雲端模型公司強迫升級的情況。
並且,在資安上,開源模型Edge部署還解決了長期困擾的資料主權問題。當模型部署在企業自有伺服器、私有雲甚至邊緣裝置,敏感資料無須上傳第三方雲端,ISO 27001、個資法、歐盟GDPR的合規壓力明顯緩解;對於受金管會、衛福部嚴格監管的金融與醫療產業而言,這使原本受限於合規與資安要求,不敢使用LLM的產業,逐步有機會在自有設備與機房中落地部署AI。
不只Edge AI,還要轉變為Edge AI Agent來創造經濟價值
過去LLM大多仍停留在單輪推論的使用模式,然而AI Agent概念導入後,AI Agent可進一步使用工具,並具備反思與目標導向等特性,以此讓AI Agent獲得新一波殺手級應用的可能。
然而,企業AI Agent難以規模化的最大阻礙,並非技術能力,而是推論成本。當Agent必須每一步驟都呼叫雲端LLM API時,一次完整的多步驟任務(規劃、查詢、判斷、執行、驗證)可能產生數十次API呼叫,對於7×24小時運行的企業級Agent,每月推論帳單動輒數十萬元,即使使用較便宜的模型,企業仍須時時留意token用量,使得許多創新應用停留在想法或是PoC階段。 對此,Edge AI加上開源小模型使得Edge AI Agent成真,當企業能在自家伺服器或Jetson等邊緣裝置上部署具Agent能力的模型,推論成本從「每token計費」變成「一次性硬體投資加電費」的情況,讓AI Agent在使用上可以實現7×24的推論,並且可解決資安與隱私疑慮等問題,以此具備「全天候、全流程、無限次呼叫」的可行性。
這不只是省錢,更是有可能創造新產值。OpenAI有一項著名的評測叫「GDPval」,以真實工作產出為基準,涵蓋法律文書、工程藍圖、客服對話、護理計畫等1,320項專業任務,每項任務由平均14年以上資歷的專家設計與驗證,單項任務人類專家平均耗時7至9小時,價值約400美元。會有這種評測主因在於LLM的能力已經不只是單純做上知天文、下知地理的知識性回答,而開始帶有「做事」的能力,也就是從原本的IQ(Intelligence Quotient)轉向AQ(Action Quotient)。這表示LLM的訓練也開始加上各種白領工作上的技術訓練,像是資料彙整、行程安排、財務分析等等。
當前小模型已具備實用能力,足可運行於無人車、機器人等邊緣裝置。圖為NVIDIA主攻機器人應用的Jetson Thor模組。(資料來源:NVIDIA)
而2025年10月所出的研究中,指出隨著模型能力的成長,在GDPval上的表現隨時間呈線性提升,目前最新的模型在交付品質上已接近業界專家。這項評測揭示的核心訊息是AI Agent的產出品質已經不是瓶頸,能夠在保密合規的情況下做到規模化部署才是,而走向Edge AI Agent的導入,將會是解開這道規模化瓶頸的鑰匙。當推論成本趨近於零,企業可以將AI Agent部署到過去「不值得派人處理」的工作環節中,讓原本要花費人力去處理的作業流程轉化為可量化的經濟產出。
換言之,AI Agent創造GDP的前提,需要的是運用Edge裝置和各種開源的模型,來讓部署成本夠低、場景覆蓋夠廣,如此才可達到數位員工的目的。
從算力提供走向「數位員工」解決方案輸出者
台灣在這波Edge AI與開源SLM浪潮中,具備一個全球少有的特殊結構組合。我國在硬體製造規模、伺服器與邊緣運算供應鏈完整性、與NVIDIA、AMD、Intel的緊密合作關係,再加上長年深耕製造、醫療、零售等垂直產業的系統整合經驗。若這樣的優勢組合最終僅停留在硬體銷售,軟體仍仰賴外部解決方案,便等於低估了台灣在此波產業變革中的戰略位置。在這樣的情況下,我們可否反思台灣是否有條件成為全球Edge AI Agent解決方案的關鍵輸出者,從「賣設備」升級為「賣數位員工」。
所謂「賣數位員工」是將Edge AI Agent以整合方案的形式交付給企業,一台預裝各種符合規格的開源SLM邊緣裝置,搭配已預先設計完成、能執行專屬場景任務的AI Agent,企業開箱即可部署一位不下班、不需雲端、資料不出公司的數位同仁。藉此硬體業者的轉型方向,是從「單機出貨」升級為「硬體加開源模型加垂直場景AI Agent」的整合方案,由原本提供運算力,轉變成為提供數位勞動力。如此走向新的軟硬整合,在Edge AI的時代下,重新掌握Edge AI Agent所帶來的商機。
<本文作者:韓揚銘現任資策會MIC主任,專業於人工智慧與智慧製造產業研究,關注發展技術趨勢、應用與大廠策略研究。具十年以上產業與智庫研究經驗。曾任緯創資通資深產品/技術經理,國立中央大學、銘傳大學、醒吾科技大學兼任講師。資策會產業情報研究所(MIC)長期觀測高科技產業市場情報與發展趨勢,是臺灣資通訊產業與政府倚重的專業智庫。>