在生成式人工智慧(GenAI)加速普及後,人機互動介面正逐步由鍵盤與螢幕,延伸至以語音與視覺為核心的自然互動模式。隨著企業級應用逐漸成熟,消費端市場也開始出現新的需求輪廓,不再只追求即時回應與資訊取得,而是期待能長期互動、具備情境理解能力,甚至能提供情緒支持的智慧體驗。
創意點子(BRAVO iDEAS)創辦人暨執行長陸意志指出,GenAI在企業辦公室場景中的導入速度相當快速,但若要真正融入日常生活,特別是兒童陪伴與家庭互動場景,技術設計思維勢必需要轉向。為了讓玩具能夠忠實呈現IP角色的性格、記憶與世界觀,創意點子並未採用直接串接通用模型API的方式,而是選擇自行開發具備高度封閉特性的「人設型語言模型」。陸意志說明,這項技術的核心概念是,在演算法層級建立明確的行為限制機制,透過嚴格的資料餵養(Data Feeding)策略,僅將特定角色相關的劇本、電影台詞與世界觀設定納入訓練範圍,避免模型生成超出角色認知邊界的內容。
他進一步指出,打造具備「靈魂感」的AI,關鍵在於高品質的領域資料。創意點子的技術平台支援將特定IP的劇本、電影對白及角色設定集轉化為訓練語料,透過監督式微調與人類回饋強化學習(RLHF)等方法,讓模型逐步內化角色的思考邏輯與語言風格。在與知名娛樂體驗品牌野獸國(Beast Kingdom)的技術驗證合作中,雙方即聚焦於如何將這套「AI大腦」嵌入實體玩具載具,使原本靜態的展示型產品,轉化為能夠記憶互動歷程、並隨使用者關係演進的智慧載體。這類具備長期記憶與互動累積能力的架構,使AI得以在多輪對話中逐步建立對使用者的理解,進而提供個人化的情緒價值,這是傳統功能型玩具難以達成的技術門檻。
在硬體運算架構方面,陸意志說明,考量目前邊緣裝置的算力仍難以支撐大規模模型推論,系統將核心推理引擎部署於雲端,利用高效能運算資源處理約40億參數等級的模型推論,而終端晶片則專注於語音訊號的採集、降噪與機電控制。
創意點子創辦人暨執行長陸意志表示,人設型語言模型透過嚴格資料邊界與低延遲架構設計,讓AI玩具兼顧情感互動深度與內容治理需求,逐步拓展陪伴型應用的實務可行性。
為了因應雲端架構不可避免的網路傳輸延遲問題,創意點子進一步導入其在直播電商領域累積多年的低延遲傳輸技術。陸意志表示,直播系統對封包即時性的要求極高,團隊將相關傳輸協定與優化經驗應用於AI語音資料的處理流程中,大幅降低來回傳輸的時間耗損,使終端裝置在穩定聯網狀態下,仍能提供接近即時且自然的對話體驗。