> 市場新知

Recurrent Neural Network Apache SystemML DeepLearning4J TensorFlow MapReduce Keras Spark LSTM RNN

人工智慧結合IoT　預警微小異常

2018-01-10

洪羿漣

新興科技正在引領企業發展數位化營運業務，IDC（國際數據資訊）日前最新發布2018年台灣市場的預測報告中指出，預計到2021年，台灣將有超過55%的GDP貢獻來自數位服務產品與技術，其中以人工智慧（AI）、機器人、物聯網在亞太市場的應用占比最高。

IBM Watson IoT首席資料科學家Romeo Kienzler近期來台時接受專訪指出，人工智慧在台灣最具潛力的應用領域，當屬製造業的工業物聯網（IIoT）。他舉例，透過增加生產線感測器的數量與類型取得資料，可藉此提升預測性的維護品質，在機械運作時的不同位置蒐集振動、聲音與溫度資訊，搭配人工智慧演算法實作異常偵測，運用長短期記憶（LSTM）實作，可進行分類與時間序列預測，基於LSTM自動編碼神經網路改善訊號品質。

▲IBM Watson IoT首席資料科學家Romeo Kienzler建議，對於剛入門深度學習領域，可運用TensorFlow與Keras框架，基於較為熟悉的Python語言學習與實作。

「在IBM Watson IoT部門，我負責的是時間序列分析，就經驗上來看，對於任何涉及時間序列資料集（Dataset），例如自然語言、聲音訊號、音頻信號或DNA，皆是採以遞歸神經網路（Recurrent Neural Network，RNN）為主，LSTM即為RNN的一種。」Kienzler說。

近來各界的研究範疇大多集中於自然語言與圖像辨識，因此他特意採用神經網路來進行時間序列分析預測、去除雜訊、分類方法研究，重新實作了異常偵測演算法，可更精準地發現問題並予以優化。他舉例，廠區內的小變異（噪音）產生波動，很快回復正常後往往不會被發現，若運用LSTM即可明顯呈現出差異，讓管理者及早發現產線異常狀態，以便盡快改善。

IBM Watson認知運算平台包含深度學習、高等機器學習、數位訊號處理等多種新技術，可協助解決特定的商業問題。以資料分析的角度看物聯網應用領域，並非為協助處理感測器的部署、通訊、安全性、電力等問題，或許訊號雜訊比（Signal-to-Noise Ratio）才可能是資料科學家須處理的範疇。

全球開放陣營技術社群正快速地發展深度神經網路架構，以實作建立資料運算模型。Kienzler說明，知名的TensorFlow與Apache SystemML屬於低階框架，可被實作在任何的神經網路；基於Java程式語言發展的DeepLearning4J開源專案則為高階框架，可較為直觀、快速地實作。但是對於初學者而言，他則建議採以Keras高階框架，可運用Python語言撰寫，具有模組化、易於擴展等特性，底層再搭配TensorFlow，更適合入門學習。

至於SystemML主要是運行於Spark與MapReduce環境，最初由IBM研究院研發，在2015年貢獻予Apache基金會。Kienzler指出，SystemML目前是提供匯入Caffe模型實作，也正在積極發展支援Keras，因此現階段常見的應用模式，是採用Keras與TensorFlow設計資料原型，再透過匯出與匯入DeepLearning4J或SystemML的方式，在Spark環境中運行靈活擴展。由於Spark的核心並非為線性代數（Linear Algebra）執行引擎，而是以成本為基礎的優化器（Cost-Based Optimizer），搭配SystemML可讓處理資料的運行效能更好。