文／蔣曜宇,　數位時代記者

近年來越來越多台灣企業開始採用 AI 技術，然而許多企業卻忽略基礎數據處理的重要性。若水FLOW 執行長陳潔如認為，AI 應該長出產業分工鏈，才能提升 AI 應用的效率。

AI 應用近年來在台灣逐步落地，許多產業也開始思考如何導入AI，進而降低生產成本、增加整體營收。專門提供數據處理與諮詢服務的若水強調，企業對AI的思維轉型，不應只著重於演算法，更要加強檢驗並優化數據的處理。

若水執行長陳潔如表示，大公司的 AI 團隊規劃，對AI的整體發展造成很大的問題。許多老闆認為，錢應該花在演算法上而不是在數據處理上。這使得高端 AI 工程師得花上很大的時間成本處理基本的數據。

「我曾聽過工程師分享，一天工作八小時，他們可能花上五個小時在處理基本數據，只剩三小時來寫演算法」若水國際執行長陳潔如道。

陳潔如強調，AI 產業才剛開始發展，所以它很需要長出產業分工鏈。企業高層的思維，應該透過不同階段 AI 工作的專業分工，與擁有專業 AI 數據標註團隊的公司合作，進而有效分配高級工程師的工作內容，把錢花在刀口上。

AI 模型總是跑出「垃圾數據」？最初的數據規則定義是關鍵

要啟動AI應用，首先必須搜集大量數據進行分析。但數據種類繁雜，有優劣之分，把未經處理的資料丟進AI，很容易就會「garbage in, garbage out」，最終也只是徒勞。因此，尋求專業的 AI 數據處理，為數據進行精準的規則設定，成了一大重點。

所謂的精準數據處理又包含哪些層面？若水事業發展協理簡季婕表示：

在一開始就問對問題，並準確定義數據，是創造成功 AI 模型的關鍵。

簡季婕說，進行應用時，她會先思考要如何設定篩選標準，才能在最後得到優質、有用的資料。她以若水與日本廠商共同分析橋樑安全度的專案為例，她說，這間廠商希望明確標記出橋樑生鏽的部分，但他們的 AI 卻把與鐵鏽相似的苔蘚、髒污以及陰影處都一併標記起來，降低數據的準確性。

藉由數據處理的專業分工，若水協助他們找到更準確的數據篩檢方式，定義出鐵鏽的形狀及顏色等特徵，進而得到更精準的成果。

「好的處理方式會加值 AI 數據的養成」簡季婕強調。

搜集的難易度、多元使用情境，數據處理比想像中更繁雜

對許多企業來說，將數據導入 AI 模型運算時有許多挑戰。其中，如何定義有效數據、並在出狀況時知道要去調整數據或是運算模型，都有一定難度。

簡季婕說，要使用數據訓練 AI 模型，事前必須經過全面性思考。數據搜集的難易度以及數據使用的多元情境，都需納入考量。以大量運用 AI 的自駕車產業來說，天氣好的時候路況較單純，標註周遭環境與物件是相對容易的事。然而在雨天，物件就可能變得模糊，AI需要特別進行訓練。

「AI 模型的培養是一個循序漸進的過程」簡季婕說。

數據就如同 AI 的土壤，土壤的成分、性質、濕度、含氧量，都需經過精確的設定、調配，才能開花結果。精準的數據標註就如同這個概念，這也是若水所強調的，AI 產業鏈分工的重要性所在。