文:蔣曜宇 / 數位時代記者

近年來越來越多台灣企業開始採用AI技術,然而許多企業卻忽略基礎數據處理的重要性。若水執行長陳潔如認為,AI應該長出產業分工鏈,才能提升 AI 應用的效率。

AI 應用近年來在台灣逐步落地,許多產業也開始思考如何導入AI,進而降低生產成本、增加整體營收。專門提供數據處理與諮詢服務的若水強調,企業對AI的思維轉型,不應只著重於演算法,更要加強檢驗並優化數據的處理。

若水執行長陳潔如表示,大公司的 AI 團隊規劃,對AI的整體發展造成很大的問題。許多老闆認為,錢應該花在演算法上而不是在數據處理上。這使得高端 AI 工程師得花上很大的時間成本處理基本的數據。

「我曾聽過工程師分享,一天工作八小時,他們可能花上五個小時在處理基本數據,只剩三小時來寫演算法。」若水國際執行長陳潔如

陳潔如強調,AI 產業才剛開始發展,所以它很需要長出產業分工鏈。企業高層的思維,應該透過不同階段 AI 工作的專業分工,與擁有專業 AI 數據標註團隊的公司合作,進而有效分配高級工程師的工作內容,把錢花在刀口上。

AI 模型總是跑出「垃圾數據」?最初的數據規則定義是關鍵
要啟動AI應用,首先必須搜集大量數據進行分析。但數據種類繁雜,有優劣之分,把未經處理的資料丟進AI,很容易就會「garbage in, garbage out」,最終也只是徒勞。因此,尋求專業的AI數據處理,為數據進行精準的規則設定,成了一大重點。

所謂的精準數據處理又包含哪些層面?若水事業發展協理簡季婕表示, 在一開始就問對問題,並準確定義數據,是創造成功AI模型的關鍵。

簡季婕說,進行應用時,她會先思考要如何設定篩選標準,才能在最後得到優質、有用的資料。她以若水與日本廠商共同分析橋樑安全度的專案為例,她說,這間廠商希望明確標記出橋樑生鏽的部分,但他們的AI卻把與鐵鏽相似的苔蘚、髒污以及陰影處都一併標記起來,降低數據的準確性。

藉由數據處理的專業分工,若水協助他們找到更準確的數據篩檢方式,定義出鐵鏽的形狀及顏色等特徵,進而得到更精準的成果。「 好的處理方式會加值AI數據的養成, 」簡季婕強調。

搜集的難易度、多元使用情境,數據處理比想像中更繁雜
對許多企業來說,將數據導入AI模型運算時有許多挑戰。其中,如何定義有效數據、並在出狀況時知道要去調整數據或是運算模型,都有一定難度。

簡季婕說,要使用數據訓練AI模型,事前必須經過全面性思考。數據搜集的難易度以及數據使用的多元情境,都需納入考量。以大量運用AI的自駕車產業來說,天氣好的時候路況較單純,標註周遭環境與物件是相對容易的事。然而在雨天,物件就可能變得模糊,AI需要特別進行訓練。

「AI模型的培養是一個循序漸進的過程,」簡季婕說。數據就如同 AI 的土壤,土壤的成分、性質、濕度、含氧量,都需經過精確的設定、調配,才能開花結果。精準的數據標註就如同這個概念,這也是若水所強調的,AI 產業鏈分工的重要性所在。

您想讀什麼?

文章分類

近期文章