圖片來源 : 若水 Flow

台灣最精準AI數據處理平台,如何透過UX用戶回饋持續優化?

文/ 若水 Flow AI Blog 編輯團隊

在機器學習 (Machine Learning) 的產業日常,若水 AI 數據標註團隊幾乎都用自己開發的標註平台、 數據標註工具 ( AI Data Annotation Tool) ,完成客戶交付的任務。

從 0 到 1,經歷了許多跌跌撞撞。從原本一個單一的 AI 數據處理平台,發展到至今,能處理各式各樣標註數據需求,像是 Bounding Box、Polygon、Polyline、Category、Key Point、Pixel-Wise ,就像是小時候常玩的「小畫家」。

常碰到有人問,若水為什麼不用已經開發出來的就好,還要投入這麼多心力與時間重新建置平台?

這一切還是要回到使用者端來回答。

在 AI 產業中,工程師們需要大量被清理過且精準地標註數據(Data Annotation),這能夠幫助他們訓練模型。而這些標註數據最原始的樣貌可能相當雜亂無章,而且沒有經過精準定義。經過 AI 數據處理團隊的巧手,將數據先做第一層次的清理,進而去標註要電腦學習的目標物。

所以,AI 數據標註工具與專案管理平台對這群 AI 數據標註師們至關重要。

舉例而言,若一個 AI 數據標註平台只有單一功能,可能只能畫出 Bounding Box 或是 Segmentation,這讓數據處理的範圍大幅地給受限了。因此,一個好的數據處理平台必須要保持彈性,隨時根據客戶和 AI 市場需求,調整或新增它的工具。

(延伸閱讀:如何提高 AI 模型需要的高品質數據,若水揭露 AI 數據標註師工作的秘訣

若水 AI 數據處理平台,每天還會產生良率產能報表,同時搭配著 AI 數據標註師們的提問加以分析,比對他們日常良率表現。

一個高良率的 AI 數據標註師,如果當日表現沒有到達日常水準,品質管理人員就會馬上去了解問題何在,例如,這樣標註的 AI 數據是否合乎機器學習(ML:Machine Learning)的需求、定義不清楚、人為疏忽、又或者平台介面功能不友善,透過刪去法一層一層找到根因,解決問題。

每當平台有新上線的功能,若水都非常鼓勵標註師隨時提出意見作為回饋,而在市場客戶這一端,遇到 PoC(Proof of Concepts)驗證型專案時,若水也會隨著第一次驗證結果,微調平台上功能。


用一句話來歸納:若水 AI 數據處理平台是為客戶而生、為 AI 數據標註師而戰

圖片來源 : 若水 Flow

由於若水的 AI 數據平台使用者,主要以居家 AI 數據標註師為主,他們身體狀況、身心障礙類別涵蓋非常多元;我們的 AI 數據標註平台,也因此能開發出許多特色。

一直以來,若水與專業設計師、OT 職能治療師和認知心理學家合作,致力於 AI 數據處理平台的 UI 和 UX,讓 AI 數據標註師們能夠方便地使用工具,透過不同的 UI 介面和 UX 設計,大幅加快處理數據的速度。

以「快捷鍵」設計來說,有些身障夥伴僅能使用單側身體來工作,我們便會去思考最恰當的單側快捷鍵配置方式。

相較於能面對面溝通的一般工作者,若水必須排除遠距工作所產生的重重障礙,同時還必須讓這些居家 AI 數據標註師們產出高品質的數據。除了不斷打造好用的 AI 數據標註平台之外,我們也持續優化工作間的溝通流程,讓所有線上、線下的團隊成員能深度協作。

若水 AI 部門的 PM 專案經理黃子祥分享他的寶貴經驗:

1, 明確表示正確的執行指令(What),並搭配畫面輔佐,若水甚至以拍攝影片的方式來告訴居家 AI 數據標註師們,應該怎麼做才能把圖片、影像標註好,達到應有的良率水準

2, 明確表示執行指令會是在哪一場景、哪一時間點被執行(Where、When),舉例來說,AI 數據標註師要瀏覽訓練手冊的第幾頁、第幾個步驟來執行某個指令。若水的 PM 黃子祥分享了小技巧,「每一個東西都要給予一個對應編碼,才能讓彼此溝通上不會有落差」

3, 回饋必須及時,當數據標註表現得好時,要適時給予肯定,而當沒有做到位時,也必須立即修正,以避免掉一些重工的風險


AI 數據標註師小兵立大功,創造自己的創新SOP 工作流程

最近這幾個月,我們觀察到了一個有趣的現象,團隊中有表現特別突出的 AI 數據標註師,他們的產量、速度是平均值的兩倍之多,簡直就是快狠準!

我們去特別研究之發現:

1, 高頻率地使用數個快捷鍵,取代掉大部分鍵盤功能

2, 透過經驗累積,發展出自己一套獨有數據處理 SOP

若水透過及時線上對談、居家訪視,了解 AI 數據標註師們各自的專長和優勢,持續這些技巧和數據處理 know-how 導入到職前訓練中,讓所有專案中的參與者明白數據標註不僅止於處理單點的問題,而是每個細節環環相扣。

AI 數據標註,這件看似簡單不燒腦的事,若水卻選擇用最高規格對待:開發自用平台,並透過即時溝通、對話,掌握最佳產出品質。同時也希望在 AI、大數據起飛的高速時代,為居家標註師們能打造一身好裝備與武器,培養出多元數位職能。


【延伸閱讀】

1、 原來Instagram 搜尋鍵的演算標準不是靠追蹤照片! ➡️➡️ 來這裡,你可以了解 IG 的人氣判斷依據

2, 過去 20 年在 3G、4G 的架構下,改變了你我的消費生活;未來 20 年在 5G 的架構下,將改變企業的運作 ➡️➡️ 當5G+AI,企業經營需具備哪些新思維?

工程師自己標註AI數據,划算嗎?數據外包策略的兩大好處

看見數據的生命力

【AI專案管理學】200名在家工作者,如何讓上百個AI應用開花結果?