數據分析
數據分析就像做芋圓?新手也能輕鬆上手的秘訣!
```html 週末下午,我跟朋友約在永康街的一間老喫茶店,點了兩杯冰鎮檸檬冬瓜茶,窗外是熙來攘往的人潮。朋友最近在煩惱公司新導入的數據分析工具,聽她抱怨,我心想:「這跟上次我學做芋圓的時候,遇到的問題有幾分相似呢?」 芋圓的困境:資料的原始形貌 做芋圓,最怕的就是那塊新鮮芋頭。要處理得乾淨、刨得均勻、澱粉要瀝乾,每一個步驟都差一點點,做出來的芋圓就會口感不佳,甚至失敗。就像數據分析一樣,再厲害的工具,如果資料的原始形貌不好,那再精密的分析,也只是空中樓閣。 我記得上次做芋圓,因為太心急,直接把芋頭刨進鍋裡,結果做出來的芋圓黏糊糊的,根本無法入口。後來查了資料,才知道芋頭必須先用鹽水浸泡,去除多餘的澱粉,才能做出Q彈的口感。這就像數據分析的「資料清洗」一樣,需要去除錯誤、缺失、重複的資料,才能得到有意義的結果。 朋友苦惱的是,新工具需要匯入大量的銷售數據,但這些數據來自不同的系統,格式各異,而且還混雜了一些錯誤的記錄。她試著用工具進行分析,得到的結果卻是讓人摸不著頭腦。我跟她說:「別急,