
商業價值
分析專家
Mobile: 886-958-003211
大數據(Big-Data)專家- 張冠英老師
張老師從事統計分析與品管相關的工作多年,正逢大數據時代的來臨,適逢版主邀約以商業分析手法為基礎,要如何解讀大數據並給予商業價值呢?讓我們看看張老師怎麼說。
...........................................................................................................................
首先多謝版主給予我這個機會與大家分享Big Data,在剛收到這個大數據主題的時候,不斷地在思索,要給予Big Data的入門者,哪一方面的方向與思維呢?經思索過後,希望能透過實例給予Big Data的入門者幾個重要的觀念。



1. Big Data的正確觀
很多人都會把Big Data當作全部母體或數量龐大的資料,但這個觀念其實不完全對,正確的應該是說他是一個有限資訊的集合會比較恰當,裡面包含這我們所能蒐集到的有限已知的母體或樣本。
在此舉一個實例,癌症是全球主要的慢性疾病之一,在台灣可以向健保局,申請健保資料庫做學術研究,裡面的資訊五花八門,不單單只有病理資訊還有很多其他的相關資訊,但由於各家醫學院所,基於保護客戶隱私與電子病歷各家的系統有所差異等特殊情況,導致並不會百分百的全部都進入到健保資料庫內,常會有遺漏或是資料有誤的情形發生。
2. 工具是死的,人是活的
--不要陷入資料的謎團中,要善用商業分析BA手法,找到真正商機
前陣子有接到一個案子是紅酒酒商與醫學中心合作,因為知道國外有研究顯示說喝紅酒有利於降低心血管疾病的發生,想要透過醫療 健檢與紅酒行銷,回饋長期購買紅酒的客戶,擴展國內紅酒市場。再找我之前其實有找人分析過,發現喝紅酒與沒有喝紅酒的國人,其實在心血管疾病的預防下並沒有顯著的差異,這樣研究成果只能說果是0。當數量龐大大一定數量後,就會趨近於常態,其實這就是Big Data的迷思。很多人都覺得資料多就可以得到精確的結果,其實事實不然,很多時候都太執著於數據表面的面相而忽略了事物的本質。
3. 學習溯因思維,突破Big Data迷思
-清楚分析因子相依性後大膽論證
之前有個案例,是解析喝紅酒好處。
在剛接到這個案子的時候,我請對方不用給我前一個分析者的資訊 (因為這會影響我客觀的判斷),先了解業主需求後,針對業主的需求與資料的特性。
我大膽的把喝紅酒的族群,分成兩類,一類是檢驗數值正常的,一類是檢驗數值不正常的做交叉分析。在正常的這個族群內,我們會發現有喝紅酒與沒有喝紅酒的族群,其實在檢驗數值上是有偏低的,但不明顯 (主要原因在於國人飲食衛生的大幅提高,除了紅酒外,其實還有很多種不同的選擇) 。
最後在經過性別的分類過後,差異就更明顯的凸顯出來了;而喝紅酒檢驗值不正常的族群,會發現常有酗酒或暴飲暴食的習慣 (產生數值相依性,可進一步探討),更多的發現是本身帶有一個以上的慢性疾病,所以在檢驗數值上,並無法將喝紅酒的好處反映出來。
................(待續)