數據視覺化之關聯分析及其視覺化

隨著商業智慧,數據視覺化這些概念越來越多被人們所熟知,有很多熱情的朋友提出,微策略能不能分享一些數據領域的知識呢?這一篇是來自團隊裡面有著十年數據視覺化沉澱的移動產品經理江薇的分享。


經典案例

說到商業智慧(BI)第一經典案例,那我們就必須引出最最著名的故事:啤酒與尿布。


90年代的沃爾瑪超市出現了這麼一個很有趣的現象:貨架上啤酒與尿布竟然放在一起售賣,這看似兩者毫不相關的東西,為什麼會放在一起售賣呢?


原來,在美國,婦女們經常會囑咐她們的丈夫下班以後給孩子買一點尿布回來,而丈夫在買完尿布後,大都會順手買回一瓶自己愛喝的啤酒(由此看出美國人愛喝酒)。


商家通過對一年多的原始交易記錄進行詳細的分析,發現了這對神奇的組合。於是就毫不猶豫地將尿布與啤酒擺放在一起售賣,通過它們的關聯性,互相促進銷售。


「啤酒與尿布」的故事一度是營銷界的神話,他也成為了商業智能領域傳頌的經典,實實在在的讓我們體會到數據分析的魅力!


「啤酒與尿布」這個案例引出的一個概念就是關聯分析,而我們將以關聯分析作為我們這一系列知識分享的開篇。


什麼是關聯分析(Affinity Analysis)?


關聯分析又稱關聯挖掘,就是在交易數據、關系數據或其他信息載體中,查找存在於項目集合或對象集合之間的頻繁模式、關聯、相關性或因果結構。


在我們的日常生活中,企業的經營中, 我們常常碰到這樣那樣的關聯性問題:


1. 餐廳裡面怎麼定義套餐組合?


2. 連接哪兩個機場的航線最繁忙和呈現出最高的晚點率?


對於第一個問題,我們就需要用到關聯分析的一種典型分析方法 – 購物籃分析。它在零售業,通常用來發現哪些商品在一個事務(transaction)里成交的可能性更大。

首先,讓我們舉一個簡單的例子,來介紹購物籃分析裡的關鍵數據概念:

項集(Items)