Data Visualization -NBA Players Hometown and Championships 【數據可視化】

来源:互联网 发布:mac high sierra 升级 编辑:程序博客网 时间:2024/06/06 02:26
數據可視化Data Visualization是一門學問和藝術,首先放一則也是關於NBA的數據分析,《Excel绘制NBA投篮数据热力图(HeatMap)分析》,非常直觀而且有創意的HeatMap。

我做的topic呢,是去分析“NBA球員的故鄉,和NBA總冠軍之間的關係”:
  1. 是不是有哪個地方經常出“總冠軍球員”呢?
  2. 是否有2﹣3個地方的球員,經常聯手,作為同隊隊員而獲得NBA總冠軍呢?
帶著這兩個問題,我開始了這次的Data Visualization。

獲取數據的關節就不多講了,需要獲取:
  1. 所有NBA球員的名單以及其出生地;
  2. 歷年總冠軍隊伍的球員名單;
結合這兩份資料,就可以將“NBA總冠軍”和“球員故鄉(美國大洲名)”聯繫起來了。

我要做的呢,是一份類似於“社交網絡圖”的Network Graphics。

當某兩個地方的球員處於同一支球隊,而且獲得了總冠軍,那麼就認為這兩個地方有一次“友誼friendship”,所以很自然,如果這兩個地方的球員經常處於同一支球隊而且獲得總冠軍的次數很多,那這兩個地方就有著“深厚的友誼”。所以,在這裡,我定義了一個“friendship between places”。

之後,使用類似於Facebook社交網絡分析的辦法,去分析在NBA總冠軍歷史中,不同美國大洲之間的“友誼”,其社交網絡圖。

獲取數據的過程,計算不同地區聯手次數的過程,均使用Java程序計算,然後數據導出至Excel中,這一切在Java程序里做完;
之後,使用NodeXL進行可視化展現,把每一個地區用點表示,點的大小用來描述其NBA總冠軍中球員的數量;如果兩個地區之間有過聯手,那麼就有“友誼”,兩個點之間用線連接,線條的粗細,用來描述其聯手的次數。

這樣,得到了完整的可視化效果圖:
Data Visualization

可以看出:中間部份的點比其他的要大很多,而且線條很粗,所以,要找的規律,肯定存在中間部份;
下一步,就該使用filter,將其他的小點,也叫做“噪音”去掉,我們再看效果:
這樣就清晰好多了吧:
  1. 圖中最大的三個點,top 3: CA, NY, IL,分別是California加州,New York紐約州,和Illinois伊利諾伊州
  2. 這三個點組成了一個三角形,說明這三個地區的球員,經常處於同一個隊伍,去獲得總冠軍
  3. 其中我們觀察到,CA自身就一個圓圈,這說明加州的球員,也很擅長自己合作,他們自己的球員,就經常組隊,去獲得總冠軍
好了,這就是我的數據可視化過程。那麼如果你某天有幸做到了球隊教練的位置,就一定要去加州、紐約州和伊利諾伊州去選人,而且加州的球員,一定不要放過!!



------
A Dreamer, Always, I will be...
Contact me @ www.wilsonwuyang.com
原创粉丝点击