資料視覺化是個人很喜歡的一個領域,覺得它是一個美學、傳播學以及科學的結晶。這次年會聽下來,覺得視覺化能做的方向大概有三:資料的靜態概覽、資料的即時動態變化、預測結果的視覺呈現。以下是四場相關的演講:
一、Big Data Visualization / 馬匡六 University of California at Davis Professor
- 為何需要視覺化?
- to see:an overview 資料的概覽
- to direct:a path 分析的方向
- to explore:an interface 互動探索
- to communicate:a story 說故事
那用一般的敘述性統計來理解資料不行嗎?不行喔。以下這張圖是很有名的案例,說明了擁有相同平均值、標準差、相關係數的資料,畫出來可以是以下這幾種樣貌:
2. 視覺化設計的準則:
- 了解數據的特性
- 釐清視覺化目的
- 針對使用者需求
3. 實際範例:
- 醫療領域:
右邊是一個人類的腦,裡面黃色球狀物體是腫瘤。透過設計,將會蓋住目標物體的東西拿掉,僅保留需要看的地方。
這是馬匡六學生的作品,一個可互動的人體視覺化傑作。根據使用者需求,從右下角選擇要看的模式,例如左一是只看骨骼的部分。透過手的操作可以移動人體模型,做各種角度的呈現。最後還可以隨意裁切人體模型,放大來看需要特別注意的部分,做到觀察人體各種角度各種剖面的效果。
健康紀錄視覺化,圖中顯示最後導向死亡的腎臟病患者所經歷的症狀轉變。
- 網路關係圖:
這是 Yahoo Research Yifan Hu 做的網路行為分析圖,每個白點是一個 IP,每個藍點是一個使用者,看到一堆使用者連到同一個 IP 可能代表該 IP 為飯店等地點。藉由這張視覺化圖表,能夠清楚監測網路上的異常行為。
恐怖攻擊網路圖,圖中顯示蓋達組織發動的恐怖攻擊數量較少,而且主要是針對大型政府機關的攻擊;而哈瑪斯攻擊次數較多,而且主要是對平民所在的地點做攻擊。
- 使用者行為:
根據 eBay 上面的使用者行為紀錄的視覺化,用肉眼就能立即辨別使用者的分類。
- 電影故事線的視覺化:
先承認我沒有看懂這部電影^口^!
- 深度學習及雲端計算的視覺化:
Open the black box!藉由視覺化的呈現,打開深度學習的黑盒子。除了這兩個之外,另外還有Google 的 TensorBoard 可以用。
視覺化呈現雲端計算時的狀態。
最後馬匡六分享了一個他正在研究的視覺化方式,利用譬喻(Metaphor)來呈現數據,例如像下面這個花,就是輸入個人的 FB 數據後,就能視覺化呈現個人每年的社交情況變化,好喜歡這個東西。
二、重新認識資料視覺化 / 王昱舜 交通大學資訊工程系 副教授
王昱舜演講緊接在馬匡六後面,感覺壓力有點大。講的內容有些重疊,所以這邊僅分享一些案例:
- 即時的足球比賽視覺化:M. Stein et al., “Bring it to the Pitch: Combining Video and Movement Data to Enhance Team Sport Analysis”
- 即時戰略遊戲視覺化:星海爭霸
視覺化顯示藍方與紅方的勢力消長,並且標記出遊戲的重要事件,可以看到紅方隨著時間軸顏色愈來愈深,最後擊敗藍方。
- 深度學習模型的視覺化
三、我的多媒體研究之路 / 廖弘源 中央研究院資訊科學研究所 特聘研究員
廖弘源的簡報沒有分享出來,他做的東西也比較難以一張照片代表,因此用文字來敘述。他分享的第一個研究,是希望在電腦螢幕上做一個機器人,能夠根據播放的音樂,像人一般做出適當的指揮動作並且調整幅度。
第二項研究是觀察到許多到演唱會現場的觀眾,都會用自己的裝置錄影並且上傳 Youtube,而且根據不同使用者還會有不同角度的畫面,因此廖弘源想把這些當作素材,做自動化的影片剪輯。就像是一般演唱會現場的導播會隨著音樂或現場氣氛抓取不同角度、不同大小的畫面,廖弘源希望也能做出一個這樣的機器人,將各種使用者上傳同場演唱會的畫面,做出有導播效果的剪輯。
第三項研究跟王昱舜提到的足球比賽的視覺化有點像,廖弘源做的是籃球比賽,能夠自動為畫面上的球員標上名字,並且藉由移動的軌跡紀錄,做即時戰術的呈現。
四、從時空的方向整合企業資料與開放資料 / 吳齊軒 台灣大學電機工程學研究所 博士候選人 + 李慕約 資料視覺化李慕約公司 共同創辦人
吳齊軒(Wush)在分享中表示,在連接外部資料時,因為沒有相同的 Key,因此實務上最容易的是做時間或是地點的 Join。而我個人最常遇到的其實是需要做兩個公司名稱的字串比對,但因為一個公司有各種簡稱,目前還是沒有找到好方法來確認兩個名詞是否指稱同一間公司。
接著由李慕約 DEMO 他的作品,看起來是一個城市 3D 地圖,建築物高度資料的取得方式為去找該建築物在登記的地址中最高到幾樓,然後去做概算。不過可以想見的問題是除了台北之外,其他縣市很多人都是住透天厝,沒辦法透過這樣的方式取得建築物高度。
而做 3D 地圖能呈現出 2D 地圖所不能呈現的一些東西,例如說可以做基地台擺放的效果呈現,這樣才能將影響基地台訊號的一個因素建築物高度也呈現出來。
以上是四場聽的跟視覺化有關的內容,另外根據同事分享,Computational Design Thinking — 數據取向的產品設計思維與案例 / 溫明輝 臺北商業大學商業設計管理系 助理教授 分享的 STOCKFEEL 的案例,個人也覺得是一個很好的視覺化範例,如果知道他是做 STOCKFEEL 的一定會去聽的說。最後分享一個 KKBOX 個人化推薦系統中的一張視覺化圖,個人也很喜歡:
從 1960 年到近年的音樂風格趨勢變化圖。