最近工作上需要尋找適合的 BI 工具來使用,於是嘗試了四個,其中有兩個需要付費:Tableau、Mode Analytics,有兩個免費的:Superset、Metabase。
之前有使用過 Tableau 的經驗,它在資料來源的連接或是圖表的呈現上都是最豐富最有彈性的一個,但同時也是最貴的,因此先當作備案,暫不考慮。
Superset
首先嘗試了 Superset,在本機用 Python 開了一個虛擬環境,然後架在上面。Superset 整個介面蠻美的,後台看起來也完整,具備權限管理的功能。概念是在 Slices 那邊作一個個圖表,然後加進 Dashboards 裡面。
但是似乎無法直接連 BigQuery,於是改連 MySQL ,結果 Query 的執行速度很慢,1,000 筆資料還跑得出結果,但到 10,000 筆以上,每次都直接 timeout,無法成功跑出結果,找不到原因於是改嘗試其他工具。
Mode Analytics
接著同事找到了 Mode Analytics,可以直接在他們的網站上使用,需要付費,但可以試用 14 天。一樣具備權限控管的功能,並且可以直接連接 BigQuery,需下 Standard SQL 查詢。
具備兩個比較特殊的功能:
- 可以排程定期將報表的 PDF 之類的檔發送至指定 Email。
2. 可以使用 Python Notebook,將 Python 畫的圖嵌入 Dashboard 裡面,還可以使用 scikit-learn 等套件,但限制是只能使用他們平台上已經內建的套件。
原始內建的圖表大概長這樣:
試用過後覺得有一些問題,原始內建圖表的彈性不高,很多東西都寫死了,例如上圖左邊那張只能給一個 Y 軸,導致看不太到 User 那條綠線。另外 Python Notebook 也有些神秘的問題,像是在上面做整數的除法只會回傳整數,沒辦法回傳浮點數之類的。當然需要付費也是一個很主要的問題,因此也同時嘗試了 Metabase。
Metabase
Metabase 是在本機架 Docker 建立的,安裝步驟非常簡單,在 Docker Hub 兩行指令就完成了。一樣具備後台權限管理功能,也能連 BigQuery,使用 Legacy SQL 做查詢。介面也是簡潔美美的:
雖然不像 Mode 有一些特異功能,但圖表的彈性多了許多,例如下面的圖就自動幫我分成兩個 Y 軸,終於看得到 User。
除此之外,在作圖上還有一些小地方比 Mode 來得有彈性就不贅述, 而且免費這點還是非常吸引人的。另外如果有需要的話,也能夠連接 Slack 喔。
以上是簡單的 BI 工具測試心得。