不是後天免疫缺乏症候群的 AIDS,是 Artificial Intelligence 的簡稱 AI 加上 Data Science 的簡稱 DS,合併起來叫 AIDS,簡潔好記。因為拿了公司的錢請了公假來參加 2017 年人工智慧年會及資料科學年會,所以不得不寫書面報告,而有些東西可能不適合放上報告內容,所以決定先在這邊打個完整的想法,再刪減進報告裡。比起自己看了都不知所云的當下筆記,覺得彙整成文章內容可能比較立體,不過也因此會包含一些個人想法之類的變得比較主觀。總之,希望多少還是能給看的人一點點想法。首先第一篇,想先來談談趨勢及企業文化的部分。
AI 的應用概況與定位
Google Taiwan 總經理簡立峰表示過去 Mobile First 時代已經要轉入 AI First 的趨勢中。現有 AI 相關應用包括垃圾郵件偵測、機器翻譯、語音辨識、影像辨識等,其中自駕車是最能代表現今 AI 發展成果的一項。而 AlphaGo 從早期的版本,到 AlphaGo Zero,更是有劃時代的意義。從需透過過去棋譜做訓練,到不需要訓練集,只教電腦圍棋規則,讓兩個電腦去對下。這樣的 AlphaGo Zero 不僅在 21 天就達到前代的勝率,在 40 天後更是顯著高於前代,除此之外甚至在硬體資源的需求上也較前代來得低。
而究竟 AI 哪裡能做得比人好,哪裡不能呢?簡立峰說:「人類與生俱來的能力很難 AI 化,長大之後才學的很好 AI 化。」對於同樣的議題,KKStream & KKTV 的資深技術總監官順暉的講法是:「The efficiency is for machine, human is responsible for sort of beauty.」個人蠻喜歡這句話的,呼應到今年在 Date Summit 威朋 Vpon 執行長吳詣泓說的:「人要去做有溫度的事,機器負責做那些人做起來不會那麼快樂的工作。」
新經濟的誕生
同樣來自簡立峰的演講內容:2000 年開始台灣停止投資網路,資本移轉中國。2007 年智慧型手機的發展,也讓硬體廠商衰微,新經濟誕生。所謂的新經濟指的是從製造,移轉到以服務為重。而這當中的成功方程式為何?
- 人口紅利,大國崛起:User, user, user
- 智慧服務基礎:Data, data, data
- 羊毛出在狗身上,豬來買單
- 贏者全拿
而這樣的方程式有利於小國和大國,最不利於中型國家,這點可以從世界百大企業在各國的分布看出來:世界百大企業在美國的家數持續增加,而在英法德日等中型國家則正在下降。
AI 趨勢及台灣的機會
簡立峰分享的趨勢如下:
- Smartphone as AI supercomputer
- Hardware Accelerates AI:法規規定個人資料不能放雲端,硬體還是有機會。
- AI at home:24M Units Smart Speakers Sales in 2017,家庭 AI 的第一步。
- AI on Car
- Drone:Next Camera Follows You,但不僅限於照相機功能,例如現在紐西蘭已經在用無人機趕羊,在大國也會應用於救災或巡航。不過無人機送貨目前還是噱頭成分居多,因為電池無法支持長期飛行,目前機器人發展很大的一個阻礙其實是電力供應的問題。
而這當中台灣的機會在哪裡?用硬體來跨軟體,把軟體放在醫療、工業領域等。因為台灣有硬體三巨頭:富士康、台積電、聯發科;軟體上也有 Appier 等公司;軟硬體結合後就能產生像是 Gogoro 這樣的產品。將 AI 技術 IC 化,並做跨領域應用:
- 異業整合:EE + CS + MD/ME(智慧醫療、智慧照護 / 智慧製造、智慧汽車)
- 世代整合:新舊產業,實體與數位產業
- 傳統產業網路化、數位化
AI 趨勢下如何帶動公司的數位轉型
一、人:
現在 AI 議題被炒得很熱,大家都知道要數位轉型,但具體而言該怎麼做呢?這邊引用 Microsoft Principal Researcher Bill Buxton 的話:「You have to design the organization to design the product.」我想第一個步驟是人。
關於人,KKStream & KKTV 資深技術總監官順暉提供了很好的做法。他說任何企業內部的 Data Team 都是一個 Startup,而他希望能在這根植資料文化(Data Culture),第一步就是:「Everyone has to believe in data.」。於是在公司內部舉辦了一個 Data Game,參與對象不只限於會 Coding 的人。首先舉辦了 Workshop 介紹了有哪些資料,然後有個範本,讓人人都能直接拿寫好答案的範本去交卷,並且也舉辦了一些小活動,像是讓員工自己主觀來預測使用者下一步會看的影片,這樣即便沒有寫程式能力的人也能夠參與在其中。範本交卷後的分數不會太漂亮,於是接下來就鼓勵大家提高分數,如果超過某個分數門檻就能得到電影票,而要超過這個只要透過這個 step by step 的操作手冊就能完成等等。
官順暉的結論是:
- 優先建立對 Data 的親切感/信任感
- 透過 Data Game 來增加體驗與樂趣
- 文化是眾人之事,從生活點滴開始
- 外部的刺激,可以加速文化的形塑
個人覺得這些非常非常重要,就像是要開始一段感情,如果對方是一個存在於日常生活中的人,跟你有些自然地相處,你對他慢慢熟悉有了親切感,也在相處中感覺到他是能夠信任的,於是你們約出去,發現他還能讓你體驗到不同的生活樣貌,跟他在一起就是很好玩,這時候如果旁邊摯友推波助瀾一下,還不手到擒來。在 Data Culture 都還沒建立起來就宣布:「我們來人工智慧一下吧!」就好像是去隨便跟一個陌生人說:「我們來結婚一下吧!」
二、簡單的自動化:
Appier 的首席資料科學家林軒田說:「Appier 的目標是 make AI easier。」而我覺得 AI 就是要 make life easier,所以首先是不是能透過一些資料科學中常見的簡單技術來改善工作內容呢?
舉例而言,曾經聽過某旅行社的員工說,他每天都去競爭者公司網站抓滑雪旅遊團的報名人數,藉此來做競爭者分析、滑雪市場分析等等。他的做法是每天一上班就去各競爭者網站複製數字,然後貼在自己的表格,最後用 Powerpoint 做圖表,而當時他呈現出來的是一整年的折線圖,所以估計他至少做了上千次的複製貼上。
另一個例子是,碰過認識的人在做世界各國的市場分析,今天有人要 A 國他就拉 A 國,改天有人要 B 國他就拉 B 國,之後有人要 C 國再拉 C 國,而這些其實都是使用了同樣的資料來源,而且要看的東西是用一樣的邏輯跑出來的結果。
相信這兩個例子在台灣的公司是屢見不鮮的事。那麼,在你的員工每天做幾百次的複製貼上、用 Excel 重複拉著一樣的報表(即便 Excel 好像有更自動化的方式)的情況下,要怎麼談數位轉型呢?所以像是 Oath 資深資料工程師周曼如剛進去 Yahoo(那時還叫 Yahoo)做的事情,我想就會是一般公司很好的開始。她說剛進去時,負責根據各個業務單位的需求去拉報表,像是行銷、物流倉儲、CRM 等等,然後做成自動化的 BI 報表,做了一段時間之後才轉調其他 team,開始資料的 ETL。
像是第一個例子,可以寫個簡單的爬蟲去按時蒐集數字,然後直接呈現在一些 BI(Business Intelligence) 的視覺化工具;第二個例子則是可以把邏輯寫好後,每次透過傳入不同的參數(國家),回傳所需要的報表內容。
三、擁抱開源軟體:
Google Taiwan 總經理簡立峰說:「台灣 Open Source 的使用率很低,要懂得善用 Open Source 現有資源,因為賺錢的人不是做工具的人,而是從需求出發的人。」會中不少講者都一致認同現今深度學習的成果,很大一部分的原因來自開源社群的共享。記得在 AlphaGo 主要開發者黃士傑的演講中提到,在 AlphaGo 還沒有完成時,他的老闆就要將目前研究成果發表到《Nature》上,對於當時他的不解,老闆說:「科學的精神就是分享。」
重要的是「需求」,工具其次;也有賴於各種大神的分享,開源軟體的技術並不會輸給商業軟體,而且免費這個要素,自然讓它成為一個很好的選擇。
如何定位甲方公司的 Data Team
曾經跟朋友聊過關於甲方公司 Data Team 的定位,經過這四天的年會後有些想法。他服務於甲方公司資訊部門裡面的 Data Team,對於他們 Team 在公司裡的定位有些模糊。他們是新成立的部門,主要是負責處理公司內部的需求,大部分同事是從別的部門調過來的,因此在技術能力上比較有限,儘管如此還是必須要很快地有一些產出。然而其他部門沒有 Data Team 也順利地運作了這麼久,基本上是不需要他們的,導致有時主管會攬一些奇怪的任務回來,或者是硬塞一些東西給沒有需求的部門。
對於這樣的問題,想到 Kyosei.ai 共同創辦人郭耀仁在演講中說的:「要去找到問題的源頭,然後切割成好幾個任務,基於人的本性,正向回饋來得愈快愈好,所以根據正向回饋的速度做任務的優先排序,然後一一去執行。」就像是一般乙方公司需要找到市場的需求來推出產品,甲方公司的 Data Team 也必須找到公司內部部門的痛點,耐心地去靠近、去關心、去試著提出解決方案。這就是人類要做的事了,因為如果 AI 真的發展很成熟了大概只會跟他說你很慢讓我來,但是對人不能這樣,這是軟軟的事情,需要有溫度地去解決才行。
然而在年會中聽到一些演講,像是優拓資訊用少量標記資料訓練聊天機器人,或是 KKBOX 的推薦系統,都是花了許多時間看論文學技術,然後去實作去修正而來的成果。那麼對於沒有那樣的團隊、那樣的硬體資源的公司,想要做到同樣的效果,勢必只能外包,那麼甲方公司的 Data Team 要做什麼?
年會中有許多講者提到 MVP(minimum viable product),Wiki上是這麼描述的:「MVP 是新產品開發中的名詞,是指有部份機能,恰好可以讓設計者表達其核心設計概念的產品。」雖然一直有聽過這個概念,但到年會上 Gogolook 的演講時,才有比較具體的體會。Gogolook 執行長郭建甫說,一開始他們只是把電話號碼丟進 Google 然後回傳前五個結果而已,但因為他們從需求出發,找到了市場的痛點,即便效果沒有那麼完美,但證實了這個 MVP 的價值所在,凝聚了使用者後,後面針對產品的改良都是水到渠成了。
對於甲方公司的 Data Team,我認為他可以是很好的窗口,先去認知然後凝聚公司內部的需求,做出相應的 MVP。假設公司需要推薦系統,不會太難太新的技術,也可以先單純做商品之間的關聯分析,實際 DEMO 出推薦系統能夠解決的問題,在公司內部取得共識。而對於推薦得準不準這件事,如果需要更厲害的技術,再來尋求外部專業團隊來解決,這樣我想會是甲方乙方雙贏的情況,而不是彼此互相傷害。
這樣甲方的 Data Team 會不會很廢?個人是覺得不會,誠致教育基金會 Team Activator 蘇倚恩說:「有效溝通是資料科學家的工作職責,也是能否展現效能的關鍵。」現行商業世界中的溝通成本有多高我想是每個人的共通痛點,能夠減少成本提高效率,也是能力的一種展現。相信這樣的位置很重要,而且一定會有某些特性的人更適合這樣的角色。
以上,是彙整了這四天年會一些談及趨勢及企業文化的部分,然後加入了一些個人經驗和想法。接著,理想上,還會再打年會上聽到的應用跟技術面的東西,理想上啦。