簡單摘要 2019/12/10 Best of Google Cloud Summits 的其中兩個主題:
- Cloud AI
- Data Integration Tool
Cloud AI
一、顧客服務解決方案
- 提供跨平台的問答機器人服務,支援語音及文字的輸入。
- 有 UI 介面的後台可進行設定操作。
- 將 Dialogflow 納入服務項目之一。
- 對顧客的問題進行主題分類,即時提供對應的文件,增進客服效率。
二、客製化模型
- AutoML Vision:圖像辨識。多了一個 Edge 的選項,可以 Export 出來供 Offline 使用。
- AutoML Video Intelligence:影像辨識
- AutoML Natural Language:自然語言
- AutoML Translation:翻譯
- AutoML Tables:還在 Beta 版。提供直覺的 UI 介面做建模、模型評估。
- Import:目前支援 BigQuery, Storage CSV 檔, Upload 本機檔案。
- Train:有簡單的每個欄位資料分佈的圖表。
- Models:建模時只需要輸入 Budget。進階設定可以選評估指標(AUC, Recall 等等)。
- Evaluate:產出評估指標的數值,以及特徵重要性圖表。
- Test & Use:支援 Batch Prediction、Online Prediction ( API ), Export Model ( As Docker Container )。
6. Recommendation AI:還在 Beta 版。提供客製化的推薦系統。
- Ingest Data
- Customize Your Recommendation:可以選擇推薦類型、目標,並設定商業邏輯。
- Deliver:API
Data Integration Tool
一、選擇工具的考量點
- Migration
- Batch / Streaming
- Team Technical Skill Set
- Configurable Autoscaling or Full Serverless
二、GCP Data Integration Tool
(按技術能力要求由高到低排序)
- Dataflow:技術能力要求最高
- Apache Beam
- 執行 Realtime 資料處理
- Streaming & Batch
2. Data Fusion:這次 Summit 在這個主題 Google 主推的服務,值得期待。
- CDAP
- 執行資料的 ETL
- 可涵蓋 Dataproc ( Hadoop, Spark ) 及 Composer ( Airflow, Data Orchestration ) 功能
- Streaming & Batch
3. Dataprep:技術能力要求最低
- Trifacta
- 執行資料的 ETL
- only Batch
三、Data Fusion
- Data Preparation:Data Profiling, Point & Click Wrangling
- Self Service Integration:
- 提供各平台的 Connector:
(1) GCP : BigQuery, Datastore, Storage, Spanner, PubSub
(2) AWS : S3, Kinesis, Redshift
(3) Azure : Data Lake, Blob Store
(4) On-prem : SQL Server, Oracle DB, IBM DB2, IBM NETEZZA, Excel
(5) Open Source : Hadoop, Spark, MySQL, HIVE, KUDU
(6) SaaS : Salesforce
- Code Free 不需寫程式,但需要的話可以用 Javascript
3. Orchestration:
- 可選擇要用 Mapreduce 還是 Spark Engine 跑
- 可以排程 & 用事件觸發下個步驟
4. Governance
個人覺得 Dialogflow 跟 Contact Center AI 在企業的客戶服務上值得嘗試。客製化模型 AutoML Tables 及 Recommendation AI 雖然都還在 Beta 版,但目前台灣有些在做這塊的新創可能會面臨不小的危機。最後是 Data Fusion 的 ETL 服務,對於不同平台的整合做得更好、功能也更加強大了,跟 Google 內部工程師聊的時候他也是推薦這套,相當值得期待。