2019 Dec GCP Summit 摘要

Pei Lee
4 min readDec 17, 2019

--

簡單摘要 2019/12/10 Best of Google Cloud Summits 的其中兩個主題:

  • Cloud AI
  • Data Integration Tool

Cloud AI

一、顧客服務解決方案

  1. Dialogflow
  • 提供跨平台的問答機器人服務,支援語音及文字的輸入。
  • 有 UI 介面的後台可進行設定操作。

2. Contact Center AI

  • 將 Dialogflow 納入服務項目之一。
  • 對顧客的問題進行主題分類,即時提供對應的文件,增進客服效率。

二、客製化模型

  1. AutoML Vision:圖像辨識。多了一個 Edge 的選項,可以 Export 出來供 Offline 使用。
  2. AutoML Video Intelligence:影像辨識
  3. AutoML Natural Language:自然語言
  4. AutoML Translation:翻譯
  5. AutoML Tables:還在 Beta 版。提供直覺的 UI 介面做建模、模型評估。
  • Import:目前支援 BigQuery, Storage CSV 檔, Upload 本機檔案。
  • Train:有簡單的每個欄位資料分佈的圖表。
  • Models:建模時只需要輸入 Budget。進階設定可以選評估指標(AUC, Recall 等等)。
  • Evaluate:產出評估指標的數值,以及特徵重要性圖表。
  • Test & Use:支援 Batch Prediction、Online Prediction ( API ), Export Model ( As Docker Container )。

6. Recommendation AI:還在 Beta 版。提供客製化的推薦系統。

  • Ingest Data
  • Customize Your Recommendation:可以選擇推薦類型、目標,並設定商業邏輯。
  • Deliver:API

Data Integration Tool

一、選擇工具的考量點

  1. Migration
  2. Batch / Streaming
  3. Team Technical Skill Set
  4. Configurable Autoscaling or Full Serverless

二、GCP Data Integration Tool

(按技術能力要求由高到低排序)

  1. Dataflow:技術能力要求最高
  • Apache Beam
  • 執行 Realtime 資料處理
  • Streaming & Batch

2. Data Fusion:這次 Summit 在這個主題 Google 主推的服務,值得期待。

  • CDAP
  • 執行資料的 ETL
  • 可涵蓋 Dataproc ( Hadoop, Spark ) 及 Composer ( Airflow, Data Orchestration ) 功能
  • Streaming & Batch

3. Dataprep:技術能力要求最低

  • Trifacta
  • 執行資料的 ETL
  • only Batch

三、Data Fusion

  1. Data Preparation:Data Profiling, Point & Click Wrangling
  2. Self Service Integration:
  • 提供各平台的 Connector:

(1) GCP : BigQuery, Datastore, Storage, Spanner, PubSub

(2) AWS : S3, Kinesis, Redshift

(3) Azure : Data Lake, Blob Store

(4) On-prem : SQL Server, Oracle DB, IBM DB2, IBM NETEZZA, Excel

(5) Open Source : Hadoop, Spark, MySQL, HIVE, KUDU

(6) SaaS : Salesforce

  • Code Free 不需寫程式,但需要的話可以用 Javascript

3. Orchestration:

  • 可選擇要用 Mapreduce 還是 Spark Engine 跑
  • 可以排程 & 用事件觸發下個步驟

4. Governance

個人覺得 Dialogflow 跟 Contact Center AI 在企業的客戶服務上值得嘗試。客製化模型 AutoML Tables 及 Recommendation AI 雖然都還在 Beta 版,但目前台灣有些在做這塊的新創可能會面臨不小的危機。最後是 Data Fusion 的 ETL 服務,對於不同平台的整合做得更好、功能也更加強大了,跟 Google 內部工程師聊的時候他也是推薦這套,相當值得期待。

--

--

Pei Lee
Pei Lee

Written by Pei Lee

Data Team Lead @ Retail & E-commerce Industry

No responses yet