大部分資料科學家看AI的角度,或者說切入問題的角度跟商業落差都很大,走的是純粹的優化,走的是嚴謹,有時候模型很準,但是難以落實行動,比如金融模型常常就是殺進殺出,倒貼交易手續費還賠上時間。

有時候做模型的成本太高,解一個問題就燒了不知道多少經費的雲端運算資源………但是商業世界不是實驗室,沒有倒退重來這回事,而是小心翼翼往前爬,會退後只是其中一個已經被規劃好的路線,到了停損點,就直接認列沈沒成本。

商業資料科學,就是認清手上有多少資源,產出最大效益。

除非有過深厚實務經驗、或者受過進階商管訓練的人,否則一個純粹從理論爬上來的資料科學家,如果沒有一個好的商業顧問或者專業背景的合作夥伴,是很難帶好一項企業級的資料科學專案的。因此雇用、組建一個資料科學團隊,身為管理者,有五點不可不知的迷思需要先認清

一、資料科學家是很厲害的魔術師

首先,不是所有的產業都適合AI化的,甚至一個專業也不是完全適用AI,以財務管理為例,理財規劃可以,現在有許多FinTech公司乃至服務都圍繞著理財機器人、專屬理專……比如下圖這個《股感》的理財機器人科普示意圖:

圖片來源: Jayroz

它可以依照自己的策略、風險忍受度、理財預算來協助打理個人財務,但是「 公司併購 」本身不行,因為牽涉到太多複雜的估值、財務建模,以及無形資產、企業文化這種難以量化的評價,而公司併購在學科上常常被歸類在財管的範疇(財管教科書有半本都在教各式各樣的現值評價模型)。

要一個資料科學家協助「做個Alpha XX來幫公司賺錢」,還不如說他/她頂多能把「機器/深度學習問題」轉化為「商業問題」。

本身不能當作AI問題的題目,可以用別的方式來解,比如公司併購可以請顧問、請投資銀行、財務部門,但是請不要直接丟給資料科學團隊,可能他們與其他部門存在好的合作模式,但是並不是什麼棘手的問題都適合用黑盒子裝一裝就蹦出一個解答。

二 、 AI套用到商業上,必須請一票理工博士

success-strategy-business-solution-2081167-1024x57
圖片來源:

AI不論是技術還是商轉都很難,是否數學、電腦科學背景的博士才能駕馭大數據、Top 100 MBA的學生才能談論商業應用?我想不是的,其實難易度這麼玄的東西還是蠻主觀的,又不是一張考卷可以直接評分、調查大部分人的感受。

可實際上,它真的不是很複雜,學一門程式語言、有AI演算法的統計軟體,實際拿資料操作看看,如果結合本身強大的領域知識,會發現一些自己以前看不到的東西,而善用這種視角洞察事務的人,其實也是個AI的受惠者以及使用者。

你會發現這很容易就可以開始了,一台筆電、網路就足夠做準備,剩下的就是「要解決什麼樣的問題?」

AI不是一個自問自答的智慧體,只是一個很好的解題者,我們就是老師,如果連自己的商業問題都不了解,那先不用談AI,必須親自下第一線、業務面好好深入了解目前的瓶頸是什麼,才方便讓自己跟著AI解決問題。

有時候這是很簡單的,因為如果有一個長久以來很棘手的問題,好好拆解看看能不能讓AI解決,如果不知道問題在哪裡,推薦您從這篇文章中參考如何正確拆解問題。

三 、 不夠大的數據就不智能

首先這句話就蠻矛盾的,第一個,大數據到底要怎麼定義,有人說是思維、也有人說是資料量必須達到 X(這個X眾說紛紜,反正一直更新,我也不想追逐這樣說不清楚的變數,在這裡不是重點),雖然說資料量真的相當重要,可以相對應抵銷掉一些小樣本偏誤、讓我們看得更加全面,但說真的,既然真的要大數據,未來的資料一定更多對嗎?

每過一秒,我們的資料就快速增長,如果今天告訴你:「等長大一點比較聰明」,您會等到長大才開始學習嗎?這樣的決策本身「聰明」嗎?

現在的新創公司很強調「精益創業」,也就是推出一個最小可行性產品(MVP)來快速適應市場,並且不停優化,資料科學的實作精神也 強調先做出一個baseline,再慢慢針對問題優化。

所以別等了, 以前的市場可能就是做調研、專家訪談、客戶評鑑才開始研發產品,現在完全反過來了,先做再說,什麼客戶訪談、調查研究、更改UI、UX都是產品推出後一邊改一邊做的,計劃很重要,但是什麼都不做的計畫,就只是空談、無法落地的紙飛機。Airbnb甚至在只有5萬筆資料的時候就開始做商業應用的模型了,而且這是一個非常具有商業效益的專案,有興趣的人可以看這篇文,我覺得作者對機器學習在Airbnb的增長案例寫得很清楚。

四 、 專家才可以用機器學習

有些公司會將業務人員跟資料團隊分開,當然這樣做也有好處,人員可以更專業在報表的建立、數據指標一致性以及資料品管上,但這麼做其實是有風險的,就是資料人員無法透徹了解業務人員以及最近的第一手資料變動,導致「我早知道了,做什麼分析!」的尷尬情況。

我覺得,資料科學團隊就像是一個小團隊的數字顧問,出報表、協助分析、整理資料與資料品質的把控,都是一個小團隊必須配備的。

反過來說, 並不是只有專家才能用機器學習 ,一位業務人員也可以自告奮勇擔當「小資料科學家」,多練習量化分析與善用自己的業務知識梳理分析脈絡。另外在商品、品類管理層面的資料,其實不會到很大,可能用Excel、PowerBI或者Tableau就可以做一份很完整的分析了,所以多練習數據思維是比較重要的,而資料科學家就相反,多練習站在業務人員角度思考、不懂就提問會學習得快速一些。

有關資料科學團隊的組織架構並不是本文的重點,不過卻是企業在商業轉型上很重要的規劃,這個影響程度其實從企業併購也可以看出來,組織的人以及企業文化往往是最難磨合的,「轉型」就類似於內部的人事重整。

五 、 我還是不知道該怎麼開始

其實開始做一件事情之前,比較優先的事情就是 「思考自己的優勢在哪裡?」 ,結合感性一點的「喜歡這件事情嗎?」來做評估。喜歡在企業上也很重要,因為如果主管「不喜歡」,那其實很難做,不只思考優勢,全面一點我們也可以借用商管人士常用的SWOT分析(強弱危機分析):

  • 自己的優勢?(團隊有高手)
  • 弱勢?(不知如何結合)
  • 機會(但是同業中有成功案例,說明可以借鑑)
  • 威脅(同業的發展速度超乎想像,關鍵點是?)

分析完之後,我們可以截長補短,看看能不能做出一些改變。

那第一步,如果覺得專案太重、太龐大,怎麼辦呢?

我們來想想哦,如果今天自己的書房「太亂、太龐大」,不知道怎麼整理(過年大掃除)通常會怎麼辦呢?其實就是「從小到大」、「一塊一塊拼起來」,你總得收拾出一個「立足點」,挪出一塊空地讓自己做分類。

資料科學也一樣,既然做AI需要用到的就是「資料」,我們必須讓資料保持乾淨,維持資料的品質!

turned-on-white-laptop-computer-968631-1024x768
讓資料保持「整潔」,有助於AI學習。
圖片來源:

沒做好資料品管會發生什麼狀況?

以下這些案例是我有親自碰過的,笑笑就好:

程式跑一跑報錯,發現是 大小寫問題 (Lily變成lily,程式會當作不同人)、模型跑一跑Error,發現是 資料檔名或資料庫資料表存放位置不一致 、檔名不一致(比如8月的銷售資料可以叫做0826_sales,也可以叫826_sales、sales_826…..)、好不容易跑完模型,發現結果很驚人,一問之下是大家對 資料指標的定義不夠明確 ,比如財務報酬率有人用幾何報酬、有人用算數報酬,跑出來的金融模型看起來很賺錢卻是一個亂七八糟的東西………

其實這樣一想,我碰過的資料很多都被自己或者別人 搞髒 過(尤其剛開始在報表新手村的時候,犯過很多低級錯誤)。

雖然有回到raw data、從資料庫重新整理、撈資料的大絕招,但是這樣反覆重來,不只浪費時間,也會磨掉一些對數據的熱情(即使喜歡,碰到那麼大量的資料、數字、英文,其實長時間「反覆」做很底層的事情會讓資料分析師嘆氣的!)

所以,掌握資料品管真的很重要 , 建立乾淨的報表(數字正確、好看且容易傳達)、管理資料庫以及同仁取得資料方式(要簡單,但是不失資安),區分好資料庫架構(數據指標體系)、資料分類(比如電商的大型campaign通常就會獨立)、存儲方式,就是第一步該做的! 接下來就是利用前面產生的報表來試著利用數字做決策,不拍腦袋,善用數據告訴您的事情。

雖然以上部分看起來偏向「資料工程師」的工作,但其實也是早期「資料庫管理工程師」,現代「商業智慧」的專家在做的事情,為什麼我們講BI常常聯想到報表?因為沒有乾淨、嚴謹的資料管理,其實是難以產生有價值的Business intelligence的,更遑論做資訊管理以及建立知識圖譜呢!

那麼以上,就是這次的AI to business,管理者必須先體認到的五個迷思,其實還有許多細節可以補充,比如資料科學組織架構、角色分配、業務人員的量化訓練,這些留待以後分享,雖然自己的業界經驗不夠充分,但是我通常是綜合多本書、學校、業界、雜誌、專訪,結合自己的資料科學經驗與工作心得來得出一些洞察,並且產生出以上這些觀點,有什麼錯誤或者補充歡迎留言!

本文轉載自《medium.com

作者介紹 |

Dennis Dsh

分享