「數據交易」新時代來臨!利用異質數據發掘業務新契機

0
1358
圖片來源:Pixabay

近年來,數據作為企業的寶藏,其價值越來越受重視,但藉由企業間的「數據交換」或資料交易,取得異質數據或分析模型機制,則可以讓既有數據發揮更大的效益。本文將帶您一探「數據交換」這種新興業態的運作模式。

「數據交易」(Data Exchange),指的是企業將公司內部有價值的資料整理後成批出售,或是用購買、交換等機制從其他企業、一般使用者手中「有目的性地」獲取資料的過程。從賣方來說,數據交易可以將一部份非機密資料販售以獲得收入,而對買方來說,則可以用較自行收集更低的成本取得數據。

近幾年數據交易在海外逐漸風行,並催生出不少數據市集(Big Data Marketplace)。大部分交易可以從資料量體、數據品質、數據的即時性以及是否經過預處理等特徵,而有不同的計價或交換價值。例如大型數據市集入口網站 Datarade 上,就彙集了超過一千五百種數據交換的平台,包括不同產業的資料集(如醫療、行車、民生消費)、不同地域以及不同購買方式(如資料捆售、訂閱制或依用量計費)等方式進行數據販售。

而除了企業對企業間的相互販售、購買之外,有鑒於行動裝置、微經濟(Micro-finance)機制的發展,企業也更能夠「針對性」地和一般使用者進行數據交易,從使用者手中獲取更精確的特定產業數據。

下列案例說明了企業如何從漁民手中獲得「漁業數據」:菲律賓聯合銀行(Union Bank)和世界自然基金會(WWF)合作,利用開源數據平台 Streamr,開發漁業數據交換程式「Tracey」。漁民可以將當日捕撈的區域、漁獲量、魚種、海況等數據藉由「Tracey」上傳到 Streamr 數據市集,並由平台配對有需求的購買者(如大型餐廳、學術單位),漁民能夠在這些數據售出時獲得收入,而聯合銀行、WWF 則分別可以依捕撈數據決定貸款給漁民的金額,以及理解當地魚種的瀕危狀況,在多方得利的情形下,形成一組穩定的數據交換結構。

企業可利用數據交換協定App獲取所需的使用者數據。
圖片來源:楊智傑/資料來源:Streamr

大數據的價值有目共睹,然而在實務操作上,大數據往往必須實際到手,經過分析並運用後,才知道其真正價值。比如藝術品市場,在一般情況下便難以直接評估其數據的「客觀價值」,這也使數據交易經常不透明,甚或經常在黑市或暗網進行交易。一位不願具名的數據界人士指出,不少「數據掮客」就此應運而生──在數據保護意識或個資法遵相對薄弱的國家(如部分東南亞國家),以低價購買取得當地市場數據,並轉手販售予他國企業(如希望進軍東南亞市場的歐陸企業),賺取價差,也可以說是一種處於灰色地帶的「數據交換」仲介。

然而,許多時候即使企業掌握了數據,若沒有適當的分析模型,數據也無法發揮作用。Google 日前收購的 Kaggle,便是讓企業可以在其平台上提供數據與資金,由不同團隊競賽,提出演算法或數據模型。目前 Kaggle 平台上金額最高的比賽項目,為企業徵求團隊提出「預測肺功能衰退」的最佳數據分析模型,獎金達 55,000 美元(約新台幣 160 萬元),企業可以根據這些模型的準確度,給予團隊獎金並「買下」這些演算法,作為未來醫學預測使用。

此外,不同企業間的「數據疊合」(綜合分析兩種以上的數據集)也可能激發新的應用創意雛形。如台灣的 Datathon 2020 數據松 活動,就提供了三種數據集(天氣資料、電子發票消費資料、輿情資料),並規定參加者必須同時使用兩種不同的數據集,來發想新的應用。

就算不考慮跨企業的數據交換或交易,光是企業內「不同部門」間的數據疊合,都可能產生新的業務洞見。若決策者願意打破各部門孤立的數據單元/數據孤島(Data Silo),讓數據在跨部門、跨系統充分流通,將更有可能開啟新的數據應用想像。