最火熱的AI應用:NLP在含金量最高的2個產業率先發光!

0
7902
圖片來源:Bill Oxford on Unsplash

在人工智慧的發展中,說、聽、寫和理解人類語言可說是劃時代的里程碑,也許現階段的AI聽不出你話中有梗,但卻能幫你秒查合約內容,自然語言處理技術(Natural Language Processing,NLP)讓AI成為法務人員的三頭六臂,同時也在BFSI金融領域大顯身手,過往難以處理的非結構資料,現在都可以進一步分析處理,大幅提升數據變現的商用價值。

讓電腦開始聽懂人話的自然語言處理(Natural Language Processing,NLP)是近幾年成長最迅速的AI應用,卻也是最具挑戰性的研究領域之一。電腦可能很擅長數學運算,但是,要把涉及語音和文本的語言問題轉換成數學公式,再根據所提取的含義做出回應,甚至是讓AI理解文字中的多重語意,進一步分析人類的感情和情緒去「讀空氣」,想像人類一樣進行有意義的對話,電腦才剛取得初步的進展,還有很長的路要走。

2019年9月,Allen Institute for Artificial Intelligence(AI2)以一個名為Aristo的人工智慧系統通過美國八年級的科學檢測,在選擇題上的正確率達到90%,在12年級測驗中的得分則超過80%。這成績在人類眼中看似平凡,但是,對電腦來說卻不是件容易的事,在此之前,AI模型在同一科學測試中的答題正確率不及60%,顯見Aristo的進步。

NLP技術發展在2013年取得第一階段突破:Word2Vec演算法不僅能自動讀取龐大的文本資料庫,還能了解數據資料中所有單詞間的關聯和關係模式。然而Word2Vec並不是真正「理解」文本,而是在單詞間尋找關聯性,在機器翻譯、問題解答和情感分析上提供較為準確的結果。

2018年初出現的ELMo(Embeddings from Language Models)能夠依據單字出現的上下文來判斷這個字句的意涵,辨別出該單字用在不同地方時分別代表的意義。2018年下半Google自然語言訓練模型BERT的問世,更是帶來NLP的重大進展,在深度學習的加持下,除了上下文功能,有別於傳統方法只看文本的格式,BERT特別能理解單字背後的含義、語義和意圖,以更趨近人類的自然語氣回覆。

不可否認,當AI語言模型可以在其文本資料庫中找到顯著答案時,它們回答問題又快又準,然而當它們需要推理和常識時,回答則常是牛頭不對馬嘴。神經網絡是深度學習演算法的核心,是極為複雜的數學函數,擅長對訊息進行分類,以當代的AI來看,基於深度學習的語言模型仍透過「統計」和「單字序列比較」來執行任務。問題是,書面文字中的許多含義,是從單詞中未明確提及的抽象概念和背景知識中推斷出來的。電腦想要找出書面文字和口頭語言的微妙性,尤其是隱含的多重語義更為困難,通常「讀不出」字句中隱藏的嘲諷或惡意,因為AI更適用於搜尋資料和查找數據模式。也就是說,AI可能聽不懂你的「話中有梗」,但它可以在幾秒鐘內看出合約內容是否正確。

自然語言處理市場規模達229億美元

每天早上Alexa或Siri準時喚醒我們,提醒你當天的待辦事項,線上客服窗口幾乎都是由聊天機器人來回答,Google翻譯能夠協助你理解超過100種的世界語言,垃圾郵件的辨識篩選,郵件發送前的拼字檢查等等,各式各樣的NLP應用開始環繞在我們的日常生活中。

根據P&S Intelligence最新的預測顯示,自然語言處理市場的產值將在2024年達到229億美元的規模,2019到2024的年複合成長率將達到19.7%。

以2018年來看,由於金融服務供應商紛紛採用NLP解決方案來分析手上大量的非結構化數據,使得BFSI(Banking、Financial Services and Insurance)創造出最大的市場產值,而這股NLP風潮正在吹往與金融圈息息相關的法律產業。

事實上,在社會科學中,法律是最接近「形式邏輯(Formal Logic)」的系統之一。法律判決通常依據當前的法律條文與過去的判決先例,「引經據典」來判斷當下的特定事實,並藉此得出結論,這種演繹推理與機器學習的養成有著異曲同工之妙,讓法律在許多方面特別有利於AI和機器學習的應用,可以說是一拍即合,以非常相似的原理運作:兩者都需要參考歷史案例,來推斷是否適用於新情況的規則。

因此在法律科技領域中,幾個NLP應用已經取得了鼓舞人心的進展。

一、合約審查

合約是整個經濟體系的命脈,業務交易皆仰賴合約來完成,合同起草與簽訂之間的過程卻是低效率和耗精力的最大黑洞。自然語言處理技術能幫助律師事務所更快速地處理文件,並非取代律師,而是提供高達數百頁或數千頁的情報和分析,增加效率並節省成本。

一般來說,企業內的法律團隊透過手工來審閱、編輯和交換標註紅色記號的書面合約已然不合時宜,不僅容易發生人為錯誤,也讓企業的競爭力葬送在曠日廢時又繁瑣的合約流程中。在美國不少新創公司開發出自動擬議合約的AI系統,並透過NLP技術來確認合約中哪些部分是可以接受的,哪些是有問題需要修改的,包括Salesforce、eBay和Home Depot等這類大型企業將AI驅動的合約審查服務,納入日常營運中。

圖片來源:Helloquence on Unsplash

二、合約搜尋與分析識讀

儘管幾經往來談判後,合約終於塵埃落定,確實遵守約定條款的權利和義務才是麻煩的開始,大型企業通常擁有數以萬計的「進行中」合約,隱藏在檔案室和資料庫的黑暗角落中,其中還有牽涉到為數不少、包括跨部門的員工、合作廠商、客戶、交易對手等的「關係人」。

不論組織規模或大或小,對合約關係細節的理解與執行都是很大挑戰,所謂NLP解決方案可以提取公司所有合約中的關鍵訊息,並將其「上下文化」,讓企業中的利益相關者都可以直接了解合約中業務承諾的性質與內容。

大多數企業的合約環境,仍處於孤立而不被理解的狀態,這類NLP解決方案讓合約的權利義務更為透明,像是行銷團隊可以更輕鬆地追踪合約續訂的週期與時間,更敏捷的進貨或追加銷售。採購團隊可以掌握合約的詳細資訊,並在必要時隨即重新談判或更新合約,稽核團隊可以全面了解公司的活動以達到法規遵循的目的。

三、訴訟預測

去年9月,清華大學的跨領域研究團隊發表了一個協助家事判決預測的AI系統,只需輸入夫妻雙方有利與不利的條件,就可預測在離婚官司中,誰能取得小孩的監護權,準確率居然高達九成以上。這些AI團隊正在利用相關判例的語料和先例的輸入做為「特定事實模型」,作為預測未決案例的依據。機器學習讓這些預測越加準確,企業或律師事務所開始使用這類預測系統來主動規劃訴訟策略,找出可以快速進行或和解談判的案子,能有效的減少實際需要審理的案件數量。

發表評論

請輸入您的評論!
請在這裡輸入您的名字