本文轉載自《創新拿鐵》,作者為 Crystal

創新點:AI 已能根據簡單的文字指令來創作文字、圖片、影音、設計。原本做這些事的人怎麼辦?

2022 年末,網路上最受討論的,是一隻聊天機器人——「ChatGPT」。由美國人工智慧研究機構「OpenAI」發表,短短兩週內吸引了上百萬人使用。專家認為,「ChatGPT」的出現,跟智慧型手機、網際網路的出現一樣,將根深蒂固地改變人類的工作和生活。

「ChatGPT」的「生成式 AI」(Generative AI)技術,讓任何人都可以用簡單的自然對話(而非程式語言),指揮 AI 創作各種內容。

什麼是「生成式 AI」?如何爆紅?目前有哪些應用?而人類在 AI 創作時代如何「另謀高就」?

這篇文章的首圖是我用 AI 繪圖工具「Stable Diffusion」完成的,而文字是由我和「ChatGPT」一起完成。猜得出哪些是 AI 寫的?哪些是真人寫的嗎?謎底在文章最後揭曉。

「生成式 AI」的發展歷程

生成式 AI,是指讓「機器學習模型」研究類似作品的數據,然後去創造一個全新的作品,可以是文字、圖像、音訊檔、影片、程式碼、甚至建築設計。過去七年,Google、Meta 等科技巨頭、以及微軟投資的 OpenAI,都在打造 Generative AI 的「語言模型」(Language Model)。這三家先驅者用大量電腦運算能力和數據「訓練」這些「語言模型」,讓它們能自己創作內容。訓練過程,可分成三個階段:

A. 萌芽期(2015 年之前)

只有小型模型。這些模型在「數據分析」上表現出色,如預測外送抵達時間、詐騙訊息分類…等。但在模仿人類語言的「內容創作」上並不及格,無法像真人一般寫作、寫程式、畫圖。

B. 突破期(2015 年至 2022 年)

2017 年,Google Research 發表「Transformer 模型」,是自然語言運算(Natural Language Processing, NLP)領域的里程碑。Transformer 模型需要被訓練的時間比以往少,產出的品質卻大幅提高,並且容易針對各應用領域的需求客製化。(詳細可參考維基百科之介紹)

如 Google 開發出 BERT、LaMDA。Meta 開發的 OPT-175B、BlenderBot。微軟投資的 OpenAI 開發出 GPT-3(用於文字)、DALL-E2(用於繪圖)、Whisper(用於語音辨識)。

為什麼都是富可敵國的大公司?因為訓練這些模型的成本很高。

例如,GPT-3 最初在 45TB 的數據上進行訓練、運用了高達 1,750 億個參數來預測結果,單次訓練就要 1,200 萬美元。中國的悟道預訓練模型,則使用了 1.75 兆個參數進行訓練,動員了清華大學、北京大學、中國科學院等機構的資源。

2015 年到 2020 年之間,訓練這些模型的計算量增加了六個數量級,使得這些模型能夠以近乎、甚至超越人類的水平,來執行任務。

只不過在這個階段,這些模型並未進入大眾視野。因為他們需要龐大資源才能運轉,成本也還沒降低到可以供大眾在雲端使用。

C. 業界落地期(2022 年~)

隨著電腦運算成本降低、新技術如擴散模型(Diffusion Model)出現,訓練和營運行逐漸降低。Google 等公司陸續公開這些模型,讓開發者可以試用。

當核心的生成模型被訓練出來後,不用太大量的數據,就可依據各領域進行客製化調整。於是 Google 開發的 BERT 便有專注生醫領域的模型 BioBERT、法律領域的模型 Legal-BERT。這讓很多專業人士也開始試用。

然後在 2022 年,生成式 AI 在一般大眾之間爆紅。

文字影音等多種內容,AI 都可以做得比人更好

2022 年,生成式 AI 出現了殺手級應用,讓一般大眾開始使用。如繪圖領域的 Midjourney、Stable Diffusion、DALL·E2,以及聊天機器人 ChatGPT。

同時,先驅者公開它們的語言模型(如 OpenAI 開放 GPT-3),讓新創公司省掉耗費金錢和時間的訓練階段,直接在各專業領域推出應用產品。

這些新創涵蓋的範圍,不僅是透過文字生成文字、圖片、聲音、程式、音樂、影像、3D、NFT,甚至可以反向操作,用語音生成文字(如逐字稿應用)、圖片生成圖片(如快速去背、圖像編輯)、連結生成文字(如快速擷取 url 網頁內文產出腳本)、影片生成影片(如從會議影片快速生成部落格文章、推特推文、精彩花絮..等等)。這裡有網友整理出的生成式 AI 的各類型應用。

以商機龐大的行銷產業為例,生成式 AI 的商業應用潛力已經相當驚人。

從部落格文章撰寫、SEO 優化、影片編輯、社群行銷文案產生、廣告素材生成…等,全部有 AI 可幫你代勞。各賽道都塞滿競爭者:

部落格文章點子產生器: Hubspot Blog Ideas Generator, Portent Idea Generator
部落格文章、社群貼文、email文案、SEO 優化內容產生器: Jasper, Writesonic, TextCortex
文字生成廣告素材圖片: Memorable
文字生成行銷影片: Synthesia, Movio

從點子發想,到實際撰寫內容、拍攝圖片、拍攝影片,如今生成各式各樣的行銷素材,都可以坐在電腦前面一鍵完成。不需抓耳撓腮、腸枯思竭,也不必為了打光跑進跑出,NG 重來數遍。

美國已有許多公司開始採用這類的 AI 工具。如雲端運算大廠 VMWare 的內容行銷人員,就運用 Japser 產出行銷郵件內容、廣告文案、社群內容。當 AI 已經可以執行大部分的寫作任務時,寫手就可以專注於尋找更好的寫作題材、研究內容方向、制定內容策略方向。這種跟 AI 玩「大風吹,換位子」的現象,已經在大企業發生。

另外,如摩根士丹利(Morgan Stanley)銀行也透過 GPT-3,來為客戶創造客製化金融內容。由真人用特定字眼來「提示」(prompt)AI,然後由 AI 創造初稿,然後再由真人來編輯、審稿。

行銷領域,只是生成式 AI 應用的冰山一角。根據美國知名創投公司——紅杉資本(Sequoia Capital)的分析,生成式 AI 也可用於自動創作程式語言、藝術作品、遊戲、產品設計等。

AI 百花齊放,人類何去何從?大風吹之後,還有我們的位子嗎?

AI 創作時代,人類如何「換位子」?

當生成式 AI 產出可以大量、快速、客製化創作優質內容,人類的價值何在?

幾個趨勢已經注定「回不去」了:

1. AI 將成為多數「功能性」內容撰寫的主力

這類內容有明確架構、重複性高,目的在於傳遞訊息、提供清晰、必要的說明。不需傳達個人風格、品牌、形象。不需感性或闡釋。例如促銷訊息、折扣碼說明、產品說明書、社群貼文、教育訓練影片、廣告企劃案、研究報告、白皮書、業務企劃書、說明書,

這些內容都可以透過 AI 工具快速做出草稿,微調後即可發送。也就是說,行銷、業務、營運、客服都能透過AI節省大量人力。換句話說,在這領域,AI最容易取代人類的價值。

2. 把 AI 當手,人類當腦

內容人才的價值已經不在於「寫」,而在於捕捉市場趨勢、時事動態、客戶心態,制定最符合當下時空背景的內容策略。目前的 AI 雖然能高效產出內容,但還無法分析受關注的時事議題、市場趨勢,找出可切入的內容策略。另外,AI 也還無法同理、模擬客戶的心理,也不能推測客戶可能會想看的文章。AI 也還無法統整公司內部的資料庫,從中挖掘有價值的主題產製成內容。進入 AI 創作時代,人類的最大勝算是換位子當大腦,把手的工作都讓給 AI。

3. 洞悉觀賞者的情緒與需求,才能在新的內容混戰中殺出血路

生成式 AI 加速了內容產製,會讓內容更為氾濫。亂軍中,能吸引到眼球的內容,有可能在於內容更緊貼時事、更迎合觀賞者的心理狀態,更能貼近社會上瀰漫的各種情緒,或更具備個人獨特的風格與特色。

生成式 AI 還在以兇猛的態勢發展——2022 年爆紅,2023 年將預計將多點開花。生成式 AI 的「軍火供應商」——OpenAI,因 ChatGPT 一夕爆紅。據傳將得到微軟新一輪高達 100 億美元的融資,讓公司估值高達的 290 億美元。微軟看好無數的第三方公司將可透過 OpenAI 的 API 打造全新應用服務,用 AI 改變商業運作流程。

AI 創作引領的新時代就在眼前。或許我們害怕的是,這一切都才剛開始而已。

*謎底揭曉:這篇文章的第一和第二點,有很多事實的陳述,是我引導「ChatGPT」寫下初稿。但機器人的初稿過度複雜專業,我考量《創新拿鐵》讀者的屬性,大幅簡化。這篇的第三點則是挖掘洞見和預測趨勢,則完全靠我自己。這種合作模式,未來可能適用於所有內容的製作。

參考資料

1.How Generative AI Is Changing Creative Work
2.Generative AI: A Creative New World
3.What’s New in Artificial Intelligence from the 2022 Gartner Hype Cycle

作者介紹 |

創新拿鐵

《創新拿鐵》 (Start Up Latte) 由作家、「夢想學校」創辦人王文華發起。分析全球的企業創新和新創公司,把他們的做法歸納成個人可應用的「創新能力」、「創業能力」、「職場能力」、「人生能力」。啟發讀者「四」項全能,打造拿鐵般濃郁、香醇的人生。
更多創新案例:https://startuplatte.com/

分享