連續幾個月下來,AI 應用高速進展,這波 ChatGPT 浪潮掀起了許多討論,有關於 Google、微軟兩巨頭的競爭,也有各派探討 AI 倫理的議題。除此之外,也有許多人意識到,在可見的未來裡,「詠唱術」或者說「使用 AI 的技術」,將成為工作者所必備的軟實力,其中令人興奮的正是看到許多團隊開發衍生的各種應用,而如何將這些工具應用在自己的日常中,是另一個有趣的話題。

為了不落人後,我用半個月的時間,實測了多款各網路大神無私分享的工具,結合自身使用體驗,整理了以下 6 款推薦應用!

ChatGPT 指令大全〉教小白下提示詞

首先,對於初試 AI 工具的小白如我,如何給予正確指令(prompt),是一個初學者必備的基礎技能,「ChatGPT 指令大全」網站,提供不同種類的指令範本,包括資料整理、履歷與自傳、程式開發、面試準備、英語學習等,開放使用者複製範本後簡單填空使用,幫助你更精準地指示 AI 為你提供服務。

例如,想請 ChatGPT 擬一篇關於內容編輯可採用的 SEO 策略文章草稿,參考指令範本輸入如下:

撰寫一篇文章題目為:「內容網站編輯可以採用的SEO策略(主題)」的草稿,結構需要完整。草稿中要包含5(數字) 個可以在內文中進一步闡述的要點。

在我輸入上述指令後,ChatGPT 於 1 分鐘內擬好了帶有 5 大重點的 SEO 策略架構,且幾個關鍵項目都有提及並納入大綱中,確實可以快速地提供正在苦思文章結構的人,一個可參考的寫作方向。

chatgpt指令大全
chatgpt指令大全具備多種不同的指令範本,從寫履歷、程式開發都能幫助使用者在寫作時的參考方向。
圖片來源:

Chat YouTube〉免看影片也能問摘要

第二個實用工具是「Chat YouTube」,協助使用者快速摘要影片內容重點。只要將影片網址貼入,AI 就會消化影片內容,開放使用者以提問的方式掌握影片要點。

例如,我將《雪力的心理學筆記》「MBTI 16 種人格類型解說系列之 ENTJ 特輯」這支約 20 分鐘的影片連結,貼入 Chat YouTube,不到 3 分鐘的時間後,先摘要整理了影片重點,並開放提問,於是我接著提問關於:「ENTJ 型人格的特色」、「ENTJ 型人格如何良好發展」等,Chat YouTube 接著以明快、簡潔的方式,為我列出幾大重點回應,可以幫助使用者快速掌握想從影片獲知的訊息。

不過,目前 Chat YouTube 還有 2 個不足之處。一是沒有字幕的影片無法使用。在以《雪力的心理學筆記》影片測試前,我先丟了一支吳叡人教授《雷震講座|帝國夾縫中的台灣民主》講座影片,但由於該片為實體講座側錄,且沒有後製字幕,因此 Chat YouTube 就無法作業。而第二個美中不足在於語言。

雖然以繁體中文影片測試且提問皆使用中文,但 Chat YouTube 仍以英文介面為主,一開始的重點摘要以英文呈現,而問答回應顯示,系統是可理解繁體中文語意並有效摘要重點回應的,只是它提供的回應有時還是會以英文呈現,有時則以簡體中文回應,較不直覺。

Chat YouTube-1.png
Chat YouTube只要將影片網址貼入,AI就會消化影片內容,開放使用者以提問的方式掌握影片要點。
圖片來源:

Chat with any PDF〉濃縮文件 3 亮點

另一個與 Chat YouTube 異曲同工的「Chat with any PDF」,使用情境與方式大致與 Chat YouTube 相同,將任何 PDF 文件上傳後,Chat with any PDF 將消化整理出文件重點,並歸納文件可回應的 3 個主要問題,幫助使用者快速提問、掌握文件主要內容。

實際測試,將工作上使用的 sales kit 與產品提案簡報上傳後,雖是圖文並茂的文件檔案,仍可以掌握文件內的重點摘要。不過當我上傳一篇演講稿,不確定是否因為文字量或內容屬性,Chat with any PDF 開始以英文回應,不過英文摘要的內容大致仍為正確資訊。

另外是 Chat with any PDF 有免費版跟付費版的差異,免費版一天的使用上限為 3 份 PDF 檔案,且頁數不能超過 120 頁,單一檔案大小不超過 10MB,且一天最多只能詢問 50 個問題。

Chat with any PDF.png
圖片來源:

Good Tape〉音檔轉逐字稿神器

「Good Tape」是這批試用工具中最愛的一款。使用 OpenAI 旗下 Whisper 技術,Good Tape 是支援英文、中文、日文、韓文、德文、法文、丹麥文等超過 40 種語言的逐字稿工具。開發團隊為丹麥的數位媒體 Zetland,可說是一款專為記者打造的服務。

雖是專為記者打造,但實際上 Podcast 製作、影片創作者乃至行銷工作者如我,都用得上這款工具,只要將音檔上傳,等待數分鐘後,就會產出逐字稿,且可選擇加上 timecode 版、無 timecode 版及字幕版 3 種文件格式下載。

實測 50 分鐘採訪錄音檔,正確率約落在 7 至 8 成之間,相較過去使用過的逐字稿工具是高得多的,甚至在音檔內容提到書或作品時,還會自行加上書名號。不過免費註冊登入後,每月有3支音檔轉錄的使用上限,每個檔案最長 90 分鐘,且系統較忙碌時需要等候。不過整體使用體驗非常好,還可以將逐字稿丟進 ChatGPT 中校稿、重點摘要,大幅降低整理逐字稿的時間。

Good Tape
Good Tape 為 OpenAI 旗下技術,只要上傳音檔就能產生逐字稿,大幅降低個人聽打文件所需的工作時間。
圖片來源:

Jitter〉無痛製作宣傳動畫

Jitter」這款動畫生成工具,擁有多樣動畫模板,類型涵蓋廣告、社群、logo、UI 設計等,選擇合適模板後進入編輯模式,僅需以類似 PowerPoint 動畫設定的操作模式進行簡單編輯,即可產出符合需求的動畫效果。

最初接觸這項工具,立刻想到的一個使用情境,就是產出社群宣傳的動態素材時。

以想要宣傳一檔即將上線的新節目為例,想在 Instagram 限時動態做一個簡易的宣告素材,使用 Jitter 提供的 iOS 手機訊息通知模板,編輯調整想要的文案與素材後,像是改掉背景圖、將傳訊人改為節目主持人、訊息文字改為節目開播宣告,且連訊息的 icon 也可以調整為 LINE 或是自家 App 的 icon 等,最後匯出等待,即可生成一支動畫短片。

Jitter01.png
Jitter擁有多樣動畫模板,類型涵蓋廣告、社群、logo、UI設計等,僅需以類似PowerPoint動畫設定的操作模式進行簡單編輯,即可產出符合需求的動畫效果。
圖片來源:

D-ID〉仿真人拍片活化文字

簡而言之,「D-ID」是一款 AI 合成影片工具。免費註冊登入後,只要上傳錄音檔或是鍵入台詞,再選擇希望呈現在的人物形象與人聲,即可製作擬真的人像影片。

D-ID 開放使用者選擇的人像,包含真實人物以及 AI 生成的虛擬角色,同時也開放使用者上傳圖片。設想最適合應用的情境,是將各種生硬文字資訊轉化為動態呈現,例如將官網的常見問題集(FAQ)製作成由專人為客戶說明的影片、新進員工教育訓練影片、新聞播報等。

事實上 D-ID 製作出來的影片,還是看得出來是 AI 合成的產物,無法做到真正的自然,但之所以吸引我,是因為這是少數支援中文的影片生成工具,台詞可以輸入中文來製作影片,且有3種人物語音可選擇。

儘管嘴形、動態表現及語音自然度都未臻完美,但已可針對特定使用情境,提供更簡便的影片生成方法。另外,也可拿來做網路迷因(meme)短片,例如用特定人物角色搭配趣味台詞等,當然這必須是在不涉及違法與侵犯個人權益的前提下。

 D-ID
AI 合成影片工具 D-ID 可將文字資訊轉為動態影片,還能選擇人 物形象及人聲,為使用者打造合適的應用情境。
圖片來源:

在整理這篇工具文之後,我歸納一個小小心得: 想透過這些工具來大幅提升生產力,還有一段距離。

事實上,為寫本文,前後實測數十款工具,其中被捨棄、不推薦的服務占了大半,理由並非它們難用,而是目前許多工具仍以英文為主,尚未支援中文,不符合平日的使用需求,像是 email 回信草擬工具,又或是 PowerPoint 生成工具等,功能是令人興奮、期待的,但暫且難以應用在我的日常生活。

另一方面,各種服務雖然多少都有令人眼睛為之一亮的效果,但畢竟現在尚處早期發展階段,許多應用仍停留在「小工具」的水準,有時甚至會需要多款工具複合式地搭配使用,才能真正有感地提高效率,而類似情形會讓人止步於嘗鮮,而未能進一步對工具產生黏著度。

不過,老派且一路讀文組的我,仍在實測中,深刻感受到未來相關應用的無限潛力,也讓我警覺,需要及早開始思考如何善用這些工具,優化自己的工作流程,相信未來這種系統性、整合性的思維,會成為每一個工作者的課題。

數位工具的大海真的是既深且廣,然而只要有緣遇上一款真正能幫助到自己的應用,接下來與那工具相伴的時光,可能是比世間任何關係都還要綿長、緊密的,這樣的邂逅實是不亞於與真命天子相遇的喜悅,期待在這個AI工具百花齊放的時代,每個人都能遇上幾個這樣的「夥伴」。

本文轉載自《數位時代

未來商務頻道「AI解方雜貨店」新開張!
立即訂閱 AI 趨勢電子報,掌握 AI 商務應用與趨勢>>https://bit.ly/3NH5244

作者介紹 |

數位時代

1999年開始以雜誌型態出發,聚焦科技財經領域的「新趨勢、新觀念、新人物和新商業模式」的報導。現今已成為橫跨平面與數位載體、結合內容與社群聚集、並且提供知識學習服務的科技媒體品牌;繼續為讀者尋找新經濟的下一個關鍵,為下一步發展預作準備。

分享