時隔一年半,OpenAI 再次帶來更強大的 AI 繪圖模型,率先揭露了第三代 Dall-E(後稱 Dall-E 3)的早期版本,不僅生成內容的準確度比以往模型更高,還能與 ChatGPT 結合,自動化雕琢出更精細複雜的圖像,預計今年 10 月登場。
Dall-E 3 串連 ChatGPT,給「提示詞」更簡單
AI 能夠生成的圖像包羅萬象,從動漫風格的角色、寫實的照片到到奇幻似夢的恢宏場景都可以輕易打造,但要求用戶給予 AI 精確的「提示詞」,以 AI 有辦法理解的方式描述你所想要的場景與元素。
然而如何給出精準、有效的提示詞可是一門學問,自去年 AI 浪潮興起後,「提示工程」(prompt engineering )甚至成為了一種專業,根據《彭博社》報導,有公司甚至為提示工程師開出高達 37.5 萬美元(約新台幣 1,200 萬元)的高額年薪。
但這次發表的 Dall-E 3 則結合了 ChatGPT,把給予提示詞變得更簡單,用戶在給完所需的提示詞後,ChatGPT 便會將其改寫為更富有描述的段落,讓 Dall-E 3 能夠更好消化用戶的要求,進而生成符合提示詞的圖像。
儘管連結 ChatGPT 已經足以令人雙眼為之一亮,這並不是 Dall-E 3 唯一的更新內容,這個版本還能夠生成更為精準、更高品質的圖像。
「不會畫手」長久以來一直是圖像生成 AI 的罩門,這個弱點也成為人們區分一張圖是人類還是 AI 所畫的辨別方法,而 OpenAI 表示,雖然稱不上完美,Dall-E 3 在手指及文字等圖像 AI 常常出問題的地方較舊版本表現更好。
OpenAI 計畫今年 10 月率先為 ChatGPT Plus 及 ChatGPT Enterprise 的付費用戶提供 Dall-E 3,同時聲稱今年秋季也會提供給研究室和 API 的客戶使用,至於一般免費用戶何時可以使用 Dall-E 3,則還沒有對外公佈。
擔憂訴訟威脅?Dall-E 禁止用戶生成當代藝術家風格作品
在推出 Dall-E 3 的同時,OpenAI 還更新了安全措施,防範有心人士利用 AI 繪圖生成情色或仇恨圖片,也無法生成包含特定公眾人物的內容,並且特意與外部團隊合作,尋找系統是否有漏洞可以繞過他們設置的安全措施。
同時可能為了避免著作權上的爭議,Dall-E 3 不允許用戶要求生成特定當代藝術家風格的作品,並開放藝術家申報自己的作品,要求不被用於未來新版本 AI 模型的訓練。
自生成式 AI 爆發熱潮開始,創作者對 AI 公司擅用作品的抗議從未停歇,先前就有多位藝術家向 Stability AI、Midjourney、DeviantArt 等 AI 公司發起集體訴訟,指控這些平台利用受版權保護作品訓練 AI 模型。儘管並非圖像方面,OpenAI 近日也被《冰與火之歌》作者喬治.RR.馬丁為首的 17 位創作者控告「大規模竊盜」他們的作品。
OpenAI 推出 Dall-E 3 的此刻,AI 繪圖服務競爭也逐漸白熱化,Midjourney、Stable Diffusion 等對手都喊出超過千萬用戶的成績,Dall-E 若想在競爭中脫穎而出,加快完善服務的腳步或許已成 OpenAI 眼下關鍵任務。
(本文轉載自《數位時代》)