時隔一年半,OpenAI 再次帶來更強大的 AI 繪圖模型,率先揭露了第三代 Dall-E(後稱 Dall-E 3)的早期版本,不僅生成內容的準確度比以往模型更高,還能與 ChatGPT 結合,自動化雕琢出更精細複雜的圖像,預計今年 10 月登場。

Dall-E 3 串連 ChatGPT,給「提示詞」更簡單

AI 能夠生成的圖像包羅萬象,從動漫風格的角色、寫實的照片到到奇幻似夢的恢宏場景都可以輕易打造,但要求用戶給予 AI 精確的「提示詞」,以 AI 有辦法理解的方式描述你所想要的場景與元素。

然而如何給出精準、有效的提示詞可是一門學問,自去年 AI 浪潮興起後,「提示工程」(prompt engineering )甚至成為了一種專業,根據《彭博社》報導,有公司甚至為提示工程師開出高達 37.5 萬美元(約新台幣 1,200 萬元)的高額年薪。

OpenAI推出了第三代圖像生成AI服務Dall-E 3,能與ChatGPT連結更簡單給予提示詞。

但這次發表的 Dall-E 3 則結合了 ChatGPT,把給予提示詞變得更簡單,用戶在給完所需的提示詞後,ChatGPT 便會將其改寫為更富有描述的段落,讓 Dall-E 3 能夠更好消化用戶的要求,進而生成符合提示詞的圖像。

儘管連結 ChatGPT 已經足以令人雙眼為之一亮,這並不是 Dall-E 3 唯一的更新內容,這個版本還能夠生成更為精準、更高品質的圖像。

「不會畫手」長久以來一直是圖像生成 AI 的罩門,這個弱點也成為人們區分一張圖是人類還是 AI 所畫的辨別方法,而 OpenAI 表示,雖然稱不上完美,Dall-E 3 在手指及文字等圖像 AI 常常出問題的地方較舊版本表現更好。

OpenAI 計畫今年 10 月率先為 ChatGPT Plus 及 ChatGPT Enterprise 的付費用戶提供 Dall-E 3,同時聲稱今年秋季也會提供給研究室和 API 的客戶使用,至於一般免費用戶何時可以使用 Dall-E 3,則還沒有對外公佈。

擔憂訴訟威脅?Dall-E 禁止用戶生成當代藝術家風格作品

在推出 Dall-E 3 的同時,OpenAI 還更新了安全措施,防範有心人士利用 AI 繪圖生成情色或仇恨圖片,也無法生成包含特定公眾人物的內容,並且特意與外部團隊合作,尋找系統是否有漏洞可以繞過他們設置的安全措施。

同時可能為了避免著作權上的爭議,Dall-E 3 不允許用戶要求生成特定當代藝術家風格的作品,並開放藝術家申報自己的作品,要求不被用於未來新版本 AI 模型的訓練。

OpenAI在2022年4月宣佈了Dall-E 2,時隔一年半後的現在也宣佈了能連結ChatGPT的新版本。

自生成式 AI 爆發熱潮開始,創作者對 AI 公司擅用作品的抗議從未停歇,先前就有多位藝術家向 Stability AI、Midjourney、DeviantArt 等 AI 公司發起集體訴訟,指控這些平台利用受版權保護作品訓練 AI 模型。儘管並非圖像方面,OpenAI 近日也被《冰與火之歌》作者喬治.RR.馬丁為首的 17 位創作者控告「大規模竊盜」他們的作品。

OpenAI 推出 Dall-E 3 的此刻,AI 繪圖服務競爭也逐漸白熱化,Midjourney、Stable Diffusion 等對手都喊出超過千萬用戶的成績,Dall-E 若想在競爭中脫穎而出,加快完善服務的腳步或許已成 OpenAI 眼下關鍵任務。

資料來源:The VergeWiredAxios

(本文轉載自《數位時代》)

作者介紹 |

數位時代

1999年開始以雜誌型態出發,聚焦科技財經領域的「新趨勢、新觀念、新人物和新商業模式」的報導。現今已成為橫跨平面與數位載體、結合內容與社群聚集、並且提供知識學習服務的科技媒體品牌;繼續為讀者尋找新經濟的下一個關鍵,為下一步發展預作準備。

分享