博客專欄

EEPW首頁(yè) > 博客 > 我給梵高當(dāng)Tony:這三款A(yù)I繪圖工具,就離譜

我給梵高當(dāng)Tony:這三款A(yù)I繪圖工具,就離譜

發(fā)布人:大數(shù)據(jù)文摘 時(shí)間:2022-06-19 來(lái)源:工程師 發(fā)布文章

大數(shù)據(jù)文摘授權(quán)轉(zhuǎn)載自果殼

作者:Simon_阿文

編輯:biu


很多人說(shuō)今年是“AI 繪畫(huà)元年”。先是 Disco Diffusion 火出了圈,從 Text-to-Image(用文字生成圖像)開(kāi)發(fā)社區(qū)和創(chuàng)意設(shè)計(jì)行業(yè),火到了普通人的視野中。


人們熱衷將兩種完全不搭界的對(duì)象,比如“達(dá)芬奇”和“iPhone”字樣,輸入 AI 程序,然后等著畫(huà)面層層渲染完成。


圖片

又比如,我就把荷包蛋揉進(jìn)了云朵里丨作者用 Disco Diffusion 生成


那是一種“拆盲盒”般的體驗(yàn)。對(duì)于沒(méi)有任何美術(shù)基礎(chǔ)和繪畫(huà)能力的人來(lái)說(shuō),AI 的“融梗”圖大多足夠驚艷,即便效果“翻車(chē)”,也能通過(guò)調(diào)整描述詞繼續(xù)優(yōu)化。


緊接著,AI 繪畫(huà)工具 Midjourney 也火了。和 Disco Diffusion 滿屏英文和代碼的簡(jiǎn)陋界面不同,Midjourney 直接搭載在 Discord 頻道上,輸入指令的過(guò)程和給人發(fā)微信沒(méi)什么不同,更讓人吃驚的是,它生成畫(huà)作的時(shí)間一般在 60 秒左右。


圖片

神說(shuō):“要有 Wi-Fi”丨作者用 DALL·E 2 生成


然后,OpenAI 的 DALL·E 2 半途殺出,和前兩者擅長(zhǎng)“概念畫(huà)風(fēng)”不同,DALL·E 2 更“寫(xiě)實(shí)”,60 秒不到可以生成 10 張圖,不滿意還可以擦去局部重新生成……短短幾個(gè)月,“最強(qiáng) AI 畫(huà)師”的稱號(hào)幾次易主。


谷歌也坐不住,五月底發(fā)論文介紹自家選手——Imagen,直接叫板 DALL·E 2,號(hào)稱 Imagen 有“前所未有的寫(xiě)實(shí)感和深度的語(yǔ)言理解”,目前暫未開(kāi)放。


這兩個(gè)月來(lái),我和前面三位“AI 畫(huà)師”頻繁打交道,幾乎每天都在測(cè)試描述詞、調(diào)教機(jī)器人,踩了很多坑,翻了不少車(chē)。但與此同時(shí),我收獲了不少杰作。


這次,我將對(duì)比它們的畫(huà)作生成特點(diǎn)、用戶友好度等方面,同時(shí)整理好了它們的****,以及一些簡(jiǎn)單的操作方法。


在普通用戶那里,它們是具像化想象的得力工具;在專業(yè)人群那里,如果將它們和其他工具聯(lián)動(dòng)起來(lái),能有無(wú)窮盡的想象空間。


Disco Diffusion:生成圖的藝術(shù)性最高


圖片

使用入口:

https://colab.research.google.com/github/alembics/disco-diffusion/blob/main/Disco_Diffusion.ipynb


Disco Diffusion 生成畫(huà)作的流程大概分為這幾步:打開(kāi)程序;設(shè)置圖片尺寸、過(guò)程圖張數(shù)、生成圖張數(shù)等參數(shù);用英文寫(xiě)好描述詞(Prompts),格式大致為“畫(huà)作類型 + 對(duì)象(可以有多個(gè))+ 畫(huà)風(fēng)設(shè)定 + 一些起限定作用的修辭詞”;然后開(kāi)始運(yùn)行,等待 AI 渲染畫(huà)作。


圖片我給 AI 寫(xiě)的描述詞:“A beautiful painting of a starry night, shining its light across a sunflower sea by James Gurney, Trending on artstation.”


一般來(lái)說(shuō),你需要等半個(gè)小時(shí),如果盯著屏幕看,你會(huì)看到圖像從滿是噪點(diǎn),逐漸變得清晰、有細(xì)節(jié)起來(lái)。


使用期間,Disco Diffusion 可能會(huì)提示你在電腦上空出足夠的運(yùn)行內(nèi)存,但因?yàn)樗\(yùn)行在谷歌免費(fèi)提供的 GPU 等計(jì)算資源上,對(duì)用戶的電腦硬件要求并不高,打開(kāi)瀏覽器運(yùn)行就可以。


圖片用 AI 畫(huà)一個(gè)莫比斯風(fēng)格的場(chǎng)景:“a beautiful painting of a spaceship flying over a desert by Moebius, trending on artstation.”


Disco Diffusion 本身是個(gè)免費(fèi)的開(kāi)源軟件,但如果你想要更快的出圖速度,可以買(mǎi)谷歌 Colab 會(huì)員,以分配到更快的云端計(jì)算資源。


除了只輸入文字讓 AI 自由發(fā)揮,你還可以事先墊進(jìn)一張初始化圖片(Initial Image)去約束 AI 的創(chuàng)作。


圖片比如,我先做了一張有樹(shù)木輪廓和綠色色塊的底圖(左),然后再操作,Disco Diffusion 就會(huì)在這個(gè)大框架下去發(fā)揮,成品為右圖


Disco Diffusion 生成圖理論上可以商用,其程序基于 MIT 開(kāi)源協(xié)議,所有互聯(lián)網(wǎng)用戶可以免費(fèi)使用、復(fù)制、修改甚至出售生成圖。但我覺(jué)得還是存有風(fēng)險(xiǎn)。風(fēng)險(xiǎn)主要來(lái)源于你的描述詞會(huì)引來(lái)畫(huà)風(fēng)抄襲的爭(zhēng)議。


當(dāng)你使用了風(fēng)格鮮明的藝術(shù)家(尤其是在世的藝術(shù)家),以及某部商業(yè)作品作為關(guān)鍵詞時(shí),都請(qǐng)不要直接拿來(lái)商用。


Midjourney:不怎么“超綱”,更“聽(tīng)話” 


圖片

Midjourney 目前還是邀請(qǐng)制,內(nèi)測(cè)地址:

https://o9q981dirmk.typeform.com/to/zZtF1mVc?typeform-source=midjourney-gallery


為了測(cè)試 Midjourney 的生成效果,我復(fù)制了之前“投喂”給 Disco Diffusion 的關(guān)鍵詞——“星空”、“向日葵”、“梵高”——粘貼進(jìn)去。


圖片

我用 Midjourney 生成的畫(huà)


看到成品,我有一個(gè)直觀的感受:Midjourney 的想象力沒(méi)有 Disco Diffusion 那么會(huì)“超綱”。但如果從輔助創(chuàng)作的角度考慮,我會(huì)更傾向于用 Midjourney 這個(gè)更“聽(tīng)話的工具”,畢竟,沒(méi)有一個(gè)創(chuàng)作者愿意把創(chuàng)作主導(dǎo)權(quán)讓給 AI。


Midjourney 的優(yōu)點(diǎn)就是:快。軟件生成圖非??欤粡埶阆聛?lái)大概 60 秒。你要是對(duì)成品不滿意,還可以幾乎實(shí)時(shí)地提升細(xì)節(jié),或延伸變化。


圖片

一分鐘生成 4 個(gè)小狗警察丨用 Midjourney 生成


Midjourney 搭在了通訊軟件 Discord 上,在對(duì)話框輸入“/image”后,用英文輸入描述詞,然后按下回車(chē)鍵。這個(gè)過(guò)程就像在和 AI 聊天一下。


60 秒后,你就可以在對(duì)話框里收到 4 張渲染好的圖片。如果對(duì)“圖 1”不滿意,可以點(diǎn)擊“U1”按鈕增加細(xì)節(jié),按“V1”按鈕延伸變化,直到滿意為止。


于是,我拿 Midjourney 生成了“十九世紀(jì)的麥當(dāng)勞”和“十八世紀(jì)的打工人”:


圖片


圖片


之所以說(shuō) Midjourney 是“產(chǎn)品化”了的 Disco Diffusion,一個(gè)是它的界面更友好,另一個(gè)是它還內(nèi)建了一個(gè)創(chuàng)作社區(qū),你可以看到玩家們用哪些描述詞生成了什么樣的畫(huà)作。這就是一個(gè)極具參考價(jià)值的“畫(huà)風(fēng)”數(shù)據(jù)庫(kù),太適合拿來(lái)“抄作業(yè)”了。


圖片


比如,我嘗試生成《愛(ài),死亡和機(jī)器人》里那集《糟糕之旅》的場(chǎng)景,參考了上圖兩位藝術(shù)家的描述詞,之后就生成了滿意的畫(huà)作:


圖片


“抄作業(yè)”讓生成像樣作品的門(mén)檻進(jìn)一步降低了,但另一方面,也會(huì)失去了很多探索的樂(lè)趣。不要讓游戲秘籍毀掉了一個(gè)好游戲。


版權(quán)方面,如果你是免費(fèi)用戶,圖像的版權(quán)歸屬于 AI,每月支付 30 美元后,就能將圖片拿去商用了。但同時(shí),如果你因此獲利達(dá)兩萬(wàn)美元以上,則需要給 Midjourney 20% 的分成。


DALL·E 2:我給梵高理發(fā),我讓大象轉(zhuǎn)身


圖片


我當(dāng)了回“托尼”,用 DALL·E 2 給梵高理發(fā),申請(qǐng)地址:

labs.openai.com/waitlist


我等了一個(gè)多月,才拿到了 DALL·E 2 的內(nèi)測(cè)資格。如果說(shuō) Disco Diffusion 更擅長(zhǎng)描繪氛圍、風(fēng)景或概念藝術(shù),那么 DALL· E 2 則擅長(zhǎng)寫(xiě)實(shí)。


 “大象能轉(zhuǎn)身嗎?”我以這個(gè)“經(jīng)典甲方需求”為例,試試 DALL· E 2 的寫(xiě)實(shí)能力。


圖片


它轉(zhuǎn)過(guò)來(lái)了。


我讓網(wǎng)友扮演甲方,讓大象去做些別的事情。比如,讓大象在海洋館里游:


圖片


讓大象和鯊魚(yú)共舞:


圖片


讓大象開(kāi)哈雷摩托車(chē)在路上狂飆:


圖片


讓大象被曹沖稱:


圖片


“甲方”們無(wú)話可說(shuō)。


毫不夸張地說(shuō),這是我目前用過(guò)體驗(yàn)最好的 AI 繪圖工具,操作足夠簡(jiǎn)單,完成度高,速度快到可以當(dāng)搜索引擎:不到一分鐘生成 10 張圖片(1024 × 1024),可無(wú)限延伸變化,甚至可以擦除局部重新生成。你可以不停地給梵高“理發(fā)”。


在版權(quán)方面,DALL·E 2 背后的組織 OpenAI 列了幾條嚴(yán)格的限制:圖片生成版權(quán)最終歸屬 OpenAI;僅供個(gè)人學(xué)習(xí)探索使用,不能商用,不能用于制作 NFT;不能在社交媒體上發(fā)布過(guò)于寫(xiě)實(shí)的人臉生成結(jié)果,會(huì)有肖像侵權(quán)風(fēng)險(xiǎn)。


OpenAI 也聲稱已經(jīng)禁止 AI 記住名人的臉,也規(guī)避了種族和性別的刻板印象等。


在苦苦等到 DALL·E 2 內(nèi)測(cè)資格之前,我找了一個(gè)“平替”——DALL·E mini,是用第一代 DALL·E 做的 demo,生成速度快,但畫(huà)面完成度不及 DALL·E 2。


圖片

榴蓮沙發(fā)|用 DALL·E mini 生成,軟件地址:

https://huggingface.co/spaces/dalle-mini/dalle-mini


生成圖像,只是第一步


“能不能讓它們動(dòng)起來(lái)?”我看著 AI 返回來(lái)的畫(huà)作,開(kāi)始想辦法:


圖片

圖片

圖片

圖片


AI 生成圖像完成,并不代表創(chuàng)意就結(jié)束了。如果你把它當(dāng)成其中一個(gè)環(huán)節(jié),再連接其他創(chuàng)意流程,想象空間是巨大的。


我再展示一下插畫(huà)師 Nerko 的創(chuàng)意:他先用 Midjourney 生成自己想要的素材,然后再將這些局部組裝起來(lái)。


圖片

圖片

@NekroXIII


在他手里,AI 是種“生產(chǎn)力”。挑選和合成,仍是他全權(quán)主導(dǎo)。在用上 Midjourney 之前,他已經(jīng)畫(huà)了 15 年插畫(huà)。



*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。



關(guān)鍵詞: AI

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉