2022 年可能會作為“人工智能藝術成為主流的一年”而載入史冊。
隨著多個高質量 AI 作圖工具的爆炸式增長,任何擁有智能手機和互聯網連接的人都可以接觸到 AI 藝術。這些工具使用人工智能模型將文本輸入(即“提示”)轉換為圖像。
“提示”是關鍵,添加或刪除單個單詞會導致截然不同的結果。人工智能驅動的社交媒體市場 的首席技術官普冉奈·韋迪雅那桑( )表示:“‘提示工程’正迅速成為一種有價值的技能,在相同的數據上訓練的模型,加上正確的提示,應該會產生相同的結果。”甚至還有一個不斷增長的“提示”市場,可以創造特定的結果。
這里有五個AI做圖工具可以幫助你開始。為了進行比較,我給它們輸入了同樣的提示:“一個人類和一個機器人站在山上的一棵大橡樹旁,天空中飄著云。”
1. DALL-E 2
“一個人類和一個機器人站在山上的一棵大橡樹旁,天空中飄著云。”的圖像,由 DALL-E2 人工智能模型創建。馬修·史密斯( S. SMITH)/ IEEE
成立于 2015 年的 在 2020 年發布了自然語言模型 GPT-3,成為頭條新聞。2021 年 1 月又推出了 DALL-E 數字圖像模型,之后演變為 DALL-E 2。 的模型提供了各種風格的優秀圖像。特定的提示可以導致特定的結果,或者你可以輸入一個模糊的提示,然后欣賞幾個截然不同的結果。
DALL-E 2 現在通過 的網站向所有人開放,對于那些好奇炒作的人來說是最好的工具。DALL-E 2 速度很快,明顯超過了我嘗試過的其他工具,網站也很容易瀏覽。它一次提供四個結果,通常風格迥異,這減少了你需要重新運行提示的頻率。DALL-E 2 的結果也很好,它是唯一一個同時描繪了人和機器人的人工智能模型。
這是一個商業工具,注冊后可獲得 50 個免費點數,每月可額外獲得 15 個免費點數。再額外的點數可以以 15 美元的價格購買 115 個點數。
2. / Dream
“一個人類和一個機器人站在山上的一棵大橡樹旁,天空中飄著云。”的圖像,由 人工智能模型創建。馬修·史密斯( S. SMITH)/ IEEE
來自 AI 的 工具受歡迎的原因與 DALL-E 2 相同:它快速、有效,并且可以從各種各樣的提示中生成可用的圖像。
任何人都可以通過 的演示頁面免費使用這款 AI 作圖工具。它雖然沒有 DALL-E 2 那么快,但通常在 30 秒或更短的時間內也能得到結果。它也像 DALL-E 2 一樣,一次提供四種圖像。
的模型是開源的,所以想要鉆研的用戶可以徹底調整它的工作方式。這大大增加了它的受歡迎程度,愛好者們紛紛涌向這款工具。范德安騰()說:“我們確實看到了一種趨勢,藝術家和其他用戶被 等開源模型所吸引了,而不是像 的 DALL-E 2 這樣的閉源和受控模型。”
AI 有一個建立在 基礎上的商業工具 Dream 。它提供了一個試用版,之后出售積分來生成新圖像。
3.
“一個人類和一個機器人站在山上的一棵大橡樹旁,天空中飄著云。”的圖像,由 人工智能模型創建。馬修·史密斯( S. SMITH)/ IEEE
在一位參賽者用它贏得科羅拉多州博覽會的數字藝術獎后, 在質量上贏得了聲譽,并引起了爭議,因為它沒有披露圖像的創作方法。 擅長生成生動、空靈、超現實的圖像,而且用戶群已經接受了它的風格。
該工具只能通過流行的即時通訊平臺 訪問。“提示”可以直接輸入到聊天中,聊天是公開的,所以頻道中的每個人都可以查看你輸入的提示和結果。這肯定會讓不了解 工作原理的讀者感到困惑,這可能被認為是一個功能,而不是一個 bug。
是一款商業產品,并像其他商業 AI 藝術生成工具一樣能夠盈利。每個用戶一開始都有 25 個積分,但要想獲得更多積分,必須按月支付會員費。
4.
“一個人類和一個機器人站在山上的一棵大橡樹旁,天空中飄著云。”的圖像做圖工具在線,由 人工智能模型創建。馬修·史密斯( S. SMITH)/ IEEE
最初被稱為 DALL-E Mini,但它與 的模型沒有直接聯系,而且其創造者免費提供該工具。結果生成可能需要 2 分鐘的時間,而且分辨率低,但可以同時顯示 9 個結果。
的不同之處在于,它使用的是未經過濾的數據,并且沒有特別努力去改進、訓練或更正結果。與其他工具相比, 的結果通常是乏善可陳的,而且它難以處理精細的細節。例如,有時候人臉看起來簡直不忍直視。
這個工具有其新奇之處。原始地提供結果暴露了人工智能圖像生成的一般優勢和弱點,以及創造可用結果的困難程度。這也突出了倫理問題,因為 并不過濾提示,所以如果輸入一個帶有攻擊性的提示,那么人工智能圖像可能會被惡意利用。
5. VQGAN+CLIP
“一個人類和一個機器人站在山上的一棵大橡樹旁,天空中飄著云。”的圖像,由 VQGAN+CLIP 人工智能模型創建。馬修·史密斯( S. SMITH)/ IEEE
人工智能圖像生成器近期的流行激發了數以百計的工具,這些工具將先進的人工智能模型與光禿禿的界面結合起來。VQGAN+CLIP 就是這樣一個工具,它完全在 筆記本中運行。
VQGAN+CLIP 之所以被提及,是因為它(在某種程度上)很容易使用,且提供了一個窺視模型內部工作原理的機會。你可以看到該工具實時地迭代新的變化。雖然是在 筆記本中訪問,但該模型在你的本地機器上運行。每個提示開始時都是一個斑點,但慢慢地會演變成一個可用的圖像。
不過做圖工具在線,VQGAN+CLIP 的生成結果通常并不好。它速度很慢,一次只提供一個圖像,并且會消耗大量的視頻內存。不過,從好的方面來說,它是完全免費的,沒有廣告,所以如果你有時間的話,它是一個不錯的選擇。
譯者:Jane