Mid ()
Mid 是一個流行但尚未普遍可用的AI藝術生成器。 是一個獨立的研究實驗室,探索新的思想媒介并擴大人類的想象力。 是一個小型自籌資金團隊,專注于設計、人類基礎設施和人工智能。 是托管在 服務器上的 AI 文本到圖像擴散模型。目前已經有150萬用戶。
Mid
()
是由國內團隊研發的一款人工智能繪畫工具,于2022年7月22日上線,公司總部位于上海。目前還處于內測版本。
AI()
由AIGC公司開發,位于美國舊金山,此前專注于AI文本創作。目前,已經生成了超過一百萬張圖像。在 上線后一周上線,據 創始人形容, AI是抄襲了 的開源版本。
AI
二、非()
作為市場上最受歡迎的AI藝術生成器之一,上線于2015年6月,是由谷歌工程師 創建的計算機視覺程序,可以探索不同的 AI 算法。目前,市場上大量藝術效果生成應用都基于這一開源技術
()
上線于2019年11月,由開發。是一個娛樂、社交及新聞網站,創立于2005年2月3日,總部位于舊金山,致力于為世界上每個人帶來社區和歸屬感。通過,用戶可以獲得所生成藝術作品的所有權,也可以購買作品的打印版本。
()
上線于2019年5月,由Joel和 創建。旨在成為一種新型的創意工具,通過讓協作和探索變得更容易來賦予用戶創造力。 使用和 模型。其中一個使用的最小開源版本。
Big Sleep()
Big Sleep是一個基于的AI藝術生成器。由谷歌開發,其使用 和 的 CLIP 通過 Colab 筆記本從 用戶 生成文本到圖像。需要通過編程語言生成,處理圖像需要一段時間和大量內存,有可能無法在計算機上運行腳本。
()
是一個AI藝術生成器App,目前在 play上已經有超過50萬的下載量。作為移動應用,有iOS和版本,可以在移動端使用,支持創建NFT,同時支持生成步數等進階選項。
WOMBO Dream()
Wombo是一家總部位于多倫多的合成媒體公司,曾于2021年3月推出了一款由AI驅動的對口型App,允許用戶上傳任何靜止的肖像并對其進行動畫處理,以唱出他們選擇的歌曲,該產品引發了爆發式裂變。目前,WOMBO Dream算法應用的是開發的CLIP所引導的方法。
于2017年成立于舊金山,曾于2019年獲得種子輪融資。使用HTML5、 和等12項技術產品和服務。的技術包括、/兼容和等。最初其功能是將黑白照片自動上色為彩色。
三、大廠進展
2022年5月, 發布了。此次谷歌的拋棄了從文本特征映射到圖像特征再用GAN或擴散模型生成圖像的常規思路,而是使用純語言模型只負責編碼文本特征,把文本到圖像轉換的工作丟給了圖像生成模型。這里的圖像生成模型,依然是擴散模型,是一系列的擴散模型。這就意味著其純文本數據獲取方面和全面性方面比獲取圖文對數據容易,其文本理解能力上比圖文對數據的理解能力強。
Parti
2022年6月,公布了其Parti文本到圖像的計算機模型,該模型通過研究數百億個參數來渲染超現實圖像。Parti 全稱為“ Text-to-Image”(路徑自回歸文本轉圖像)。隨著可使用參數數量的增長,其輸出的圖像也能夠更加逼真。該模型在生成最終圖像之前研究了200億個參數。
Parti與不同,是一種文本到圖像生成器,谷歌設計用于擴散學習。該過程通過在圖像中添加“噪聲”來訓練計算機模型,使其變得模糊。然后,該模型學習對靜態圖像進行解碼,以重新創建原始圖像。隨著模型的改進,它可以將看起來像一系列隨機點的東西變成一幅圖像。
目前,谷歌沒有向公眾發布Parti或。
/Meta Make-A-Scene
Meta于2022年7月官宣Make-A-Scene的存在,目前,該團隊正在測試并收集 Meta 員工的反饋,Make-A-Scene 正在Meta內部開放使用權限。Make-A-Scene可以捕捉預先設置的場景布局,使草圖也成為輸入內容的一部分,然后用戶通過文本輸入來對框架進行填充。該模型還可以通過輸入文本來創建自己的布局,但這意味著用戶放棄了部分控制權。
NUWA
2022年3月,微軟亞洲研究院最新推出的多模態模型 NüWA。NüWA 支持八大視覺生成和編輯任務。其中,支持圖像的四類任務包括:文本到圖像,草圖到圖像,圖像補全,圖像編輯;支持視頻的四類任務包括:文本到視頻,視頻草圖到視頻,視頻預測,視頻編輯。7月,微軟亞洲研究院公開發表了新的研究成果:NUWA 的升級版——無限視覺生成模型 NUWA-,可生成任意大小的高分辨率圖像或長時間視頻。
文心·一格( )
文心·一格是基于文心大模型的文生圖系統實現的產品化創新。上線于2022年8月19日。這是百度依托飛槳、文心大模型的技術創新推出的“AI 作畫”首款產品。百度的AI-飛槳文心大模型,是產業級知識增強大模型。文生圖領域的大模型服務,支持輸入一段文本描述,并選擇生成風格和分辨率,模型就會根據輸入的內容自動創作出符合要求的圖像。
美圖AI開放平臺()
美圖AI開放平臺是美圖公司推出的AI服務平臺,專注于人臉技術、人體技術、圖像識別、圖像處理、圖像生成等核心領域,為客戶提供經市場驗證的專業AI算法服務和解決方案。
AI生成在社交媒體上的泛濫討論一直帶有科學倫理方面的色彩和偏見,而關于圖像生成技術的討論則始終由藝術愛好者、設計師、藝術家這類人群在推動,因此,AI Art所帶來的關于藝術設計生產效率、知識產權、圖像數據復用等方面的延展和保護性服務可能會是下一個市場風向。
另外值得一提的事,近期在全球最大的產品社區 Hunt上,已經出現了針對AI Art的藝術作品交易市場。這可能是自NFT流行以來又一個新興的垂類版權交易賽道。
AI Art交易市場
如果優質的AI Art可以賣出一個好價錢,那無疑將會出現一個“全民藝術家”的時代。
當然,任何新興的技術,在開始都會經歷萬眾矚目的階段,之后不免會被市場“失望”之音淹沒。AI Art現在正在早期繁榮期,未來ai可以導出動態gif,的確也還有一些難點需要攻克。
最重要的問題是,比起AIGC其他賽道,現在的AI Art多了幾分性感,卻好像少了幾分“實用價值”。
首先,隨著技術從算法模型下沉到用戶的手里,如何精準找到客戶群體,進行商業化?作為一項黑科技,盡管目前看來比較吸引人眼球,但是目前AI Art具體的使用者可能仍然停留在:藝術家的靈感工具、設計師的素材工具、普羅大眾的獵奇工具。對風格各異的藝術圖片有消費需求的個人用戶和B端企業究竟有多少?目前還尚未可知。
不過,根據36氪判斷,在可以想象到的范圍內,AI Art可落地的商業場景主要有以下幾類:
最直接的是場景用于toC端美圖秀秀等消費級修圖應用、to設計師端的即時設計等生產工具,為這些產品增加場景豐富度,提高用戶黏性,事實上,根據了解,這類廠商也都已經在進行相關的布局;
即時設計已經推出AI設計插件
革新專業創作人員的生產方式,比如作為提效工具為插畫師、動畫師、電影創作者等實現能力補充,解放生產力。未來,大量創造性工作的主要職業能力會體現在生產和粘合數字化素材的能力,而不再是原始的手工工藝(就像想吃米飯需要從種水稻開始);AI Art背靠的是廣闊的UGC和用戶個性化空間,當下能夠很好地貼合全民自媒體、低門檻內容制作的潮流,未來也會在元宇宙市場中有更深層次的發揮空間。基于這一點考慮,國內主要內容生產分發的平臺、電商平臺、互聯網大廠等很可能會先后在自有產品生態中孵化AI Art的功能,幫助用戶快速生產符合平臺調性的藝術內容,同時服務自己的用戶和企業客戶;由于AIGC這一大領域本身符合無代碼潮流,因此AI Art也非常可能具有高潛力的企服價值,最直接的目標企業是廣告公司、影視創作公司、建筑事務所等對于藝術效果圖有大量需求的企業客戶,單是這幾類企業就有不低的市場天花板,另外,品牌商家的廣告和創意部門也是有力的受眾之一;
用Mid 生成的品牌廣告
不過,不同的用戶群體,其具體的需求點又大相徑庭,產品后續的迭代也會根據不同的需求進行調整,因此,現在還停留在算法、測試版生成工具、平臺社區的AI Art存在形式,也很有可能會因此而分化出不同的價值和服務類型。畢竟,底層技術的革新和賽道的開拓,只是“AI代替人類”萬里長征的第一步。
商業化之外,另一機遇與威脅并存的點是,目前的產品多以英語自然語言理解為基礎,而漢語、西班牙語、法語、德語、日語等其他主要語言毫無疑問也有相當大的市場需求尚未被滿足。在滿足不同語言的需求過程中,又會出現更多難題,比如中文的AI學習難度是英文的指數級,這或許也是國內暫時落后于歐美的原因之一。
但挑戰也預示著藍海和機會。比如國內已經出現了第一家以中文自然語言理解為亮點的AI Art公司。再比如在AICG行業發達的日本,第一家能夠做到支持日語輸入的企業服務級AI Art廠商,勢必會有很大的市場空間能夠去開拓。
盡管困難重重,但是,歐美VC依然愿意為充滿風險的未來機遇買單。
首先,AI Art在目前看來,是比較符合現在海內外認可的PLG/CLG模式,產品能夠有效提高生產力,足夠從個人使用者逐漸擴展至團隊乃至企業使用。在國內,PLG/CLG也都出現了頭部公司,比如藍湖、等。
其次,AI 近年來一直被視為未來的方向,只不過落地場景仍需摸索。此刻,AI Art乃至AIGC是AI成熟期里已有明確需求的場景,值得被看好。畢竟,文化和社區正在初步形成。比如Mid 基于的服務已經使之成為了上的第二大社群,目前處于內測階段的國產先發者每天也都會收到成百上千份理由翔實的申請表。一個開放共享的社區對于AI Art領域來說至關重要ai可以導出動態gif,也是考核一個AI Art公司的重要標準之一。其貢獻還體現在,互聯網邏輯下的思維方式,能夠快速將AI Art變成一門“數字化技能”。
網友發起了Disco 詞庫共享計劃
為了更好地進行AI Art創作,網友發起了Disco 詞庫共享計劃。(因為Disco 在 Colab 上的測試版本仍然有一定的理解和生成門檻,但現在不少工具已經加入了關于藝術風格的引導和篩選功能。)
2022年,可稱為被開啟的AI Art元年。接下來的三至五年內,AI Art將會往更加自由的方向發展,比如展現出更強的耦合性,可被用戶定制的空間更大,也就是說更貼近“主觀創作”的過程,藝術作品中也會分化和體現出越來越細致的用戶想法。近期上線的 AI已經展現出了這一特點。
AI
同時,全球范圍內元宇宙、Web3概念的盛行,也給AI Art提供了一個結合思路。搭上了AI 和Web3的雙重熱門概念,AI Art有可能斬獲一批相信未來的投資者。
追風口無錯,不過,放眼國內,越加謹慎的投資氛圍,有可能對AI Art創業公司的底層能力考核嚴格。靠新概念融資的時代過去了,未來,能在國內掀起波瀾的AI Art創業公司,至少一定能夠具備:更深厚的AI算法技術儲備、更開放的社區和可觀的數據訓練壁壘、更貼合東亞使用習慣的產品落地場景、更長期主義理想的創業者。
*實習分析師古振興對本文亦有貢獻