
GraphQL API滲透測試指南
令人興奮不已!
這項技術實在是太不可思議了,而且極易讓人上癮。
當然,AI生成的一些圖像邊緣略顯粗糙,這也帶有一些夢幻般的邏輯——你可能已經注意到,與圖像一同生成的文本有時完全是天馬行空的胡言亂語。但經過一些微調,OpenAI的DALL·E 2完全有潛力出現在馬克(Mark)和克利奧帕特拉(Cleo)的首張專輯封面上。
現在,這引發了一些深刻的問題——
如果我是提出這個創意的人,那么我是否就是這幅作品的作者呢?寫作提示是否會發展成為一種全新的藝術形式?未來的人們是否會通過這種方式來創作藝術、圖像和電影?如果真是這樣,那是不是意味著我們每個人都有可能成為藝術家?或者,人工智能會成為某種終極創造力的源泉,而人類則僅僅成為它所創造之物的策展者與見證者?
就我個人而言,我迫不及待地期待著這項技術能夠變得更加成熟并普及開來。到目前為止,在AI夢境中探索是一種極為有趣的體驗。但其他人對此持何種看法呢?
我們開展了一項調查,旨在了解互聯網用戶、藝術家及AI愛好者對于AI與藝術關系的看法。
在調查過程中,我們向他們展示了一些圖像,并詢問他們能否區分這些繪畫或照片是AI生成的還是人類創作的。
令人驚訝的是,一些使用OpenAI生成的圖像竟然被多數投票者認為比真實繪畫更加逼真!
調查結果顯示,一幅80年代的超現實主義畫作被68%的受訪者誤認為是人類作品,而使用DALL·E 2生成的圖像則有73%的人認為是人造藝術品。
以下是我們的其他發現:
非常有趣的是,超過一半的受訪者被誤導,將AI創建的圖像誤認為是一幅真實的畫作。然而,在某些例子中,識別任務要簡單得多。例如,使用當前廣受歡迎的Craiyon應用程序(之前被稱為DALL·E mini,盡管它與OpenAI的項目既無官方認可也無聯系)生成的圖像,幾乎沒有騙過任何人,絕大多數受訪者都能準確識別出它們是AI創作的。
原因其實不難理解。
人工智能生成的特定圖像能否讓我們信服,取決于諸多因素,包括場景的復雜度、提示的清晰度,以及所選AI模型的類型等。
AI文本到圖像技術可以應用于多個領域:
那么,這是否意味著專業藝術家將面臨失業的危機呢?
答案并不絕對。
但是,那些在工作中需要執行上述任務的人,應當關注AI文本到圖像工具的發展。他們中的一些人或許很快就能利用AI來讓自己的工作變得更加輕松和高效。
然而,這也意味著將會涌現出一代新的藝術家和設計師,他們對創作過程有著截然不同的理解和方法。手動設計和繪制草圖以及渲染圖像可能不再像過去那樣重要。相反,能夠向生成式AI模型清晰描述自己所見所想,可能會成為就業市場上的一項高需求技能。
這項技術極具顛覆性,它可能會改變我們所熟知的整個創意產業。但與此同時,這也使得作者身份的問題變得更加撲朔迷離。畢竟,AI模型是通過學習現有作品來進行創作的!
因此,我們不禁要問:
“此圖像受版權法保護,禁止用于訓練AI模型”這樣的聲明,會成為新的行業規范嗎?
或者,情況可能會截然相反——為了訓練不同“風格”的AI模型而專門創作高質量的素描和繪畫,可能會成為一個新的盈利行業。屆時,用戶將能夠利用AI創建圖像,并向藝術家支付使用其風格的許可費用。
站在用戶的角度,利用文本到圖像生成器創作圖像可謂輕而易舉。用戶只需輸入相應的提示——即對所期望圖像內容的描述——然后點擊按鈕即可。接下來,AI生成器會全權處理,根據提示創建一個或多個圖像。
當前,一些備受歡迎的AI藝術生成器借助Discord服務器,用戶可以在其中將提示以普通消息的形式發送。用戶只需在特定的頻道中使用指定的命令,稍等片刻,Discord機器人便會生成圖像并發布出來。
以下展示了幾幅有趣的AI生成圖像:
在前不久的一次實驗中,我們嘗試測試人工智能是否能創造出一只形象逼真的貓,這成為了我們主要的AI測試項目之一。而先前我們采用的技術在塑造自然姿態的貓方面并不盡如人意。
然而,在不經意間,新一代的工具應運而生,它們能夠輕松應對常規描述以及更為復雜的場景。
眾所周知,貓并不具備演奏樂器的習性(即便它們擁有這樣的能力,通常也不會表現得十分出色)。對于生成式AI模型而言,如此非同尋常的場景理應構成不小的挑戰,因為訓練數據集中可能鮮有貓拉大提琴的參考圖片。
讓我們看看根據 Craiyon 應用程序演奏小提琴的貓是什么樣子的。
它們當然算不上是獲獎作品,但話說回來,從某種程度上看,貓似乎真的在演奏它們的“樂器”。
如今,OpenAI的DALL·E 2在這項任務上的表現更為出色。
貓是否真的具備演奏樂器的能力,這仍然是一個值得探討的話題。但可以肯定的是,如今創建的圖像質量已經有了顯著提升。AI在準確呈現樂器形態方面確實遇到了一些挑戰。
當嘗試將貓與樂器相結合時,這些問題就變得更加突出了。由于小提琴的尺寸太小,無法容納一只貓,所以我們不妨將樂器換成吉他來嘗試。
在進行這些AI實驗的過程中,沒有貓在動物保護組織介入前受到任何傷害。
接下來,讓我們嘗試一些與狗相關的創作。
多數公開可獲取的文本到圖像生成器在處理復雜提示時都顯得力不從心。比如,如果我們想為一篇探討埃隆·馬斯克與加密貨幣的文章繪制一幅漫畫,且希望漫畫中的埃隆騎著一只柴犬,那么Craiyon可能就無法滿足我們的需求了。
這確實有點效果,但圖像的分辨率太低,無法清晰地辨認出是否是埃隆·馬斯克。讓我們嘗試使用不同的提示來生成圖像吧。
盡管渲染效果不是最佳,但我們確實成功地捕捉到了埃隆·馬斯克的肖像特征。
接下來,讓我們在DALL·E 2上嘗試創作一幅新古典主義風格的油畫:畫面中,埃隆·馬斯克(Elon Musk)身著拿破侖的裝扮,騎著一只龐大的柴犬,穿越戰場,展現出一種別樣的氣勢。
我猜你在想——這家伙看起來一點也不像埃隆。
你的觀察完全準確。
如果說這個AI有什么不擅長之處,那就是渲染名人肖像了。但這其實是出于有意的設計。該算法會對面部特征進行改動,以確保用戶不會生成與真實人物高度相似的深度偽造圖像。名人肖像是被嚴格限制的。
荷馬·辛普森(Homer Simpson)或許還能保留幾分自己的模樣,但鮑里斯·約翰遜(Boris Johnson)就不會那么像他自己了。這也是為什么DALL·E mini更適合創作像“戈登·拉姆齊(Gordon Ramsay)將牛排扔進大型強子對撞機”這樣的搞笑圖片。
顯而易見,某些應用程序在解讀提示方面要比其他應用程序更為出色。比如,要求生成一個像貓一樣抱著索尼克(Sonic the Hedgehog)的動漫男孩,這個任務就讓大多數AI文本到圖像引擎感到困惑。
以下是通過Discord平臺使用Midjourney AI應用程序得到的結果。
這結果顯然不盡如人意。索尼克的腿竟然變成了動漫男孩的手臂,他們看起來就像是誤入了傳送室并意外融合在了一起。
接下來,我們來看看OpenAI的DALL·E 2能否迎難而上,給出更好的表現。
盡管在區分兩個角色時仍存在一些混淆,比如尖尖的藍色頭發等特征在兩個角色之間有所混合,更不用說那只貓的形象也有些模糊。但總體來說,DALL·E 2給出的結果要比之前好得多。
DALL·E 2在模仿紋理和材質方面展現出了極高的水準。它能夠生成金屬、木材、泥土、粘土或織物等材質制成的事物的逼真圖像。此外,它還能創造出更具創意和不同尋常的組合,例如玻璃制成的動物或食物制成的角色,比如土豆做成的小黃人。
以下是一些以流行卡通人物為原型的鉤針娃娃的示例。
這里有一些晚期巴洛克式瓷器小雕像,展示了另一個流行的卡通電視節目中的角色。
可以說,瓷器理應呈現出更加閃耀的光澤。我們能夠通過在AI文本到圖像的提示中添加更多細致的描述來嘗試和調整這一點。接下來,我會給出一些更詳細和精確描述的示例。
音樂似乎成了我們AI實驗的核心主題。接下來,讓我們嘗試一些融入標志性外貌和服飾元素的提示。為了增添一絲激進感,我們將生成以動物為主體的AI圖像。
一張采用F1.4光圈、50毫米焦距拍攝的高分辨率時尚照片,畫面中的朋克搖滾猴子身著一件帥氣的皮夾克,領口尖銳,頭頂著標志性的莫霍克發型,盡顯狂野不羈。
而且,接下來我們將展示AI技術是如何呈現朋克風格的鬣狗形象的。
低焦深與特定焦距能夠拍攝出具有獨特風格的照片。然而,我們也可以嘗試運用不同的繪畫技法。
以下是一些使用DALL·E 2創作的亞克力插畫示例。
這些插畫看起來十分酷炫,將它們轉化為交易卡或NFT系列看似輕而易舉。然而,OpenAI的內容政策明確規定,禁止使用DALL·E 2創建NFT藝術品。
那么,使用DALL-E 2生成器還有哪些其他的規定呢?
首先,您不能生成包含暴力、裸露或其他冒犯性、令人不適的視覺內容的圖像。此類內容已被從訓練數據中剔除,使用某些詞匯也可能會導致您的請求被拒絕。例如,您不能在提示中使用“死亡”一詞,即便它是固定短語或通用名稱的一部分。正因如此,您無法從類似“小熊維尼以死亡金屬專輯封面風格呈現”這樣的提示中生成圖像。您需要將其修改為“重金屬”或“黑金屬”,如“小熊維尼以黑色金屬專輯封面插圖風格展現”。
現在,讓我們再次聚焦于我們最喜愛的動物。
您或許已經見過一張形似健美達人的“肌肉型無毛貓”的熱門照片。然而,嘗試利用AI文本到圖像生成器重新創作類似的圖片卻異常艱難。不知為何,像“極度健壯”或“非常肌肉發達”這樣的描述并不奏效。
盡管這些圖像看起來極具真實感,并且OpenAI的應用能夠根據提示捕捉到“在健身房”的場景,但貓咪的形象依然顯得偏瘦。
對提示進行微調后,我們得到了一些頗為有趣的結果。
但這仍然不是你所期望的效果。
有趣的是,Midjourney應用程序產生了更多夸張(OTT)的圖像。盡管此時已很難再將這些形象稱作貓了。
結果雖略顯不安,卻也異常引人深思。Midjourney有時會創作出更具藝術感與新奇感的圖像。在此過程中,嘗試不同的提示無疑成為了一種藝術創作的手段。
迄今為止,我們已探索了眾多不同的應用程序。但接下來,讓我們逐一為它們命名,并學習如何利用文本到圖像工具來創作自己的AI畫作。
對于那些想要了解圖像生成領域的AI解決方案的人來說,很容易會感到迷茫。
首先,為何會有如此多的“DALL·E”變體?哪一個才是真正的正品呢?
DALL·E mini(現已更名為Craiyon)是當前最為流行且廣泛傳播的應用程序。如果你在社交媒體上見過那些奇特的模因,比如“布偶版《拯救大兵瑞恩》”之類的內容,那么它們很可能是用DALL·E mini創作的。而DALL·E FLOW則是另一個借用了這個名字的項目。
你知道嗎?DALL·E這個名字是對皮克斯動畫電影中的可愛機器人WALL·E以及超現實主義畫家薩爾瓦多·達利的致敬。
DALL·E 2是由OpenAI開發的官方應用程序。它產生的效果最好,但訪問權限有限。你可以加入候補名單,但可能需要等待數月才能收到邀請。
因此,目前用于圖像生成的最佳和最廣泛使用的 AI 工具是:
以下是它們生成效果的比較:
讓我們來詳細了解一下它們中的每一個:
這是利用AI技術實現文本到圖像渲染的尖端解決方案。您可以提交提示來生成多個結果,并從中選擇您喜歡的選項。之后,您還可以生成該選項的其他變體。要創建變體,您甚至還可以上傳自己的任意圖像。
Midjourney是一個基于訂閱的文本到圖像應用程序,它運行在Discord服務器上。您可以通過它查看其他用戶生成的圖像,或者通過發送消息來提交自己的請求。整個操作過程十分直觀便捷。大約花費200美元,您可以生成大約10張圖像,這個價格相對合理。想象一下,您只需花費5美分,就能獲得一個新穎且酷炫的海報設計!
這種AI文本到圖像解決方案能夠產生極具趣味性的結果,而且它是完全免費的。不過,遺憾的是,它的使用過程稍顯復雜,因為您需要通過Colab筆記本自行初始化流程。這包括點擊多個按鈕、利用提示符修改命令,然后運行它。盡管這些步驟其實都非常簡單,但對于初學者來說可能會顯得有些令人生畏。
DALL-E mini并非由OpenAI開發。該名稱被多個希望借其熱度提升知名度的項目所采用。真正由OpenAI推出的產品并未廣為人知,這讓情況變得更加復雜。然而,盡管如此,DALL-E mini(現已更名為Craiyon)仍是最易用且在用戶中傳播最廣的工具。您只需訪問其網站,輸入提示,大約1分鐘后即可查看結果。而且,實事求是地說,這些結果可能非常有趣。
此外,Imagen是Google正在著手研發一項先進的解決方案,該方案結合了機器學習與擴散模型,以實現文本到圖像的轉換。然而,目前這款應用程序最難獲取或親身體驗。據報道,其生成的圖像質量與DALL·E 2不相上下。
當然——
但是,即使您選擇了上述應用程序之一,掌握一些有效的提示技巧也會對您有所幫助。由于通常存在時間和生成次數的限制,因此從一開始就學會如何為生成式AI編寫更優質的提示是很有意義的。如果您每天只能嘗試有限數量的提示,那么應該確保每個提示都盡可能有價值。
關于如何為AI創建高效的提示,實際上并沒有固定的規則。不同的生成式AI模型對文本的不同部分有不同的側重。由于結果可能非常難以預測,因此最好的方法就是親自嘗試。
您可以嘗試重新組織描述的部分,或者互換使用它們。此外,通過多次提及某個元素,您可以更加突出自己感興趣的特定方面。
創建詳細和描述性提示的最通用公式如下所示:
下面是一個示例:
看起來很逼真,你不是這么說嗎?
顯而易見,文本到圖像工具正日益受到歡迎,這背后有著充分的理由。它們不僅充滿樂趣,而且完全有可能創造出極佳的作品。
它們不僅充滿樂趣,而且完全有可能創造出極佳的作品
值得慶幸的是,目前我們還沒有必要為藝術的消亡而擔憂。AI文本到圖像生成器在創作逼真圖像方面正不斷進步。然而,在它們能夠創作出與人類藝術作品相媲美的佳作之前,還有很長的路要走。
原文鏈接:https://www.tidio.com/blog/generative-ai-dall-e-examples/
GraphQL API滲透測試指南
Python + BaiduTransAPI :快速檢索千篇英文文獻(附源碼)
掌握ChatGPT API集成的方便指南
node.js + express + docker + mysql + jwt 實現用戶管理restful api
nodejs + mongodb 編寫 restful 風格博客 api
表格插件wpDataTables-將 WordPress 表與 Google Sheets API 連接
手把手教你用Python和Flask創建REST API
使用 Django 和 Django REST 框架構建 RESTful API:實現 CRUD 操作
ASP.NET Web API快速入門介紹