專題　美術館與前瞻科技 | 現代美術期刊

前所未有的意識？

去年11月，紐約現代美術館（MoMA）的大廳聳立起一座七公尺高的垂直螢幕，仿若中世紀的彩繪玻璃般，藝術朝聖者們浸沐在螢幕閃爍的光芒之中，仰起臉鑑賞注視、拿起手機拍攝雷菲克．安納多爾（Refik Anadol）的作品《非監督–機器幻覺》（Unsupervised—Machine Hallucination, 2022）。這讓觀眾目眩神迷，幾乎不重複的線條、色彩與形態持續變形的即時機器幻想由兩種來源組成。首先，紐約現代美術館給予安納多爾館藏現代藝術兩百年的資料集，軟體工程師出身的藝術家在使用GANs（生成對抗網路，generative adversarial networks，非監督機器學習的一種），透過反覆地訓練兩個神經網絡直到有著關於現代藝術的共識後，進而產出機器「認為」屬於現代藝術脈絡的影像。其次，藝術家使用現場蒐集的數據，包括當時的溫濕度、不同年齡層觀眾的聲音與數量等等，生成他的招牌模型：動態雕塑。這兩項乍似不相干的脈絡——MoMA館藏與美術場館數據——統一於觀眾早已熟習的錄像藝術形式，並給予美術館「創新」的說詞：「人工智慧通常用於分類、處理和生成世界的真實表徵。相較之下《非監督–機器幻覺》是一有遠見的公共作品：它探索幻想、幻覺和非理性，創造對藝術創作本身的另一種理解。」^[1]換言之，《非監督–機器幻覺》是一符合現代美術館的建館指標的作品——視科技為開創新藝術形式的進程之一。

這對「創新」科技與藝術生產之關聯的樂觀態度（如果不說是缺乏批判性），一直以來都是紐約現代美術館所秉持的文化價值。無論是對過去的新媒體或是現正當紅的生成影像，美術館持續以不同的流行語賦予相同的意識型態，意即，技術的創新等同於新的藝術。例如，在我們所能體驗的現實之外，《非監督–機器幻覺》讓機器做了一場關於現代藝術的夢，並進而推測「前所未見」的現代主義影像。上述的話術，曾被軟體藝術家凱西．瑞斯（Casey Reas）輕微地打臉：

舉個例子，想像我們在二十世紀初的巴黎。有幾十位藝術家正在創作，同時彼此欣賞互相的作品，也被彼此的作品影響。當然地，這樣的群體下有很多尚未被實現過的創作可能。

因此，我覺得雷菲克和現代美術館資料庫合作的有趣之處即在於，他得以去推測這些「未被實現過的創作可能」。同時，GANs對我來說的智慧並不真的是表示機器有自我意識。我認為它們就像是身體，例如肝臟這樣的器官是有智慧的一般。機器所作的只是處理、變更並將這些資訊轉移至其他的現實狀態。數據本身對於我們所得出的結果有決定性的影響。^[2]

這段不得不的長篇引述中，瑞斯以易懂的方式，精準地除魅：機器學習的智慧或意識，其實只是關於其輸入資料集——現代美術館館藏——的共識，以及其中尚未被實現的可能。這番除魅也反駁美術館對於創新科技等同於創新藝術的樂觀假設，機器學習並非有自我的意識所主導的幻覺抑或夢境，相反地，它僅是電算出現代美術館館藏下可能的變異，加上安納多爾團隊的影像美學。然而，在上述現代主義的意識型態——強調突破、新穎或前所未見的藝術發展進程，或是在吸睛、令人驚艷的生成影像之外，使用機器學習生產的藝術是否能有更具反身批判性的創作？近年「新」科技的頻繁露出，常迫使美術與文化機構被動地回應創新科技，如區塊鏈、Web3、人工智慧等，對藝術實踐帶來的影響與衝擊：是否激發了新的美學？又有怎麼樣的文化意義？本文將透過對近年來AI藝術的創作與研究討論進行兩個面向的觀察分析。

註解

^{^}引用自《非監督―機器幻覺》作品介紹文字於紐約現代美術館官網。
^{^}出自瑞斯於紐約現代美術館的座談會發言，請見“Modern Dream: How Refik Anadol Is Using Machine Learning and NFTs to Interpret MoMA's Collection”。

「壓縮」──理解AI的關鍵詞之一

的確，藝術圈對於機器學習美學的質疑與不信任並非一件新鮮事。當前對於新科技帶來新美學的抵抗，就像是十九世紀中葉的人們批評攝影與電影，二十世紀的人們質疑數位媒材可否有其屬於自身獨特的美學一樣，這樣的討論與磨合總帶來對創新科技更多的理解與定義。同為紐約在地的獨立機構Rhizome正有意識地不斷回應新科技對藝術生產與保存所帶來的挑戰。Rhizome創立於1996年創始人馬克•崔伯（Mark Tribe）的電子郵件群組，因網際網絡而生的藝術機構，其即時與短瞬的性質，也讓Rhizome自創建以來即投入於當代藝術與數位媒介的結合，透過建立數位基礎設施、培育藝術家、與研究者合作等方式，持續於原生數位（born-digital）藝術生產，以及其可能的保存方式等方面投注心力。

例如，Rhizome行之有年的「網絡美學（Net Aesthetics）」專題討論在今年11月舉辦以人工智慧美學為主題的討論會，由目前的執行長麥可．康納（Michael Conner）為主持人，邀請安納多爾，與新一代的媒體藝術家艾琳．伊薩貢．斯凱爾斯（Eileen Isagon Skyers）與馬雅．曼（Maya Man）等人一同討論「壓縮」可否視作理解機器學習的隱喻。科幻小說家姜峯楠（Ted Chiang）今年初於《紐約客》（The New Yorker）雜誌刊行的〈ChatGPT是網路上壓縮失真〉（ChatGPT is a Blurry JPEG of the Web）一文中，視ChatGPT（以及其它類同的人工智慧）為一種資料壓縮，像是機器學習如何利用巨量的數據，進而分析並進行處理，而他們所謂的智識也僅是看似完美然實則模糊失真的壓縮檔，毀損了原檔的複雜性與其中的細微差別，換言之，僅是不完整的複製。以姜峯楠批判人工智慧的壓縮為起點，Rhizome邀請藝術家討論機器學習或是神經網絡中的壓縮是否僅止於毀損與減少等負面意義？

如果我們後設地檢視當前的神經網絡創作，像是瑞斯或是安納多爾的作品。無論是前者以電影史，或是後者以現代美術館的館藏為主要的資料集，兩者都大幅度地依靠壓縮以企及各自的藝術生產目的。然而，姜峯楠文中的批判點在於壓縮如何毀損原作（現實）儘管不完美的靈光，例如，甫出道的小說家如何藉由多次不完美的寫作嘗試，企及最終機器無法複製的作品。因此，誠如安納多爾的觀察，當前的神經網絡美學並不僅是對於現實的模仿，更多的是產生目前現實未有的變異與多樣性。以前述十九世紀法國藝術家的例子，GANs生成的影像並非是百分之百對當時法國藝術的拷貝，而是從當時的形式特色中延伸出當時尚未被實現的可能，對於安納多爾與瑞斯來說，這層對影像潛能的開發才是神經網絡美學的真正意義，與耗盡資本與勞力的努力目標。

這同時也引發在概念之外，實際操作層面的討論，像是藝術家是將人工智慧視為工具還是合作夥伴？在討論會中，多數的藝術家認為將人工智慧視為夥伴可以刺激更深層面的討論。舉例來說，在藝術家克萊爾．西佛（Claire Silver）的創作過程中，她將其中一組神經網絡所得到的結果再行輸入至另一組網絡之中，進而要求人工智慧生成出一組新的程式語言。但也有藝術家對這兩個選項不置可否，例如，曼即認為無論是工具或夥伴，在合作過程中的開放性與隨機性，才是神經網絡藝術最有趣的地方，意即，你永遠無法準確預知最終生成的作品。

創新科技與影像潛能

值得一提的是，目前在紐約美術館展出的安納多爾是由紐約小眾、主打新興科技藝術的藝廊bitforms代理與培育。位於紐約下東區的bitforms，創立於新媒體方興未艾的世紀之初，其代理的藝術家也多半為擅長結合多媒材或是以原生數位為媒介的藝術家，例如瑞斯與目前聲勢日漲的多媒體藝術家拉斐爾•洛薩諾-赫默爾（Rafael Lozano-Hemmer）。透過持續提供藝術家們實驗、發展科技藝術與曝光的機會，這不僅讓bitforms成為當代科技藝術的指標畫廊之一，也給予藝術家足夠的自由度發展自身興趣，進而深入探討人工智慧與影像創作的各式問題。例如，2021年瑞斯的「煉金術」一展中提供了關於人工智慧的意識與夢境的深刻討論：人工智慧的幻覺如何由來於既成的影像庫。瑞斯在與前衛音樂創作者賈恩•聖•韋納（Jan St. Werner）共同製作，以螢幕為基礎（screen-based）的五組音畫系列作品「無題電影靜照」（Untitled Film Stills）中，瑞斯使用深度卷積生成對抗網絡（DCGAN, Deep Convolutional Generative Adversarial Network)，來探索人類電影史中尚待開發的潛能。我們在作品兩組橫幅與直立的巨型螢幕上所看到的，是每秒24幀都在變化的生成影像。這些無論是出自既成影像資料庫（像是電影）或瑞斯自製（以自然為主題再經由軟體合成）的訓練集（training set），再以DCGAN生成的動態影像，在蒙太奇技術缺席之下，輪流在兩組螢幕循環播放，時而依稀可辨識出特定形象、時而又像是超出象徵系統的形狀。絕大時間影像雜揉、混種於表象與抽象之間，留待觀者以其主觀感性、經驗或背景去感受與詮釋的生成影像短片。

Casey Reas，《Untitled Film Stills, Series 1》，2020；Courtesy of Casey Reas and bitforms gallery

諾拉．汗（Nora N. Khan）認為這些混種、難以確切定義，時常被大部分評論者模糊地形容為「夢境一般」的DCGAN影像，正是瑞斯批判性的發端。以他過去用英格瑪．柏格曼（Ingmar Bergman）的電影《假面》（Persona）為訓練集的作品為例：

瑞斯提醒我們可以以更精確的態度來審視這些夢境的空間。這些混種的形式有著如夢一般的特質，但它們的變異始終來自電影（或其他的訓練集），依舊在可辨識的範疇中。^[1]

汗認為這些GAN生成的影像儘管擁有幻覺般的形式，都依舊挪用於特殊選定的文化框架下。無論是援引於柏格曼，或是艾瑪．希區考克（Alma Hitchcock）的電影，這些夢境一般的氛圍，就這則例子來說，正是所謂柏格曼式的圖像再現。然而，相較於汗以文化符號的方法解釋GANs生成影像，此處，或許讓我們以瑞斯定義的「潛空間」（latent space），以及潛空間的操作方式來理解這些如夢的影像。

潛空間，就實際操作上來說明是GANs下一組從負一到一（between -1 and 1）的一百個數字，透過依據不同程度、目的，甚至隨意地調整這些數字（又稱為潛向量），可以得到一張、一組或是連續變化的影像。因為在影像為GAN生成出來前，我們並不會知道影像會是什麼樣子，或是會以什麼樣的形式產生變異，因此被瑞斯稱為潛空間（latent space，latent有隱藏或存在，但尚未完全發展完成的意義）。以我們熟知的電影影格率為例，GANs模型生成的動態影像可以自潛空間調整幀數；換句話說，如果要將原本一秒24幀的電影改為60幀，可以由GANs模型進行調整，填補其中空白的幀數。然而，潛空間對瑞斯來說不只是進行幀數的調整，或是任何既成影像技術的後設合成，而是透過探索潛空間創造前所未見的各種影像變化的潛能。例如在五組影片中的《無題4（兩人身亡）》（Unititled 4, two dead）裡，原本緩慢暈散的釉黑色塊，突然地以逆時針方向急速向畫面左方開展，又瞬間被其餘色塊吞蝕。從視覺藝術史的角度來說，上述生成影像介於抽象與具象的變化，並無法以單純的繪畫、電影或是動畫取代；相反地，可以視之為全體視覺生產技術的合成。五分鐘的連續象徵空間裡，有如蒙太奇的剪接效果，有著類油畫的筆觸，有時甚至像過曝的照片，卻不能說是因任何單一藝術家或單一生產方式而達成的結果。

但我們也不能科技命定地說這超現實、怪奇的景象全由人工智慧所掌握。如同瑞斯一再強調的，生成影像的決定因素（或者說創作者的主體動能）源自對視覺數據（訓練集）的揀選，以及訓練機器學習的方式。而這數十分鐘的夢境也非一人可及，是一耗時、勞力密集，且需要數十百萬張影像的資訊規模，以及用年為單位的創作時間。不可諱言地這集體的夢境，也曾是六〇年代藝術家企圖擁有的夢：夢想擾亂各種藝術生產方式既定的形式疆界，夢想將作品置於偶然與機遇之中，因為「藝術家從不能想像他的作品，在完成之前也無法感知」。美術館與創新科技間的關係，或許也應該從這偶然與機遇的角度進行促發，與其提供藝術家們館藏資料集來進一步放大、認定機構自身的美學，倒不如提供藝術家足夠的開發環境與資源，以促成我們未能感知與體會科技美學潛能。

註解

^{^}Nora N. Khan, “Introduction,” in Making Pictures with Generative Adversarial Networks (Montreal: Anteism Books, 2019), p.11.

關於AI與美術館的幾則觀察

前所未有的意識？

「壓縮」──理解AI的關鍵詞之一

創新科技與影像潛能

同期文章