A mesterséges intelligenciára alapuló technológiák gyökeresen megváltoztatják mindazt, amit a kultúráról, a kreativitásról, az alkotásról és tervezésről gondolunk. Nem egy távoli jövőről van szó, a folyamat már elkezdődött. Valóban olyan technológiai forradalomról van szó, mint amilyen a fényképezés elterjedése volt? A kérdés sokakat szinte rettegéssel tölt el, míg mások a lehetőségek tárházát látják benne. Tervezőket és alkotókat kérdeztünk arról, hogyan állnak ők a kérdéshez.
"Ám abban a pillanatban, ahogy a művészi produkciót illetően a valódiság mércéje csődöt mond, a művészet egész társadalmi funkciója alapjában megváltozik."
Walter Benjamin
Hiába figyelmeztetnek évek óta, hogy a következő áttörést a mesterséges intelligencia elterjedése fogja hozni, hogy ez mit is jelent valójában, az csak az elmúlt hónapokban kezdett el érthetővé válni a szélesebb nyilvánosság számára. Köszönhető mindez annak, hogy immár nem csak a nagy techcégek zárt laboratóriumaiban kísérleteznek a technológiával, de azok bárki számára elérhetővé váltak. Először az OpenAI képalkotó algoritmusa, a DALL-E került a figyelem középpontjába, amikor ellepték a közösségi médiát a programmal készült mémek, az elmúlt hetekben pedig a ChatGPT került reflektorfénybe, főként miután a Microsoft bejelentette, hogy a Bing keresőmotorjába beépíti az OpenAI által fejlesztett algoritmust, majd pedig a Google is bemutatta Bard nevű, LaMDA alapú eszközét. Ezek a fejlemények heteken belül fel fogják borítani az internetes keresés évtizedek óta szinte mozdulatlan állóvizét.
Számtalan kérdést felvetnek ezek a technológiák, többek között a szerzői jogok, vagy épp a tanulás alapját szolgáló, a többségi társadalom felé részrehajló adathalmazok kapcsán. P. Szathmáry István grafikus Válasz Online-on megjelent cikkében például saját szakmáját félti a gépektől – hiszen mennyivel egyszerűbb néhány gombnyomással generálni egy illusztrációt, mint egy élő alkotóval megegyezni a grafika részleteiről. Bennünk, újságírókban is felmerülhet a kérdés, hogy mikor jön el a pillanat, amikor a mesterséges intelligencia jobb cikkeket kezd el írni, mint mi – ez azonban még messze van, az MI alapú szövegalkotás inkább hasonlít egy felturbózott autocorrectre, ami sokszor téves információkat köt össze. Hogy mindennek milyen következményei lehetnek, az önálló cikket érdemelne – és szinte naponta meg is jelenik egy a témához kapcsolódóan, épp jelen cikk publikálásának napján például ez – építészeti szempontból azonban jóval relevánsabb a képalkotó algoritmusok kérdése.
Hogyan is működnek a képalkotó algoritmusok?
A Wired idén januárban megjelent cikkében relatíve közérthető módon foglalta össze a technológia alapjait: körülbelül 10 évvel ezelőtt kutatók megállapították, hogy a neurális hálózatoknak nevezett algoritmusok nagyszámú, címkékkel ellátott képpel való "etetése" lehetővé tette számukra, hogy korábban nem látott képeket nagy pontossággal címkézzenek fel. Így képes például az Apple Photos és a Google Photos automatikusan rendszerezni az okostelefonon készült háziállatokat ábrázoló képeket.
A képkészítő AI-eszközök ezt a képcímkézési trükköt a feje tetejére állítják. A világhálóról nagyszámú képet és a hozzájuk tartozó szöveget feldolgozó algoritmusok a felhasználó által megadott szövegből új képeket tudnak generálni. Ennek középpontjában egy úgynevezett "generatív modell" áll, amely megtanulja egy adatgyűjtemény tulajdonságait, majd képes új adatokat létrehozni, amelyek statisztikailag illeszkednek az eredeti gyűjteményhez.
A technológiában az áttörést Ian Goodfellow 2014-es találmánya, a "generatív adverzális hálózatok" (GAN) modellje jelentette. A GAN két egymás ellen dolgozó neurális hálózattal – a gépi tanulásban használt algoritmussal – működik. Az egyik megpróbál létrehozni valamit, ami megfelel egy példagyűjteménynek, míg a másik megpróbál különbséget tenni a valódi és a hamis példák között. A verseny több fordulója során a hamisítvány-felismerő arra készteti a hamisítvány-generátort, hogy egyre jobb eredményt hozzon létre. A ma használt programok ennél komplexebb modellben működnek, de hasonló elvek szerint.
Milyen hatása van mindennek a tervezésre?
A kérdés többféle irányból is megközelíthető, és talán túl friss még a technológia ahhoz, hogy kimerítő választ adhassunk rá. Van, aki úgy tekint rá, mint egy újabb eszköz, ami felhasználható a tervezési folyamatban, az első ötletek gyors vizualizálása céljára. Andrew Kudless a Dezeennek adott válaszában például kiemelte, hogy az építészeti vázlatokhoz hasonlóan az AI-képek gyakran színesek és álomszerűek, de részletes tervként nem feltétlenül megvalósíthatóak. "Amikor ceruzával vázolok, nem aggódom, hogy az oszlop vagy bármi más pontosan a megfelelő helyen van-e" – mondta Kudless a Dezeen-nek. "Mert a vázlatnak az a célja, hogy hihetetlenül pontos vagy precíz legyen. Az a célja, hogy gyorsan megragadja a projekt vízióját."
Mi is megkerestünk olyan hazai építészeket, tervezőket és alkotókat, akiknek van már gyakorlati tapasztalata a képalkotó algoritmusokról, hogy mondják el, hogyan látják ők ezt az új technológiát. A parametrikus tervezéssel foglalkozó Németh Roland szerint a most lezajló AI forradalom – amit ő inkább gépi tanulási forradalomnak nevezne, mert az általános mesterséges intelligenciától távol állunk, és részfeladatokra lehet használni a jelenleg működő megoldásokat – hosszú évek megelőző adattudományi és fejlesztési munkájának az eredménye, nem a légüres térből jött. A sokat emlegetett ChatGPT alapját képező GPT3 modell már 2020-óta elérhető fejlesztői teszt változatban, a vele együtt reflektorfényt kapott DALL-E és Stable Diffusion képalkotó GAN engine-ek szintén évek óta elérhetőek – hívta fel a figyelmet a Paulinyi & Partners építésze. "Így elmondhatjuk, hogy nem derült égből villámcsapás az, ami zajlik. Az említett és egyéb gépi tanulás alapú eszközök tanításához, módosításához és saját céljainkra való hangolásához adatokra van szükség, sok adatra, hiszen a gépi tanulási motorok leegyszerűsítve fogalmazva statisztikai döntéshozatali rendszerek. Az adat-alapú és gépi logika vezérlet tervezési módszertanok kidolgozásán évek óta foglalkozunk a Paulinyi & Partners cégcsoportnál, ezek képezik az alapját a mélyebb gépi tanulási módszerek alkalmazhatóságának. Ez a tervezés minden területén jelentkezik, kivétel nélkül, de fontos aláhúzni, hogy a data science és általában az adat alapú megközelítés képezi az alapját mindennek."
Németh szerint a gépi tanulási forradalom be fog gyűrűzni a tervezési szoftverek világába is, átvéve és segítve bizonyos feladatokat, melyre ő hasonlóképpen tekint, mint a CAD forradalomra, amely a kézi rajznál sokkal gyorsabb rajzolást tesz lehetővé, amely a terv részletezettségben, módosítási sebességben és hatékonyságnövekedésben tud megnyilvánulni.
"Arra is fel kell készülnünk, hogy a ’Sims-házak’ után a megrendelők már képalkotó AI által generált ötletekkel jönnek a megbeszélésekre, amelyek sok esetben megépíthetőnek is tűnnek majd, hiszen a neten publikált tervek és kész épületek képezik ezen engine-ek tanulási készletét. A tervezői tudás segítő eszközévé kell tenni a gépi tanulást, ahogy tettül ezt az egyszerű Google kereséssel és minden egyéb már természetesnek vett web 2.0 szolgáltatással."
Hasonló álláspontot képvisel a látványtervezőként dolgozó Karlinger Manó, aki alapvetően egy újabb eszköznek látja a mesterséges intelligenciát, ami idővel lehetőséget ad majd arra, hogy egyetlen tervező a korábbihoz képest felfoghatatlanul komplexebb dolgokat alkosson. "Szerintem ez egy hihetetlen ´evolúciós´ vívmány, hogy a kollektív ismereteinket képesek vagyunk ilyen módon demokratizálni és egyetlen szöveg- vagy képgenerátorból elérni. Persze most még gyerekcipőben jár, de a fejlődés ütemét tekintve ez hamarosan már követhetetlen sebességű lesz" – szögezte le.
A MOME-n is oktató designer ugyanakkor arra is felhívta a figyelmet, hogy természetesen vannak veszélyei a technológiának, melyek közül hármat emelt ki. "Az egyik, hogy még nincsenek tisztázva jogilag, hogy szabad-e copyright anyagokkal tréningezni az algoritmusokat. Ez szerintem még évekbe kerül, mire eldől. A másik veszélye a társadalmi hatása: rengeteg ember fogja elveszteni a munkáját, és persze valószínűleg jönnek majd létre új munkahelyek is, csak nem ugyanannak a társadalmi rétegnek, mint akik munka nélkül maradtak. A harmadik probléma az esetleges visszaélések a technológiával – deepfake-ek, hamis hangfelvéltelek, dokumentumok stb."
Karlinger jelenleg arra próbál megoldásokat keresni, hogy saját gyakorlatába hogyan tudja integrálni a technológiát. "Számomra inspiráló folyamat, rengeteg koncepciót, ötletet tudok ezekkel az eszközökkel tesztelni. Számos új ötletet ad, megihlet egy-egy dolog, amit utána tovább viszek, egy nagyobb koncepciót építek belőle. Az AI-hoz art director szemmel kell hozzáállni és akkor az egész egy hatékonyságnövelő eszközként használható." – összegezte gondolatait a látványtervező.
Az építészként és képzőművészként is aktív Kőszeghy Flóra már egy ideje kísérletezik az AI különböző felületeivel, izgalmasnak tartja, ahogy néhány hónap alatt ennyire felforgatta a világot egy olyan láthatatlan entitás, amely már jó ideje velünk volt, de most mutatta meg magát látható formában. "Mivel rengeteg science-fiction-t olvasok, elég széles spektrumon tudom a jövőt elképzelni. A jelenleg zajló folyamatok elsősorban a kreatív szakmákat érintik, de nézhetjük úgy is, hogy az elefántcsonttoronyba zárt tudás demokratizálódik. Miért ne férhetne hozzá mindenki a képek megalkotásának lehetőségéhez?"
Elmondása szerint művészként nem fél attól, hogy olyan festményeket tud készíteni a mesterséges intelligencia, mint ő. "A művészet számomra mindig is egy öncélú, logikátlannak tűnő késztetésből fakadt, amelyre egy gép nemigen fog vetemedni. Eleve olyan festményeket igyekszem készíteni, amilyeneket még nem láttam, ez alapvetően ellentmond a bot működésének, nem is beszélve az anyaggal való kísérletezésről és a véletlenek áldásos ajándékairól."
Az építészet már más kérdés, mint mondja, mert ott igények és elvárások vannak, szabályokkal keverve, ami kényelmes terepnek tűnik egy algoritmus számára. "De tudjuk jól, hogy az építészet nem merül ki ennyiben. Vélhetően az AI be fog épülni a tervezői programokba és segíteni fogja a munkánkat. Ez egy eszköz, és rajtunk múlik, hogy mire használjuk. Nekem sikerült már jó és rossz házat is generáltani vele, de annak eldöntése, hogy melyik-melyik, alkotói kérdés lesz."
Blaumann Edit, a MOME doktorandája és az Építészfórum Építészet és biodesign cikksorozatának szerzője BioPunk Budapest címen készített AI által generált képsorozatot, melyhez a Midjourney programot használta. "Kezdetben egy infernális kurátorként gondoltam magamra, aki a fanatikus művész rabszolgáját hajtja éjt nappallá téve, hogy egy kitalált kiállítás anyagához készítse el a pazarnál pazarabb képeket. De hamar fel kellett ismernem, hogy magam váltam függőjévé az eszköz kínálta ihletet adó folyamatnak. A képet alakító szövegek újra és újra fogalmazása, az iterációk és reiterációk eredményeinek tengerében fürdőzés intellektuális felüdüléssel szolgált. Azaz – ami világos mindenki számára, aki használt már generatív képalkotót – ez az eszköz csak annyiban veszi el az alkotó munkáját, mint a gőzgép, a fényképező vagy a Photoshop. Ha úgy tetszik, ez is csak egy virtuális protézis, ami úgy egészíti ki az embert, mint egy kamera."
Blaumann a nem a valóságot ábrázoló képek tényként való feltüntetése mellett az adatbázis kérdésére hívta fel a figyelmet, ami az élet más területein is jelenlévő kortárs, angolszász kultúra kizárólagosságát hangsúlyozza. "Hiába próbáltam Tatlin Harmadik Internacionálé Emlékművét biopunk köntösben felépíteni, sajnos nem ismerte az eredetit a program. Azonban lehet, hogy épp az adatbázis kulturális kolonizálása kölcsönöz a BioPunk Budapestnek különös hangulatot. A Midjourney adatbázisának inkább múltidéző elképzelése van Budapestről. Az Úttörő áruház című képben a sorozat online követői felismerték a Kossuth Lajos utcát, de annak inkább a ’90-es évekbeli arcát. Így a gyenge Budapest adatbázis biopunk vízióval megtermékenyítve egy emlékből táplálkozó mágikus realista világot szült" – mesélte tapasztalatait az alkotó.
"A generatív képalkotó program olyan, mint egy kreatív gyerek, akit tanítgatsz, s aki újra és újra meglep "leleményességével", szórakoztat élénk "fantáziájával". Vagy mint egy játszótárs, egy vizuális társalkodónő, főként, ha teret hagyunk az algoritmus “képzelőerejének". Egy olyan professzionális szintű ötletelő masina, amit, ha egy erős vízióval, de szabadabb fogalmi promptokkal irányítunk, a spekulatív teremtés eszközévé válik" – vallja Blaumann.
A tapasztalt tervezők után adta magát, hogy megkérdezzük a ChatGPT-t is, szerinte milyen hatása lesz a mesterséges intelligencia alapú képalkotó algoritmusoknak az építészeti tervezésre. A program a következő választ adta:
A mesterséges intelligencia alapú képalkotó algoritmusok hatása az építészeti tervezésre jelentős lehet. Az algoritmusok képesek automatikusan létrehozni terveket és rendereléseket, ami megkönnyítheti és gyorsíthatja a tervezési folyamatot. Emellett a mesterséges intelligencia képes az épületek formájának, színeinek, stílusának és méretének optimális összeállítására, a tervezőknek pedig lehetőségük nyílik a különböző lehetőségek gyors összehasonlítására és választására.
A mesterséges intelligencia továbbá képes a terveket előrejelzésekre is alapozni, például az épület energetikai hatékonyságára, vagy a fenntarthatóságra vonatkozóan. Az algoritmusoknak képességük van az adatok elemzésére és a statisztikai modellek kialakítására, ami segítséget nyújthat a tervezőknek a döntéseik meghozatalában.
Összességében elmondható, hogy a mesterséges intelligencia alapú képalkotó algoritmusok növelhetik az építészeti tervezés hatékonyságát, valamint új lehetőségeket kínálhatnak a tervezőknek az épületek optimalizálására és a döntések meghozatalára. Azonban fontos megjegyezni, hogy a mesterséges intelligencia csak segédeszköz marad, a tervezőknek továbbra is kreativitásukra és szakmai tapasztalatukra lesz szükségük a kiváló épületek tervezéséhez.
Hová vezet mindez?
A mesterséges intelligenciához sokan determinista módon állnak hozzá, mintha a technológia léte önmagában hordozná annak lehetséges felhasználási módjait, és így társadalmi-kulturális hatásait – akár pozitív, akár negatív hatásokat társítsanak is hozzá. A technológiai determinizmus kritikusai szerint azonban a technikai jellemzőknél többet számítanak a társadalmi és politikai kérdések: a termelés körülményei, a felhasználási módok, az értékek, a célok, a készségek, a stílus, a választás, az ellenőrzés és a hozzáférés. Vagyis a mesterséges intelligencia, mint technológia önmagában nem jó vagy rossz, hogy milyen kulturális hatásokat fog generálni, az nagyban azon múlik, hogy hogyan és mire használjuk. P. Szathmáry István helyesen hívja fel a grafikusszakma figyelmét arra, hogy közös kiállásra van szükség a nagyobb megbecsültség érdekében. De önmagában a képalkotó algoritmusok megjelenése nem vezet szükségszerűen a grafikus, vagy bármely más kreatív szakma megszűnéséhez, mint ahogy a fényképezőgép sem okozta a festészet halálát, csupán átalakította azt, ahogy a képzőművészetről gondolkodunk. Hogy ki, hogyan és mire használja ezeket a technológiákat, az kétségkívül társadalmi viták témája kell, hogy legyen a következő időszakban. Mert való igaz, hogy néhány parancsszó beírásával bárki generálhat műalkotásnak kinéző képeket, azok attól még nem fognak valódi művészi értéket képviselni – ahogy egy jól sikerült fotó sem válik automatikusan műalkotássá. És egy tökéletesnek látszó épület sem lesz építészeti szempontból értelmezhető, hiába készít róla gyönyörű látványtervet a gép. Az algoritmusok által generált alkotások – legyen szó képről, szövegről, vagy akár zenéről – nem jöhetnek létre az emberi tényező nélkül. Talán még nem tartunk ott, hogy különbséget tudjunk tenni magas szaktudással rendelkező, a folyamatokat értő AI-felhasználók által generált képek és lelkes amatőrök képei között, de ez csak idő kérdése.
Néhány órával e cikk megjelenése előtt a Dezeen-en is megjelent egy újabb, hasonló témájú véleménycikk Neil Leach építész, a Florida International University professzora tollából, aki az Architecture in the Age of Artificial Intelligence: An Introduction to AI for Architects és a Machine Hallucinations: Architecture and Artificial Intelligence című könyvek szerzője, aki nem látja ennyire bizakodóan a jövőt. Leach szerint "végső soron az AI forradalom nem a képkészítésről szól, hanem arról a segítségről, amelyet az AI a teljes tervezési folyamat során nyújtani tud." Véleménye szerint igenis megvan a lehetősége annak, hogy a mesterséges intelligencia lekörözi az embert a kreativitás terén is, veszélybe sodorva ezzel az építészek munkáját. "A jövőbe tekintve biztosnak tűnik, hogy a mesterséges intelligencia hamarosan képes lesz teljesen autonóm módon építészeti terveket generálni – és ezzel potenciálisan egyáltalán nem lesz szükség építészre" – írja, hozzátéve, hogy "nekünk építészeknek most nem egy újabb épületet kellene terveznünk, hanem a szakmánk jövőjét."
Hogy mindez hosszú távon elvezet-e a munkaalapú társadalom megszűnéséhez, az OpenAI vezérigazgatója, Sam Altman által felvázolt kapitalista utópiához, vagy épp az Aaron Bastani publicista által vizionált "teljesen automatizált luxus kommunizmushoz" – mely két vízió meglepően hasonló módon képzeli el a jövőt, annak ellenére, hogy teljesen ellentétes ideológiai alapokon nyugszik – azt egyelőre érdemes fenntartásokkal kezelni, mint minden más techno-optimista megközelítést. Az viszont a megkérdezettek szavaiból is egyértelműen kitűnik, hogy a mesterséges intelligencia alkalmazása hamarosan a tervezési feladatok mindennapos része lesz. Ahogy a ChatGPT fogalmazott Leach fent idézett cikkében:
"Azok az építészek, akik úgy döntenek, hogy figyelmen kívül hagyják a mesterséges intelligenciát, lemaradnak és végül elfelejtődnek, ahogy az iparág fejlődik és halad előre. Ezért elengedhetetlen, hogy az építészek odafigyeljenek az AI-ra és annak az építészet forradalmasításában rejlő lehetőségeire, különben azt kockáztatják, hogy a feledés homályába merülnek."
Hulesch Máté