A gépek a nagy adathalmazokban keresnek, míg az emberi agy kategorizál, és csoportosítja az infomációt. Mario Carpo ezen két feldolgozási stratégia között teremt hidat építészetelméleti megközelítésével. A Bartlett Reyner Banham professzorával készült interjú segít átfogóan értelmezni, hogy hogyan válhat egyenlővé a sztereotípia archetípussal a Látens Térben, s hogy mi a kapcsolat a Large Language Model és az építészet között.
Mario Carpo a témában alapműnek számító, az MIT Press által publikált Digital Turn in Architecture és a Second Digital Turn után a Beyond the Digital című könyvek szerzője, valamint számos szakcikk írója. A témában egyedülálló nézőpontja az itáliai reneszánsz ismeretén, és a korszak immár történelmi eseményei és a jelenkor közötti párhuzamok megfigyelésében rejlik. Az alábbi interjúban a digitális fordulatról és arról beszélgettünk, hogy miként látja a mesterséges intelligencia szerepét az építészetben. Milyen építészeti jövőképet vetítenek elénk a kreatív kísérletek.
Bognár Melinda: Idén tavasszal jelent meg a Beyond Digital című legújabb kötete, ami az ipari tömegtermelés és a modernizmus végét indikálja a robot automatizálás és a mesterséges intelligencia eljövetele által. Hogy néz ki napjainkban az új technológiákkal való kísérletezés mind az építészeti tervezésben, mind a gyártásban?
Mario Carpo: Mióta megjelent a Beyond Digital, ami a gyártási technológiákról szól, folyton a Generatív Mesterséges Intelligenciával kapcsolatban kérdeznek a Midjorney, Dall-e, ChatGPT kapcsán. Ezeknél az alkalmazásoknál fel kell építeni egy adathalmazt, amiből az algoritmus extrapolál egy nagy nyelvi modellt (large language model) vagy egy látens teret (latent space), attól függően, hogy képeken vagy verbális kifejezéseken alapul-e. A látens tér egy mátrix, amelyet új képek generálására használnak, amelyek mindegyike hasonló, de mégis különbözik az adatkészletben szereplő képektől.
Tehát ha készítesz egy 1 millió kutyás képből álló adatkészletet, a látens térnek lesz egy elképzelése az ideális kutyáról, a szuperkutyáról. Majd az új képek, amiket a látens térből generál, hamis kutyák lesznek. Valósághű képek lesznek kutyákról, amelyek nem léteznek.
BM: Mit jelent ez a jelenség egy művészettörténész szemszögéből?
MC: Ha művészettörténészként tekintünk rá, a gép az adathalmazt utánozza. Az utánzás nem jelent azonos másolatot, abban az értelemben, ahogy arra egy fénymásológép képes. Ez a kreatív utánzás, mert minden másolat különbözik az archetípustól. Ha 1000 fehér kutyáról készült képet töltesz fel, akkor a látens térben fehérként fog megjelenni a kutya fogalma. Tehát csak hamis fehér kutyákról készít majd képeket, ezáltal a gép megtanulja a fehér kutya stílusát.
Ha most a kutyák helyett építészettel csináljuk ugyanezt, és feltöltesz 1 millió képet a barokk építészetről, akkor a gép megtanulja a barokk stílus meghatározását. Ezután a látens teret - ami a stílus absztrakciója - új képek létrehozására tudja alkalmazni, amelyek mindegyike valahogy barokk lesz. Ezt nevezik stílustranszfernek. Nem mondjuk meg a gépnek, hogy mi a barokk, csak barokk példák hatalmas adathalmazával látjuk el a gépet. Tehát ha betanítjuk a gépet, hogy megtanulja az alapvető barokk stílust, majd feltöltünk egy képet egy macskáról, akkor a gép barokk stílusú képet készít macskáról.
BM: Tehát hogyan profitálhatnak az építészek ebből a módszerből?
MC: Ez egy utánzógép, és emiatt korlátozott érdeklődést mutat iránta az építészeti tervezés. Nem igazán szeretjük azt gondolni, hogy utánozunk, inkább azt, hogy kitalálunk.
Persze néhány építésznek valóban utánoznia kell. Például Patrich Schumacher generatív mesterséges intelligencia segítségével tervezi Zaha Hadid stílusát. Létrehoztak egy adatkészletet saját portfoliojukból, ami alapján a gép megtanulta Zaha Hadid stílusát.
Ezáltal az ügyfél bemehet az irodába, és kérheti, hogy építsen egy szállodát Mongóliában Zaha Hadid stílusában. Tehát marketingeszközként a klienssel való első találkozáskor a gép automatikusan hatalmas számú, saját adatkészletük alapján létrehozott opciót állít elő. Természetesen, amikor áttérnek a tényleges tervezésre, nem használhatják a generatív Ai-t, de marketingeszközként a gép a helyszínen tud rendereket készíteni. Így sok időt takarít meg, és költséghatékony. A gép 20 perc alatt megcsinálja, ami általában hetekig tartó modellezést és renderelést igényel.
Más szempontból egy olyan gépet hoz létre, amely örökké ismétli az adott stílust. Amit természetesen egyetlen építész sem tenne meg. Ha ugyanazt megismételnénk, az unalmas lenne nekünk és ügyfeleinknek is. Így marketingeszközként bizonyos mértékig hasznos, de tervezőeszközként már kevésbé.
BM: Mi ennek a technológiának az elméleti tanulsága?
MC: Ez az eszköz azt tanítja nekünk, hogy minden a precedenstől függ. Ha valaki generatív segédprogramot szeretne használni, függetlenül attól, hogy mi a projekt, először egy adatkészletet kell létrehoznia. Mert adathalmaz nélkül nincs látens tér, látens tér nélkül nincs generáció. De mi is az az adathalmaz? Az adathalmaz példák gyűjteménye, precedensek gyűjteménye. Ez azt jelenti, hogy azt a precedenst választja, amelyre hivatkozni szeretne. Ez a precedens, ha úgy tetszik, lehet a technológián kívül hagyomány, kultúra, nyelv, kód, ez egy kánon. Amikor létrehozza az adatkészletet, kiválasztja azt a kánont, amelyre hivatkozni szeretne. Tehát egy tipikus játék, amit az iskolában játszhatnánk: "Mutasd meg az adatkészletedet, és megmondom, ki vagy."
Amikor alkotunk, mindannyiunknak eszünkbe jut valami. Egy stílus, egy kultúra, egy nyelv, egy kánon. De ha spontán teremtünk, akkor nem racionalizáljuk a kánont. Akár tudattalan is lehet. Minden vázlatot, minden rajzot, amit készítünk, bizonyos mértékig befolyásolja valami, amit láttunk. Minden, amit írunk, valamilyen emléken alapul, amit olvastunk, amit újra létrehozunk. Minden szónak, amit használunk, van jelentése, mert valaki már használta, precedensként, kánonként vagy konvencióként. Nincs alkotás bizonyos fokú utánzás nélkül. Nincs találmány bizonyos fokú konvenció nélkül. Nincs terv kánon, precedens, nyelv vagy hagyomány nélkül. Ez egy identitás. Mert ha kánont választasz, azzal azonosulsz. Ha játszol a generatív Ai játékkal, az átlátható, mert amikor felállítod a saját adatkészletedet, választasz.
BM: Hová vezet ez a játék?
MC: Az építészet játékát játsszuk. Mindig a kutyák példáját használom, de gondolj bele, mit tenne a rendőrség ugyanazzal a technológiával. Képzeld el, ha lenne 1 millió arckép bűnözőkről. Megalkothatnák az ideális bűnöző, vagy más szóval az archetipikus bűnöző képét. Ez lenne a platóni eszme, a bűnöző archetípusa, az egyetemes bűnöző. Megmutatná, hogy az egész világon így néz ki egy bűnöző.
Vagy képzelje el, ha kereskedelemmel foglalkozik, és fagyasztott pizzát szeretne eladni. Ideális pizzasütőt szeretne a pizza dobozára tenni. Hogy néz ki egy ideális pizzasütő? Ha ötleteit az adathalmazba helyezi, a gép ezzel fog játszani. Tehát lehet, hogy ez egy perverz technológia, mivel valamiféle sztereotípiákat teremthet. Hogy néz ki az összes drogdíler? Van egy drogdíler stílusa? Bizonyos mértékig valószínűleg igen.
BM: Ezen a ponton mi a különbség a sztereotípia és az archetípus között?
MC: Nos, nincs különbség. Az archetípus filozófiai konstrukció, míg a sztereotípia az előítélet gondolatát hordozza magában. Az archetípus a platóni eszme, tehát nem olyanok, amilyenek, hanem olyanok, amilyennek lenniük kell. Ez nem egyedi eset, hanem általános eset. Megpróbáltam egy ilyen, az előbb említett nagy nyelvi modellt használni, hogy megnézzem, milyen lenne a szülővárosom. Beírtam a szülővárosom nevét, és ami felbukkan, úgy néz ki, mint a szülővárosom, de valójában nem létezik. Nem az én szülővárosom, hanem a szülővárosom ideális képe, olyan, amilyennek lennie kell, mint a platóni eszme. Így működik a technológia. Példagyűjteményből épít absztrakciót, univerzális gondolatokat. Ismeretelméletileg és filozófiailag is lenyűgöző, sőt aggasztó technológia. Lehet, hogy sok mindenben alkalmazzuk, de a tervezésben nem.
BM: Ami a képeket illeti, mindig reprezentációkkal működik, de információval nem. Hogyan kapcsolhatjuk össze az információt a képpel?
MC: Nos, a nagy nyelvi modellek adatkészletekkel működnek. Ha az adatkészlet szöveg, akkor a gép megtanul írni, ha az adatkészlet képekből áll, akkor a gép tanul a képekből, ha az adatkészlet zene, akkor a gép megtanul zenét komponálni. Ha egy adatkészlet egy kőműves gesztusa, ahogy falat épít, a gép megtanulja ugyanerre a robotkezet használni. Még nem történik meg, de a szellem ugyanaz. Tehát ismét emlékeztet bennünket a precedensek elkerülhetetlenségére. Amikor alkotunk, precedenst kell szem előtt tartanunk. De ezt elfelejtettük, mert a modernizmus ezt nem szerette beismerni. A klasszikus hagyomány mindig is ezt a gondolatot tartotta szem előtt. A modernizmus nem szerette, mert a forma követi a funkciót. De valójában, amit ez a technológia létrehoz, az a precedensek kulturális elkerülhetetlenségének technikai emlékeztetője. Emlékeztet bennünket elménk működésére. Mert a neve mesterséges intelligencia. Olyan mérnökök alkották meg, akik a természetes intelligenciát akarták utánozni.
BM: Mi a helyzet az építéssel és az alkotással?
MC: Erről szól a könyvem. A digitális gyártás az ipari forradalom kizsákmányoló jellegének orvoslása, ami fenntarthatatlan módon használta ki a forrásokat. Vannak olyan munkák, amelyeket már nem akarunk csinálni. De pontosan ezek a kézi műveletek, amire a robotok képesek. Ha egy robot képes lenne téglarakásra, senki sem panaszkodna rá.
BM: Ezek hagyományos szakmák. Van még értelme a téglarakásnak a digitális gondolkodásmódban? Vagy a digitalizációnak változtatnia kell ezeknek a műveleteknek az anyagán vagy tárgyán is?
MC: Természetesen a számítások segítségével új anyagokat találhatunk ki, amelyek hatékonyabbak és kevésbé pazarlóak, mint a régi anyagok. A vasbeton 1909-ben rendkívül jó ötlet volt, de ma már nem fenntartható, mert túl sok energiát használ fel a kapott eredmény eléréséhez. A mai technológiával a vasbetont helyettesíthetjük olyan anyagokkal, amelyek jobban működnek és olcsóbbak, mind gazdasági, mind környezetvédelmi szempontból.
A fa bonyolult. Manapság mindenki annyira megszállottja a faanyagnak, különösen a rétegelt-ragasztott faanyagnak. Ez erősen megmunkált fa. De az Amerikában használt összes rétegelt-ragasztott fa Ausztriában készül. Ez azt jelenti, hogy a rétegelt-ragasztott fa nagyon fenntartható anyag, ha az erdő melletted van. Ha egy másik kontinensen van, az már nem annyira jó ötlet. De ha sikerül az alapanyagot a talált hely mellett használni, akkor nyilvánvalóan fenntarthatóbb. Például a kő. Ha a ház mellett talált kőből épít valaki egy házat, akkor az valóban szén-dioxid-mentes. A hagyományos kultúra mindig is ezt csinálta. Nem volt alternatívájuk, nem utazhattak másik kontinensre. Ha valaki az iparosodás előtti gazdaságban élt, egy alpesi régióban, amely évszázadokon át elszigetelt volt, akkor faházat kellett építenie a tehenek számára. Az építés megkezdése előtt először meg kell találni egy megfelelő fát. A leendő épület méretét a fa fesztávja határozza meg. Ezek után ez a folyamat egy fenntartható gazdaságot eredményezett.
Manapság a robotok képesek szkennelni, optimalizálni és falat készíteni. Ez az, ami 100 évvel ezelőtt 20 hónapnyi munkát igényelt volna az embereknek. Most a robotokkal ez fenntartható, kivéve az elektromosság előállítását, amely a robot működtetéséhez szükséges. De abban az esetben, ha az elektromosság turbinákból érkezik, amelyeket helyi árammal látnak el, akkor minden helyben marad. Természetesen nem lehet így felhőkarcolót építeni, de az építéstechnológia magával hozza ezt a változást is.
Az építészfórum digitalizációval és mesterséges intelligenciával foglalkozó tematikus cikksorozatának célja a szakmai közönség megismertetése a mesterséges intelligencia gyökereivel, és lehetséges alkalmazási területeivel. A sorozat egyik fontos eleme, a szakma párbeszédre hívása, és gyakorló építészek, építőipari szereplők, szoftverfejlesztők valamint a mesterséges intelligenciával foglalkozó szakemberek álláspontjainak megismerése. A következő írásokban a technológiai fejlődésének építészeti vonatkozásai kerülnek fókuszba.
Bognár Melinda
A cikk az Építészet és digitális elmélet című sorozatunk része. A sorozat további részei itt érhetőek el. A cikksorozat támogatója az NKA. Sorozatszerkesztő: Bognár Melinda