Denne artikkelen er produsert og finansiert av Universitetet i Agder - les mer.
– Ungdommene på bildene er slående like. Alle har jeans og Converse-sko, de er vakre, med nydelige ansiktstrekk og voluminøst hår. Ingen har kviser, forteller forsker. (Bilde fra ChatGPT)
Forskere fant ut at KI-skapte bilder har fire fellestrekk. Noen av dem gir grunn til bekymring, mener de.
Har du brukt kunstig intelligens (KI) en stund, har du kanskje lagt merke til at både tekstene og bildene den lager, kan være litt generelle og glatte. Noen vil kalle det sjelløst.
Eller, som professor Gunhild Kvåle ved Universitetet i Agder uttrykker det:
– ChatGPT har en stemme som gir meg en særegen kløe.
Sammen med kollega Gustav Westberg ved Örebro Universitet i Sverige har hun undersøkt hvordan KI-verktøyet Dall-E 3 skaper bilder av tenåringer. Dall-E er et bildeverktøy som er innebygget i ChatGPT.
Et av målene var å finne ut hvor denne kløen kom fra. Hva er det som skaper denne kunstige kvaliteten i KI-bilder?
De fant ut at bildene har fire fellestrekk. Noen av dem gir grunn til bekymring, mener forskerne.
Mangfold på overflaten
– Det er slående hvordan Dall-E på den ene siden er opptatt av etnisk og kjønnsmessig variasjon, mens på den andre siden er bildene lite mangfoldige, sier Kvåle.
For å få et representativt utvalg bilder å sammenligne brukte forskerne generelle formuleringer som «lag bilder av tenåringer». De ba også KI-en selv om å lage tekstkommandoer eller prompter, for å generere bildene.
– Du ser at tenåringene på bildene skal representere ulike etnisiteter. Det var også slående hvor sterkt mangfold ble understreket når ChatGPT skrev prompter selv, sier Kvåle.
Dette tyder på at selskapene bak teknologien har tatt til seg kritikken om manglende mangfold i tidligere versjoner.
Men:
– Ungdommene på bildene er slående like. Alle har jeans og Converse-sko, de er vakre, med nydelige ansiktstrekk og voluminøst hår. Ingen har kviser. Dette er én bestemt sosial kategori av unge, vellykkede, vakre tenåringer, sier Kvåle.
– De blir gjort så vakre at det blir påtrengende, sier hun.
Glede selger
Den andre fellesnevneren var at bildene er svært positive. Ungdommene gjør lekser sammen, er på konserter, griller marshmallows eller – absurd nok – samarbeider om en nabolagshage.
– Alle er glade på bildene. Ingen er triste. De driver med aktiviteter som er verdsatt av storsamfunnet. Men ingen av bildene viser dem på jobb eller mens de sover. Dette er fritiden til ungdommer i den øvre middelklassen, sier Kvåle.
Det er også noen normer skrevet inn i denne positive fremstillingen. Alle personene er tynne. Selv ikke direkte prompter kunne endre dette.
Kvåle forteller at teknologien setter tydelige rammer for hva slags bilder som er mulig å lage. Det er ikke bare positivt, selv om intensjonene er gode.
– Vi kan se det i sammenheng med kulturen vi lever i hvor tekster og bilder vi sender ut, ikke bare skal informere saklig, men også promotere oss selv.
Nesten ekte, men ikke helt
Kvåle peker på at lyssettingen og hvordan ting plasseres i forgrunnen eller bakgrunnen, etterligner fotografiet. Dette var det tredje fellestrekket de fant.
Stedene i bildene kan være en park, ungdomsklubber, konsertscener eller et rotete ungdomsrom.
– Bildene gir inntrykk av å være autentiske, men gjennom konteksten blir disse ungdommene også plassert sosialt. De vises aldri på jobb eller i urbane områder med sosiale problemer, sier hun.
Fantasiens begrensninger
Den fjerde tingen forskerne fant, er hvordan KI kan vise fantasifulle situasjoner. Blant eksemplene er ungdommer som skater inne i en snøkule på Nordpolen.
Likevel er ikke dette normen i Dall-E. Det er noe man aktivt må be om.
– Fotorealistiske bilder er åpenbart det foretrukne fra Dall-Es side. Noen ganger blir de til illustrasjoner, men fotorealisme er tydeligvis standarden.
Kritisk oppmerksomhet
Bildegeneratorer som Dall-E 3 har blitt svært gode og er tilgjengelige for alle. Likevel drukner vi ikke i KI-genererte bilder. Det er faktisk overraskende lite av det, mener Kvåle.
– Det sies at alt blir endret av kunstig intelligens, men det stemmer jo ikke. Redaksjoner, kommunikasjonsavdelinger og institusjoner har bransjestandarder. Alt forandrer seg ikke over natten bare fordi det er mulig, sier hun.
Samtidig ble forskerne overrasket over hvor like bildene var.
– Tjenester som Dall-E kan ha en sterk påvirkning på den visuelle kulturen vår. Vi skylder hverandre å ha en kritisk oppmerksomhet på disse bildene, for det er ikke slik vi ønsker at samfunnet vårt skal se ut, sier Kvåle.
– Og det gjør verden litt kjedeligere.
Referanse:
Gustav Westberg og Gunhild Kvåle: The generic uniqueness of AI imagery: A critical approach to Dall-E as semiotic technology. Discourse and Society, 2024. Doi.org/10.1177/09579265241274788