De snelle opkomst van kunstmatig intelligente tekst-naar-beeld-generatoren spreekt tot de verbeelding. Maar de stormachtige ontwikkeling leidt ook tot zorgen over de toekomst van kunst en kunstenaars.

Kunstmatige intelligentie (AI) boekte in 2022 op allerlei gebieden grote vooruitgang. Een van de grootste schokken was de opkomst van AI-modellen zoals DALL·E 2, die een eenvoudige tekstuele beschrijving kunnen omzetten in realistische beelden.

‘Eind 2021 hadden we dit nog totaal niet verwacht, zou ik zeggen. Het is mind-blowing’, zegt Thomas Wolf, medeoprichter van Hugging Face, een website waarop mensen AI-codes en datasets kunnen delen.

‘Bepaal vooraf hoe je met ­extreemrechts omgaat’
LEES OOK

‘Bepaal vooraf hoe je met ­extreemrechts omgaat’

De media dragen bij aan het normaliseren van extreemrechts gedachte­goed, stelt politicoloog Léonie de Jonge. Daarom moeten ze grenzen stellen aan w ...

Vóór 2022 waren tekst-naar-beeld-AI’s een vrij prille technologie die slechts ruwe resultaten opleverde. Dit jaar is de ontwikkeling zo snel gegaan, dat een van de winnende inzendingen bij de kunstwedstrijd van de Colorado State Fair zelfs door een AI is gemaakt.

Transformers

Volgens AI-onderzoeker Mark Lee van de Universiteit van Birmingham in het Verenigd Koninkrijk ontwikkelde de technologie zo snel dankzij een samenkomst van hardware- en softwareverbeteringen. Ten eerste begonnen onderzoekers zogeheten transformers toe te passen op het genereren van afbeeldingen. Dat is een type algoritme dat in 2017 door ingenieurs van Google is uitgevonden. Transformers onderzoeken een reeks gegevens en voorspellen op basis daarvan het volgende deel van de reeks. Oorspronkelijk werden ze gebruikt voor tekstgeneratiemodellen, oftewel chatbots, zoals GPT-3.

Ten tweede werd de hardware in 2022 veel krachtiger. Daardoor konden enorme aantallen grafische kaarten worden samengebundeld om efficiënte supercomputers te maken. Die zijn ideaal voor het trainen van AI-modellen.

Lees ook: Kunstmatig intelligente chatbot ChatGPT legt je in de luren

Maar volgens Lee is de belangrijkste reden voor de vooruitgang dat grote bedrijven, met het geld en de middelen om deze modellen te trainen, een deel van hun bevindingen begonnen weg te geven. Ze boden zelfs beperkte toegang aan het grote publiek, wat een stortvloed aan interesse en nieuw onderzoek opleverde.

‘Je zou verwachten dat deze grote bedrijven al dit werk alleen maar voor zichzelf zouden houden om er geld mee te verdienen’, zegt Lee. ‘Het vrijgeven aan de bredere gemeenschap is onderdeel van een soort langetermijnvisie, want als je dat doet, gaan meer wetenschappers in dit gebied werken.’

Wow-effect

Volgens Wolf boekten transformermodellen inderdaad aanvankelijk winst bij het genereren van beelden. Maar de laatste maanden, stelt hij, loopt een nieuw type algoritme voorop, genaamd diffusion.

We vroegen DALL·E 2 om ‘een olieverfschilderij in de stijl van Vincent van Gogh waarop Vincent van Gogh naar zijn laptop kijkt en een facepalm maakt’, met dit als resultaat. Beeld: New Scientist NL, gegenereerd door DALL·E 2 .

‘Transformers werken, maar ze hebben de neiging om nogal gekunstelde resultaten te geven’, zegt hij. ‘Diffusionmodellen zijn heel anders dan transformers. Ze kunnen zeer fijnkorrelige afbeeldingen creëren. Dat is, denk ik, wat deze nieuwe modellen onderscheidt in termen van het ‘wow-effect’.’

Rioolwater

Deze AI’s blijken nu al ontwrichtend te werken. Adrian Alexander Medina, redacteur van literaire website en tijdschrift Aphotic Realm en ontwerper van boekomslagen, zegt dat hij al opdrachten verliest aan AI. Klanten genereren liever gratis beelden dan dat ze menselijke ontwerpers betalen.

‘Ik was een paar keer met mensen in gesprek, waarna ze besloten een andere richting in te slaan en een AI-gegenereerde cover te kopen of zelf te maken. Het is hun geld, hun goed recht. Maar ontmoedigend en irritant is het zeker’, zegt hij.

Fotolicentiebedrijf Shutterstock en onderzoeksorganisatie Open AI hebben in oktober zelfs een deal gesloten. Klanten van Shutterstock kunnen nu toegang kopen tot het nieuwste AI-model en het op verzoek beelden laten genereren. Medina vergelijkt dat met ‘rioolwater dat in de drinkwatervoorziening lekt’.

Datasets

Wat het verlies aan opdrachten nogal wrang maakt, is dat de AI-modellen worden getraind op enorme datasets die miljoenen van het internet geschraapte afbeeldingen omvatten – afbeeldingen die wél door menselijke makers geproduceerd zijn. Op de site Have I Been Trained kunnen mensen deze datasets doorzoeken op bewijs dat hun werk is gebruikt om de AI te voeden.

Uiteindelijk kan deze AI-doorbraak een dramatisch effect hebben op menselijke makers. AI kost minder tijd en minder geld, en levert toch maatwerk. ‘Een persoon kan in een paar uur tientallen afbeeldingen genereren en ze doorschuiven naar klanten die niet beter weten, of die het niks kan schelen’, zegt Medina.