7 minute read
Artikel / ai och framtidens fotografi
AI
Bör kreatörer bäva?
Advertisement
Ofta är det med en blandning av skräck och skratt man betraktar resultaten som bildskapande ai-verktyg spottar ur sig. Ska detta föreställa vår nya visuella värld? Är det här den bildvärld som maskinerna kommer att ersätta våra manuellt framställda fotografier med framöver?
Som så ofta när tekniken rör sig snabbt i nya riktningar börjar vi människor oroa oss för att maskinerna ska ta över våra liv och våra jobb. Och kanske hade vi hoppats att just våra kreativa yrken skulle klara sig undan den artificiella intelligensens inblandning. Men det verkar inte så.
Många fotografer använder förmodligen redan ett antal ai-baserade verktyg, kanske utan att tänka på det: innehållsanpassad borttagning, snabbmarkeringar och inte minst de neurala filter som finns i Photoshops senaste versioner och bygger på ai-teknik. Vi ser de här funktionerna som användbara hjälpmedel snarare än som hot mot våra jobb, men när ai-tekniken börjar skapa sina egna alster kan det börja kännas mer hotfullt.
Jag ber Marcus Weiland, vice vd på ai-företaget Savantic, att berätta hur han tror att ai kommer att påverka vårt bildskapande framöver. Han tror att våra skapande yrken kommer Kommer artificiell intelligens göra fotografer överflödiga i framtiden? Framför allt vanliga genrebilder kommer snart att ersättas av AIgenererade bilder, tror teknikexperten. Men det lär fortfarande behövas både bröllops och reportagefotografer.
TexT: Lena KäLLberg
»Man i blå rock går genom dimmig skog.«
»Äldre kvinna dansar i gul klänning.«
PROMPT
De flesta AI-baserade verktyg för bildskapande bygger på prompten, det vill säga den text som kreatören skriver in som beskrivning på bilden som ska skapas. Genom att ändra i prompten kan man finjustera instruktionen till modellen för att göra ändringar i bilden.
GAN-MODELLER
(Generative Adversarial Networks). En GAN-modell består av två så kallade neurala nätverk, som arbetar tillsammans, eller snarare mot varandra, för att skapa »troliga« bilder. Det ena nätverket skapar bilder och det andra försöker skilja på dessa bilder och »riktiga« bilder. När träningen är klar behåller man bara det nätverk som genererar bilderna.
DIFFUSIONSMODELLER
En diffusionsmodell är en AI som lär sig att ta bort brus i en bild och fylla i bilden med det som verkar saknas. Genom att successivt öka mängden brus tvingas modellen att mer och mer utgå ifrån texten. Till slut ger man AI:n en bild som helt består av brus, plus en textprompt. Då börjar modellen ta bort bruset och fylla i detaljer tills en bild som matchar prompten framträder.
Det här är resultatet av en MidJourney-prompt i stil med »modefoto från 1970-talet med bleknade Polaroid-färger«.
»Migrantarbetare i Qatar.« »Gatuprotester i Iran.«
att påverkas lika mycket av ai-tekniken som alla andra områden. – ai kan användas till så mycket, så frågan är inte om, utan när, ai gör entré, i bransch efter bransch. När det gäller kreativa yrken ser vi ju att ai redan används inom musik, text, design och illustration.
Men det här med att skapa bilder från grunden med ai, hur funkar det egentligen? – För att en ai ska kunna skapa något måste den först tränas, vilket betyder att den lär sig upptäcka mönster i data. Den visuella kreativiteten – om vi nu tillåter oss att kalla den så – hos en ai uppstår ur kopplingarna mellan bilder och de texter som beskriver dem. Dall-E 2, till exempel har tränats genom att titta på 650 miljoner bilder på internet och deras textbeskrivningar, säger han.
Tekniken som används kallas gpt-3. Den användes från början för att skapa texter med hjälp av ai, utifrån några få ord, en så kallad prompt. Det visade sig att samma teknik, med vissa justeringar, går utmärkt att använda även för att skapa bilder. – Så utgångspunkten för att skapa bild är densamma, man beskriver i text, mer eller mindre detaljerat, vilken bild man vill ha. ai-modellen jobbar en stund och presenterar sedan en eller flera bildvarianter som den tycker passar, enligt sin egen uppsättning associationer mellan bild och text, säger Marcus.
Det låter ju smidigt. Men jobben då? Kommer ai att göra fotografer överflödiga? – Nej, det tror jag inte. Jag tror att genrebilder, stockfoton, i allt högre grad kommer att skapas med ai-verktyg, men det går ju inte att helt överlåta till en ai att skapa till exempel bröllopsfoton eller reportagebilder. Många bilder måste ju fortfarande fotograferas på en verklig plats.
En ai är bra på att utföra smala, väl definierade, uppgifter, men den har ju ingen fotografisk blick, så människan behövs fortfarande för att ge instruktioner och välja ut rimliga bilder. – Jag tror framför allt att ai kommer att användas till tidsödande redigering, exempelvis för att restaurera bilder, säger han. Kanske blir det snarare så att det kommer att skapas en ny yrkeskategori. Konsten att skapa bilder med ai är snarare en konst att förklara vad man vill ha fram, på ett sätt som ai:n förstår. Det gäller att kunna verbalisera en massa kunskap som annars sitter i ryggmärgen: val av optik, perspektiv, beskärning, färgskala, skärpedjup, allt sådant måste man säga i stället för att göra.
Men varför ger ett antal ai-forskningslabb oss nästan kostnadsfritt tillgång till de här imponerande bildverktygen? När jag läser företagens beskrivningar av sig själva får jag en känsla av att de egentligen strävar mot något helt annat än att jag ska ha kul med att skapa knasiga bilder på löpande band. – Visst är det så! De här forskarna fokuserar på att undersöka hur ai kan bli bättre, och emellanåt trillar det ut tillämpningar, lite som en biprodukt. Att ett stort antal bildskapare använder ett sådant här verktyg hjälper forskarna framåt. Information om vilka av ai:ns bildförslag som godkänns eller ratas av användarna matas tillbaka i systemet och trimmar in ai:n så att den blir bättre.
Efter mina egna första prova-på-dagar med ai som bollplank kan jag konstatera att det är som att ha en otroligt kreativ och ganska knäpp kollega vid sin sida hela tiden. En som inte ens blir sur om jag väljer bort det den har skapat.