Artikel / ai och framtidens fotografi

from Fotografisk Tidskrift 4 2022

Teknik / Gör rätt med kalibrering av skärm

AI

Bör kreatörer bäva?

Ofta är det med en blandning av skräck och skratt man betraktar resultaten som bildskapande ai-verktyg spottar ur sig. Ska detta föreställa vår nya visuella värld? Är det här den bildvärld som maskinerna kommer att ersätta våra manuellt framställda fotografier med framöver?

Som så ofta när tekniken rör sig snabbt i nya riktningar börjar vi människor oroa oss för att maskinerna ska ta över våra liv och våra jobb. Och kanske hade vi hoppats att just våra kreativa yrken skulle klara sig undan den artificiella intelligensens inblandning. Men det verkar inte så.

Många fotografer använder förmodligen redan ett antal ai-baserade verktyg, kanske utan att tänka på det: innehållsanpassad borttagning, snabbmarkeringar och inte minst de neurala filter som finns i Photoshops senaste versioner och bygger på ai-teknik. Vi ser de här funktionerna som användbara hjälpmedel snarare än som hot mot våra jobb, men när ai-tekniken börjar skapa sina egna alster kan det börja kännas mer hotfullt.

Jag ber Marcus Weiland, vice vd på ai-företaget Savantic, att berätta hur han tror att ai kommer att påverka vårt bildskapande framöver. Han tror att våra skapande yrken kommer Kommer artificiell intelligens göra fotografer överflödiga i framtiden? Framför allt vanliga genrebilder kommer snart att ersättas av AIgenererade bilder, tror teknikexperten. Men det lär fortfarande behövas både bröllops och reportagefotografer.

TexT: Lena KäLLberg

»Man i blå rock går genom dimmig skog.«

»Äldre kvinna dansar i gul klänning.«

PROMPT

De flesta AI-baserade verktyg för bildskapande bygger på prompten, det vill säga den text som kreatören skriver in som beskrivning på bilden som ska skapas. Genom att ändra i prompten kan man finjustera instruktionen till modellen för att göra ändringar i bilden.

GAN-MODELLER

(Generative Adversarial Networks). En GAN-modell består av två så kallade neurala nätverk, som arbetar tillsammans, eller snarare mot varandra, för att skapa »troliga« bilder. Det ena nätverket skapar bilder och det andra försöker skilja på dessa bilder och »riktiga« bilder. När träningen är klar behåller man bara det nätverk som genererar bilderna.

DIFFUSIONSMODELLER

En diffusionsmodell är en AI som lär sig att ta bort brus i en bild och fylla i bilden med det som verkar saknas. Genom att successivt öka mängden brus tvingas modellen att mer och mer utgå ifrån texten. Till slut ger man AI:n en bild som helt består av brus, plus en textprompt. Då börjar modellen ta bort bruset och fylla i detaljer tills en bild som matchar prompten framträder.

»Jag tror framför allt att AI kommer att användas till tidsödande redigering, exempelvis för att restaurera bilder «

Det här är resultatet av en MidJourney-prompt i stil med »modefoto från 1970-talet med bleknade Polaroid-färger«.

»Migrantarbetare i Qatar.« »Gatuprotester i Iran.«

att påverkas lika mycket av ai-tekniken som alla andra områden. – ai kan användas till så mycket, så frågan är inte om, utan när, ai gör entré, i bransch efter bransch. När det gäller kreativa yrken ser vi ju att ai redan används inom musik, text, design och illustration.

Men det här med att skapa bilder från grunden med ai, hur funkar det egentligen? – För att en ai ska kunna skapa något måste den först tränas, vilket betyder att den lär sig upptäcka mönster i data. Den visuella kreativiteten – om vi nu tillåter oss att kalla den så – hos en ai uppstår ur kopplingarna mellan bilder och de texter som beskriver dem. Dall-E 2, till exempel har tränats genom att titta på 650 miljoner bilder på internet och deras textbeskrivningar, säger han.

Tekniken som används kallas gpt-3. Den användes från början för att skapa texter med hjälp av ai, utifrån några få ord, en så kallad prompt. Det visade sig att samma teknik, med vissa justeringar, går utmärkt att använda även för att skapa bilder. – Så utgångspunkten för att skapa bild är densamma, man beskriver i text, mer eller mindre detaljerat, vilken bild man vill ha. ai-modellen jobbar en stund och presenterar sedan en eller flera bildvarianter som den tycker passar, enligt sin egen uppsättning associationer mellan bild och text, säger Marcus.

Det låter ju smidigt. Men jobben då? Kommer ai att göra fotografer överflödiga? – Nej, det tror jag inte. Jag tror att genrebilder, stockfoton, i allt högre grad kommer att skapas med ai-verktyg, men det går ju inte att helt överlåta till en ai att skapa till exempel bröllopsfoton eller reportagebilder. Många bilder måste ju fortfarande fotograferas på en verklig plats.

En ai är bra på att utföra smala, väl definierade, uppgifter, men den har ju ingen fotografisk blick, så människan behövs fortfarande för att ge instruktioner och välja ut rimliga bilder. – Jag tror framför allt att ai kommer att användas till tidsödande redigering, exempelvis för att restaurera bilder, säger han. Kanske blir det snarare så att det kommer att skapas en ny yrkeskategori. Konsten att skapa bilder med ai är snarare en konst att förklara vad man vill ha fram, på ett sätt som ai:n förstår. Det gäller att kunna verbalisera en massa kunskap som annars sitter i ryggmärgen: val av optik, perspektiv, beskärning, färgskala, skärpedjup, allt sådant måste man säga i stället för att göra.

Men varför ger ett antal ai-forskningslabb oss nästan kostnadsfritt tillgång till de här imponerande bildverktygen? När jag läser företagens beskrivningar av sig själva får jag en känsla av att de egentligen strävar mot något helt annat än att jag ska ha kul med att skapa knasiga bilder på löpande band. – Visst är det så! De här forskarna fokuserar på att undersöka hur ai kan bli bättre, och emellanåt trillar det ut tillämpningar, lite som en biprodukt. Att ett stort antal bildskapare använder ett sådant här verktyg hjälper forskarna framåt. Information om vilka av ai:ns bildförslag som godkänns eller ratas av användarna matas tillbaka i systemet och trimmar in ai:n så att den blir bättre.

Efter mina egna första prova-på-dagar med ai som bollplank kan jag konstatera att det är som att ha en otroligt kreativ och ganska knäpp kollega vid sin sida hela tiden. En som inte ens blir sur om jag väljer bort det den har skapat.

»AI kan användas till så mycket, så frågan är inte om, utan när, AI gör entré, i bransch efter bransch.«

DALL-E 2

• openai.com/dall-e-2 En diffusionsmodell skapad av OpenAI. Varje prompt ger upphov till fyra bildförslag, som man kan välja att vidareutveckla. Förutom att skapa bilder kan verktyget också användas för inpainting, där man byter ut eller lägger till element i en bild, och outpainting, där man gör bildytan på en befintlig bild större, och låter modellen fylla ut tomrummet med innehåll. Gratis att skapa 50 uppdrag. Bilder som genereras med Dall-E 2 ägs av den som har skapat dem. Det går att neka OpenAI att återanvända ens alster, om man inte vill att de ska användas för vidareutveckling av verktyget.

CRAIYON

• craiyon.com En gratisversion av Dall-E. Verktyget skapar en panel med 3 × 3 oftast ganska märkliga bilder i »skärmupplösning«. Bildskapare har rätt att sprida bilderna på sociala medier, samt använda dem i forsknings- och utbildningssyfte, utan kostnad.

MIDJOURNEY

• midjourney.com En diffusionsmodell som är gratis upp till 25 uppdrag. Verktyget sägs vara speciellt duktigt på att skapa futuristiska och måleriska bilder. Själva användarupplevelsen känns också lite speciell, ganska teknisk: för att skapa bilder arbetar man på MidJourneys Discord-server, där man kommunicerar med en bot som genererar bilderna. MidJourney erbjuder Creative Commons-licens på det som skapas i verktyget, med rätt för vem som helst att vidareutveckla andras prompter och bilder. Betalkonton finns, där användaren får ha sina alster i fred.

STABLE DIFFUSION

• beta.dreamstudio.ai/dream Även detta en diffusionsmodell, utvecklad av företaget Stability.ai. Verktygets webbaserade gränssnitt heter DreamStudio, och där finns en hel del reglage att dra i för att skapa, redigera och finjustera bilder på många sätt. Gratis 200 prova-på-krediter. Företaget hänvisar till att copyright-frågor kring AI-genererad konst är komplicerade och skiljer sig åt mellan olika rättssystem.

Artikel / ai och framtidens fotografi

Next Article

Teknik / Gör rätt med kalibrering av skärm

AI

Bör kreatörer bäva?

PROMPT

De flesta AI-baserade verktyg för bildskapande bygger på prompten, det vill säga den text som kreatören skriver in som beskrivning på bilden som ska skapas. Genom att ändra i prompten kan man finjustera instruktionen till modellen för att göra ändringar i bilden.

GAN-MODELLER

DIFFUSIONSMODELLER

DALL-E 2

CRAIYON

• craiyon.com En gratisversion av Dall-E. Verktyget skapar en panel med 3 × 3 oftast ganska märkliga bilder i »skärmupplösning«. Bildskapare har rätt att sprida bilderna på sociala medier, samt använda dem i forsknings- och utbildningssyfte, utan kostnad.

MIDJOURNEY

STABLE DIFFUSION

THIS PERSON DOES NOT EXIST

• thispersondoesnotexist.com Ett gratis GAN-verktyg som skapar porträttfoton av personer som inte finns.

More articles from this publication:

Teknik / Gör rätt med kalibrering av skärm

Reportage / I studion med sagofotografen Puronne

Ordförande har ordet / Vi organiserar oss framåt

Förbundssidor / Sök stipendier

Juridik / Allt förändras

Samtal / Simon Mlangeni-Berg om förgänglighet

Juridik / dsm och fotografi

Recensioner / Lein, Lasthein, Westerlund och Strömbeck

Tankar om en bild / Elis Monteverde Burrau

This article is from:

Fotografisk Tidskrift 4 2022