1 minute read

GENERATIVE ADVERSARIAL NETWORK

Next Article
HYPER CHRONICLES

HYPER CHRONICLES

Irgendwann wusste ich nicht mehr weiter. Die Bilder, die ich erzeugte, lösten in mir nichts mehr aus. Mit zunehmender Bekanntheit der bildgenerierenden KI und den überall zu sehenden Ergebnissen begann mich die immerzu gleiche Ästhetik zu langweilen. Ich suchte nach einer Möglichkeit, wieder Spass an der Arbeit zu haben und eine Spannung in den Bildern erzeugen zu können. Ich beschloss, mit eigenen Datenbanken zu arbeiten und mich von Midjourney abzuwenden. Dies in der Hoffnung, die Variabeln besser in der Hand zu haben und vielfältigere Resultate erzeugen zu können. Mit der Webseite Runway ML habe ich eine Möglichkeit gefunden, meine eigene KI zu trainieren, indem ich das Modell “Generative Adversarial Network” (GAN) benutzte. Im Anschluss aufgeführt, sind meine Experimente mit GAN’s bezüglich Form und Ästhetik von Schmuckähnlichen Objekten. Die Suche nach der Wertigkeit von generiertem Schmuck ging in die nächste Phase.

«Generative Adversarial Networks» bestehen aus zwei neuronalen Netzen, dem Generator und dem Diskriminator, die gegeneinander arbeiten. Der Diskriminator wird mit einer grossen Menge von Bilddaten trainiert. Wenn wir davon ausgehen, dass das Ziel ist, ein GAN zu entwickeln, welches Bilder von Ringen generieren soll, würden wir den Diskriminator mit sehr vielen Bildern von Ringen füttern und ihn trainieren, indem wir ihn alle Attribute wie Materialien, Farben, Formen usw. von Ringen lernen lassen. Wenn der Diskriminator ausreichend trainiert ist, kommt der Generator ins Spiel. Der Generator beginnt mit der Erzeugung des ersten «falschen» Bildes eines Ringes, das dem Diskriminator vorgelegt wird. Der Diskriminator entscheidet nun, ob es sich bei diesem Bild um ein «echtes» Bild handelt (aufgrund seiner erlernten Fähigkeit, einen Ring zu erkennen) oder ob es sich um eine «Fälschung» des Generators handelt. Der Diskriminator entlarvt den ersten «falschen» Ring und diese Information wird nun an den Generator weitergegeben. Mit dieser Information ändert der Generator selbstständig sein Verhalten und versucht es mit einer verbesserten Version einer «Fälschung» beim Diskriminator. Dieser Vorgang wird so lange wiederholt, bis der Generator ein Bild erzeugt, das als «echt» deklariert wird. In diesem Szenario erhält der Diskriminator die Information, dass er getäuscht wurde und ändert sein Verhalten, um «Fakes» besser zu erkennen.

This article is from: