8 minute read
Zielbestimmung / Aufgabenstellung
Rebriefing mit ChatGPT
Zu Beginn versuche ich mittels Einsatz der Sprachmodell-KI ChatGPT ein Briefing für die wichtigsten Aspekte, die der Toaster erfüllen soll, zu erfassen. Die Zielgruppe bestimme ich dabei selbst. Festgelegt habe ich, dass ich für kleine Haushalte ein platzsparender und einfach zu bedienender Toaster gestalten möchte. Mit diesen Gegebenheiten wendete ich mich an ChatGPT und fragte, was es dabei zu beachten gilt.
Dabei wurde mir eine Liste mit acht wichtigen Faktoren ausgegeben; Funktionalität, platzsparendes Design, Sicherheit, Energieeffizienz, ästhetisches Design, Materialien, Benutzerfreundlichkeit und das Berücksichtigen der Zielgruppe. Diese Themen wurden dabei noch verständlich und nachvollziehbar ausformuliert und bieten eine Orientierung bei den weiteren Schritten.
Zielgruppe
Des Weiteren wollte ich genauere Informationen zu Aspekten, die es bei meiner Zielgruppe zu beachten gilt und fragte ChatGPT nochmals spezifischer.
Dabei nannte mir die KI erneut ähnliche Aspekte wie bei der Frage nach dem allgemeinen Briefing, formulierte jedoch die Erläuterungen noch etwas spezifischer auf die Zielgruppe. Hinzu kam der Preis, der nicht allzu hoch ausfallen sollte, um zugänglicher zu sein und die Menge an Toastscheiben, die der Toaster auf einmal toasten kann. Dies half jedoch, die Aspekte zu gewichten und so legte ich fest, dass die wichtigsten Faktoren der Energieverbrauch, die Grösse und die Kapazität für lediglich eine Scheibe sind. Die Sicherheit ist ebenfalls wichtig und somit muss dafür gesorgt werden, dass der Toaster gut isoliert sein sollte, um keine Verbrennungen zu verursachen.
Kundenmeinungen
Die Verwendung von ChatGPT eignet sich bestens, um Kundenrezensionen zusammengefasst anzufordern und so einen Einblick in den Markt für Toaster zu erhalten. Somit befragte ich die KI nach den gängigsten Beschwerden und den meist gelobten Aspekte von Toastern.
Dadurch wird klar, was den Nutzern bei einem Toaster wichtig ist und bei der Entwicklung eines neuen Toasters unbedingt berücksichtigt werden muss. Gleichmässiges Toasten ist ein sehr wichtiger Faktor. Das Produkt sollte zudem langlebig und reparierbar, einfach zu bedienen und zu reinigen sein. Zufriedene Kunden schätzen zudem einen schnellen Toastvorgang. Wiederum sorgt ein zu kurzes Netzkabel für Unzufriedenheit.
Danach erkundigte ich mich bezüglich aktuellen Trends bei neuen Toastern.
Dabei gab ChatGPT mir fünf Trends aus. Die smarten Funktionen wie die Bedienung per Smartphone widerspricht der einfachen Bedienung, zumal der Toast selbst von Hand zugeführt werden muss. Energieeffizienz, Nachhaltigkeit und ein bestechendes Design sind jedoch klare Aspekte, die ich beachten möchte.
Zweitfunktion
Eine Zweitfunktion mit einzubinden wäre eine Option, welche auch die Nutzung der Abwärme erlauben würde und so erkundigte ich mich noch dazu.
Das Hinzufügen einer Zweitfunktion, welche die Abwärme nutzen würde, könnte die Energieeffizienz tatsächlich erhöhen. Die Erwähnung der Erhitzung von Wasser hat mich jedoch stutzig gemacht, da ich weiss, dass Wasser viel Energie benötigt. Die Abwärme von ein oder zwei Toastvorgängen würde bei weitem nicht reichen, Teewasser zu kochen. Somit fragte ich nochmals nach.
Daraufhin bestätigte mir ChatGPT meine Überlegung und legte mir das Kochen oder Pochieren von Eiern nahe. Diese Option werde ich im weiteren Verlauf im Hinterkopf behalten.
Zwischenfazit - Zielbestimmung / Aufgabenstellung
Das Gespräch mit Jan-Christoph Zoels hat mir aufgezeigt, was das Ziel meines Toaster-Konzept ist. Der Kern meiner Arbeit mit der KI ist es, eine formale oder funktionale Innovation zu finden. Dabei gilt es herauszufinden, ob es möglich ist, mit einem solchen System, welches sich nur auf bestehende Daten bezieht, neue Ansätze zu finden oder ob es nur bekanntes reproduziert.
Durch die Besprechung mit Andreas konnte ich die Einbindung in den gesamten Designprozess systematischer gestalten und mich von meinem Fokus auf die Bild-zu-Text-KI‘s lösen. Dies öffnete mir den Blick für KI-Anwendungen anderer Art, welche mir in den verschiedenen Phasen des Prozesses behilflich sein können und ich im Rahmen dieser Arbeit auf ihren Mehrwert untersuchen kann.
Um mich in das Thema der Gestaltung eines Toaster hineinzugeben half das (Re-)Briefing durch ChatGPT sehr. Mit den richtigen Fragen ergaben sich wertvolle Faktoren, welche mir helfen, mich im weiteren Verlauf des Projektes zu orientieren. Aus diesen Unterhaltungen mit ChatGPT habe ich eine Liste an Anforderungen für den zu entwickelnden Toaster extrahiert. Die zu beachtenden Aspekte lauten:
• Energieeffizient
• Platzsparend
• Innovatives Design
• Nur eine Toastscheibe
• Benutzerfreundlich
• Langlebig
• Gut zu reinigen
• Sicher in der Verwendung
• Zeit für Toastvorgang
• Gleichmässiges Toasten
• evt. Zweitfunktion
Die Konversationen mit ChatGPT waren überraschend natürlich und man merkte, wie das System auf den bereits getätigten Fragen aufbaut. Dies gibt mir das Gefühl, bei allen möglichen Unklarheiten einen immer verfügbaren Ansprechpartner zu haben, welcher stets eine Antwort bieten kann. Nicht immer entsprachen die Antworten meinen Erwartungen jedoch gelangte ich mit ein, zwei weiteren Eingaben meist zu den gewünschten Informationen.
Recherche, Analyse, Synthese
In dieser Phase des Designprozesses möchte ich Referenzen mittels Text-zu-Bild-KI‘s generieren und mich dadurch inspirieren lassen. Dazu gilt es zuerst die geeignetste KI dazu zu finden und anschliessend einen Wortschatz zur Verfassung der Texteingaben aufzubauen.
Test von verschiedenen Text-to-Image KI‘s
Es gibt bereits eine grosse Auswahl an Künstlichen Intelligenzen, welche Bilder über die Eingabe von Text generieren. Einige waren schon namentlich in grossen News-Publikationen erwähnt worden, andere kennt man lediglich innerhalb der Community, die sich mit diesen neuen KI-Systemen auseinandersetzt.
Ich möchte herausfinden, mit welcher oder aber mit welchen Plattformen ich weiterarbeiten möchte, denn mit diesen KI-Systemen generiert man sowieso schon schnell einen enormen Output. Deshalb ist ein systematisches und sich selbst einschränkendes Vorgehen für mich zu Beginn zentral.
Ich habe mich dazu entschlossen vier in Frage kommende KI‘s miteinander zu vergleichen
Dall-E2 Die erste grosse Text-to-Image-KI von OpenAI. Bei Lancierung dieser Plattform haben viele haben viele Medien darüber berichtet. Dall-E befeuerte die Gespräche über das Potential von KI‘s und deren Auswirkung für Künstler, Grafiker, Illustratoren und ganz generell auf den Arbeitsmarkt.
Input Sie funktioniert durch reine Texteingabe und bietet keine weiteren Anpassungen. Sie ermöglicht jedoch das Ausradieren von gewissen Stellen im Bild und ermöglicht es dem Nutzer diese erneut zu generieren.
Kosten Die Bezahlung für den Dienst funktioniert über Credits, welche man mit Echtgeld kaufen muss und die dann für jede Generierung abgezogen werden.
Midjourney Die wohl am zweitmeisten erwähnte Text-to-Image-KI. Viele der viralen KI-Bilder wurden mit dieser Plattform erschaffen. Sie zeichnet sich durch sehr hochaufgelöste und detailreiche Outputs aus. Midjourney wird über die Socialmediaplattform Discord bedient und es gibt eine grosse Community, welche sich rege über Tipps und Tricks austauscht.
Input Die Eingabe der Prompt‘s funktioniert auch hier mittels Text. Jedoch ist die Eingabe in einer Art „Programmier-Schema“ aufgebaut und erlaubt es dem Nutzer, Bilder als Vorlage hochzuladen und über die Eingabe von Parametern in einer spezifischen Form (zB. -n = 2) noch weitere Anweisungen in den Prompt einzubinden. Dies ermöglicht beispielsweise auch das erwähnen von Dingen, die nicht auf dem Bild zu sehen sein sollten.
Kosten Die Nutzung dieses Dienstes wird in beanspruchten GPU-Minuten, also der Dauer der Nutzung von den Servern von Midjourney, gemessen. Zu Beginn erhält jeder 25 Minuten gratis. Sind diese aufgebraucht, muss man ein Abo auf monatlicher oder jährlicher Basis kaufen. „Basic“ mit 200 Minuten pro Monat kostet dann 10 CHF oder„Standart“ mit 900 Minuten pro Monat kostet 30 CHF. Wie viel eine Generierung benötigt, hängt von verschiedenen Faktoren ab und ist nur schwer zu beziffern.
PlaygroundAI Diese KI publiziert alle Generierungen ihrer Nutzer in einer Galerie. Die Entwürfe können von jedem bewertet werden und damit ergibt sich eine „Best-of“-Galerie mit den best bewerteten Bildern. Jedes Bild lässt sich anklicken und der Betrachter kann das gewählte Protokoll sowie den verwendeten Prompt einsehen. Man kann diese Prompts kopieren oder gleich das bestehende Bild remixen. Das durch diese Plattform verwendete KI-Protokoll heisst „Stable Diffusion“.
Input Die Eingabe des Prompts funktioniert bei PlaygroundAI ebenfalls über ein Textfeld, jedoch bietet diese Plattform gleich darunter noch ein zweites Textfeld für Dinge, die man explizit nicht auf dem Bild haben möchte. Zudem bietet es noch zwei Regler; einer für den Abweichungsgrad zum formulierten Prompt und einer für die Qualität und den Detailgrad. Diese Einstellungen wirken sich auf die für die Generierung benötigte Zeit aus.
Kosten Das grosse Argument für die Plattform PlaygroundAI ist, dass im Kostenlos-Modus das Generieren von 1000 Bildern pro Tag erlaubt. Eingeschränkt ist man jedoch in der Bilddimension und nach 50 Bildern wird auch die Qualität der Bilder limitiert.
LeonardoAI Diese KI ist fast noch ein kleiner Geheimtipp. Nach längerem Suchen nach kostenlosen Alternativen zu Midjourney stösst man dann jedoch früher oder später auf diese Plattform. Sie verfügt über viele verschiedene KI-Modelle. Nebst den von LeonardoAI selbst trainierten KI-Modellen können auch Nutzer ihre eigenen Modelle trainieren und öffentlich zu Nutzung aller freigeben. Diese Modelle haben andere Datensets zur Grundlage und sind spezifisch für gewisse Zwecke oder Stile gedacht.
Wie bei PlaygroundAI können hier ebenfalls die Ergebnisse anderer Nutzer eingesehen werden und der Betrachter kann die jeweiligen Prompt‘s und das verwendete Modell sehen.
Input Die Eingabe erfolgt in einem Textfeld und auch hier gibt es die Option eines zweiten Textfeldes für unerwünschte Dinge. Diese Plattform erlaubt es dem Nutzer zwischen einem bis zu acht verschiedenen Bilder mit dem gleichen Prompt zu generieren. Hier gibt es auch den Regler für den Abweichungsgrad zum formulierten Prompt und einer für die Qualität und den Detailgrad. Zudem kann hier auch ein Bild statt Text als Input verwendet werden.
Kosten Bis jetzt ist die Verwendung von LeonardoAI komplett kostenlos. Jedoch hat jeder Nutzer täglich nur 250 Tokens zur Verfügung und je nach Einstellungen benötigt eine Generierung einen bis mehrere solcher Tokens. Diese lassen sich zur Zeit nicht mit Echtgeld kaufen und erneuern sich lediglich jeden Tag wieder.
Um diese vier KI‘s zu Vergleichen und herauszufinden, welche davon für mein Projekt am geeignetsten ist, habe ich 10 verschiedene Prompt‘s geschrieben. Diese Prompt‘s gebe ich bei allen vier KI‘s ein und vergleiche anschliessend die resultierenden Bilder.
Die verwendeten Prompt‘s
Folgende Texte habe ich bei den vier KI-Systemen eingegeben. Dabei habe ich versucht eine Varianz von offenen bis hin zu spezifischeren Eingaben abzudecken und gleich verschiedene Satzstrukturen auszuprobieren. Zudem habe ich sowohl eine Marke (Dyson), eine Filmreferenz (Star Wars) als auch einen Designer (Dieter Rams) in die Eingaben eingebaut, um zu schauen wie die KI‘s mit diesen spezifischen Referenzen umgehen.
Die ersten neun Prompt‘s habe ich selbst verfasst und den letzten Prompt erarbeitete ich mittels ChatGPT. Die Text-KI gab mir zuerst einen sehr langen und in Prosa formulierten Prompt, welchen ich jedoch gespannt ausprobierte. Ich bat ChatGPT jedoch noch um die Kürzung dieses Prompt‘s in dem er diesen nur mittels Nomen und Adjektiven verfassen solle. Die 10 beziehungsweise 11 Texteingaben lauteten somit: Selbst verfasste Texteingaben:
1. toaster of the future
2. futuristic toaster in front of a white background
3. an innovative toaster in a reduced design, high quality product render
4. a floating toaster
5. a toaster inspired by the style of star wars movies
6. toaster in the style of dieter rams
7. a toaster designed by dyson
8. retrofuturism style toaster
9. a wirefree portable toaster in the shape of a walkman
Mittels ChatGPT erstellte Texteingaben:
CG1. Create a series of product renderings for an innovative toaster. The toaster should be able to toast different types of bread and have an easy-to-use user interface. The design should be modern and appealing, and blend well into a modern kitchen. Use different materials such as stainless steel, glass, and plastic to explore different design options.
CG1.1 Sleek 3D rendering toaster. Modern design. Seamless fit for contemporary kitchen. Toasts various bread types. Intuitive user interface. High-quality materials: stainless steel, glass, ceramic.
Die Resultate aller KI-System stelle ich in einer Tabelle einander gegenüber, um sie miteinander zu vergleichen und zu schauen wie die KI‘s die gleiche Aufgabe lösen. Aufgrund von dieser Gegenüberstellung möchte ich mich für ein oder zwei KI-Plattformen für die weitere Arbeit entscheiden. Dies erlaubt es mir dann, die KI kennen zu lernen und mich in das zielführende Formulieren der Prompt‘s zu vertiefen.