Die Bildgenerierung mit Hilfe der künstlichen Intelligenz hat uns mit beeindruckenden Fortschritten und leistungsstarken Modellen wie Midjourney V5 oder Stable Diffusion XL bereichert. In diesem Zusammenhang hat sich eine bemerkenswerte Technik hervorgetan – das „Additive Prompting“. Entwickelt von Nick St. Pierre, bietet diese Methode eine kluge Art und Weise, Eingabeaufforderungen zu strukturieren, um präzisere und zielgerichtete Ergebnisse zu erzielen.
Inspiriert hat uns der Originalartikel von Johnny Cache „Midjourney Prompt Structure: From Basic to Advanced in 5 Minutes“. Wir haben ihn jedoch auf die Open-Source-Lösung Stable Diffusion XL adaptiert.
Was ist Additive Prompting?
Additive Prompting ist ein Ansatz, der darauf abzielt, die Struktur von Eingabeaufforderungen schrittweise zu erweitern. Statt alle Informationen auf einmal zu liefern, beginnt man mit einer grundlegenden Idee und fügt nach und nach weitere Details hinzu, basierend auf den erhaltenen Ausgabeergebnissen von Generativer Bild KI wie Midjourney oder Stable Diffusion XL.
Die strukturierte Prompt Interaktion
Die Strukturierung von Prompts mittels Additive Prompting folgt einer klaren Reihenfolge, die von allgemeinen Stilen bis hin zu fortgeschrittenen Aspekten reicht:
- Allgemeiner Stil:
- Streetsstil, Redaktionsstil, Food-Fotografie, Punk-Stil der 1990er Jahre, Vaporwave Style …
- Komposition:
- Nahaufnahme aus der Mitte (Off-center closeup), mittlerer bis voller Seitenwinkel (medium-full side angle), Ganzkörperaufnahme (full body shot), Two Shot …
- Medium:
- Foto, Filmstille, Illustration, Ölgemälde, Skizze, Skulptur, 3D-Rendering …
- Filmtyp:
- Kodak Gold, Agfa Vista, Kodachrome, Polaroid …
- Beschreibung des Motivs:
- Eine Frau, die geht / ein Mann, der spricht / ein Hund, der rennt …
- Styling des Motivs:
- Modebeschreibungen, Details des Motivs, usw.
- Umgebung:
- New York, Altes Ägypten, Unterwasser, U-Bahn …
- Beleuchtung:
- Natürliche Beleuchtung (natural lighting), Studio-Beleuchtung (natural lighting), Blitz von der Kamera (off-camera flash), bewölkt (overcast), Neonlicht (neon lighting) …
- Atmosphäre:
- Neblig (misty), rauchig (smokey), dampfig (steamy), neblig (foggy), sonnig (sunny) …
- Stimmung / Mood:
- Steampunk, verträumt (dreamy), elegant, gruselig (spooky), romantisch (romantic), luxuriös (luxurious) …
Es ist entscheidend zu betonen, dass Additive Prompting nicht der alleinige Weg zur Strukturierung deines Prompts ist. Obwohl die Reihenfolge gelegentlich unwesentlich ist, bietet diese Methode eine solide Grundlage, um die gewünschten Ergebnisse zu erzielen.
Vorteile von Additive Prompting
- Präzise und Effiziente Interaktion: Details können User genau die gewünschten Ergebnisse erzielen, ohne sich in unnötigen Informationen zu verlieren.
- Flexibilität und Anpassung: Die Methode erlaubt es, die Eingabeaufforderung während des Prozesses anzupassen, um den Fokus zu verfeinern und das gewünschte Ergebnis zu optimieren.
- Steigerung der Kreativität: Additive Prompting fördert kreative Anpassungen und ermöglicht es, die Struktur für innovative Ergebnisse zu nutzen.
Herausforderungen und Tipps:
- Mögliche Unübersichtlichkeit: Bei komplexen Anfragen kann es zu Unübersichtlichkeit kommen. Klare Strukturierung ist hier entscheidend.
- Strukturierte Anpassungen: Passe die Reihenfolge und Details entsprechend deiner Bedürfnissen an, um eine optimale Ausgabe zu gewährleisten.
- Berücksichtigung von Kontext: Beachte den Kontext deiner Anfrage und passe die Struktur an, um kontextbezogen optimale Ergebnisse zu erzielen.
Fazit: Additive Prompting
Additive Prompting ist mehr als nur eine Methode – es ist eine Kunst, die die Interaktion mit generativen KI-Modellen auf eine neue Ebene hebt. Die kluge Strukturierung von Eingabeaufforderungen (Prompts) ermöglicht präzise, zielgerichtete Ergebnisse und erleichtert den Umgang mit Generativer KI (genAI) maßgeblich.
Acta non verba – Taten statt Worte
The Joker Beispiel mit Additive Prompting
Prompt: street style photo of joaquin phoenix
Prompt: street style photo of joaquin phoenix, medium shot
Prompt: street style photo of joaquin phoenix, medium shot, film still
Prompt: street style photo of joaquin phoenix, medium shot, film still, Kodak Gold
Prompt: street style photo of joaquin phoenix, medium shot, film still, Kodak Gold, walking
Prompt: street style photo of joaquin phoenix, medium shot, film still, Kodak Gold, walking, red wool suit
Prompt: street style photo of joaquin phoenix, medium shot, film still, Kodak Gold, walking, red wool suit, dark green slicked-back hair
Prompt: street style photo of joaquin phoenix, medium shot, film still, Kodak Gold, walking, red wool suit, dark green slicked-back hair, (clown makeup)++
Prompt: street style photo of joaquin phoenix, medium shot, film still, Kodak Gold, walking, red wool suit, dark green slicked-back hair, (clown makeup)++, 1970s new york city
Prompt: street style photo of joaquin phoenix, medium shot, film still, Kodak Gold, walking, red wool suit, dark green slicked-back hair, (clown makeup)++, 1970s new york city, overcast
Prompt: street style photo of joaquin phoenix, medium shot, film still, Kodak Gold, walking, red wool suit, dark green slicked-back hair, (clown makeup)++, 1970s new york city, overcast, foggy
Prompt: street style photo of joaquin phoenix, medium shot, film still, Kodak Gold, dancing, red wool suit, dark green slicked-back hair, (clown makeup)++, 1970s new york city, overcast, foggy, depressing
Das Ergebnis des Beispiels mit dem Joker könnte eine Szene aus dem Filmtrailer sein. Wir sind äußerst zufrieden mit dem Resultat. Wie findest du es?