Alastor schrieb:Bezüglich der Bilder: Vielleicht könntest du ja mal etwas über die verschiedenen Tools und deren Vorzüge schreiben, sowie den genauen Weg wie du die Bilder erstellen lässt.
Ich denke für den ein oder anderen (auch für mich Very Happy) ist das durchaus interessant... ich schau mal ob ich einen KI Bereich erstelle. So oder so wird das immer mehr, und da ich nicht möchte, dass KI Texte in der SChreibwerkstatt auftauchen, wäre das vielleicht eine Möglichkeit über so ein unterforum zu kanalisieren.
Da Alastor mich in meinem ersten Charakterquiz-Thread gebeten hat, mal etwas über die verschiedenen KI-Tools zu schreiben, die ich so verwende, hier eine kurze Übersicht.
Artbreeder (https://www.artbreeder.com/)
Damit fing alles an. Artbreeders Hauptstärke ist immer noch, wie der Name schon sagt, aus zwei Bildern ein neues zu erzeugen, indem es sowohl die Konturen als auch den Stil der beiden Bilder ineinander überblendet — das kann man jeweils mit Reglern einstellen. Am Anfang ging das nur mit Gesichtern / Portraits; mittlerweile auch mit anderen Bildern. Zudem hat Artbreeder jetzt auch einen Text-zu-Bild-Generator, wie die meisten anderen AI-Plattformen. Ich finde die Text-zu-Bild-Generationen allerdings relativ gering von der Auflösung — dafür kostet es nichts.
Bei Portraits hat Artbreeder weiterhin seine größte Stärke, da man hier an vielen Details drehen kann, ähnlich wie sonst nur in Elder Scrolls-Spielen. (Augenfarbe, Haarfarbe, Kopfneigung, man kann verschiedene ethnische Herkünfte ineinander überblenden usw.). Wenn man nah rangeht, sieht man bei vielen Portraits allerdings manchmal etwas verschwommene / halb-durchsichtige Linien entlang des Kiefers.
Die mit Artbreeder erzeugten Bilder landen in der Public Domain.
Artbreeder-Portrait von Commander Theresa Kendrick vom Generationenraumschiff Exodus (meinem aktuellen WIP)
DreamStudio (stabiliti.ai, https://beta.dreamstudio.ai/generate) und Dream by WOMBO (https://dream.ai/)
Meine ersten Gehversuche, welche ich hauptsächlich für Landschaften verwendet habe — die Charaktere, die WOMBO gezeichnet hat, sahen doch oft noch sehr Comic-haft aus. Hier soll man jeweils die Website angeben, wenn man die Bilder verwendet, soweit ich die Terms of Service im Kopf habe.
NightCafé (https://creator.nightcafe.studio/)
Deutlich intuitiver zu benutzen als die beiden oben genannten, und die Ergebnisse sehen im Schnitt auch deutlich besser aus, wie ich finde.
Wenn man die kostenlose Version verwendet, gibt es jeden Tag 5 Credits, wobei 4 Bilder üblicherweise zwischen 2 und 4 Credits kosten.
Hier mal eine Übersicht über vier Bilder, die in einem Zug mit demselben Text Prompt erstellt wurden:
The Last Winged Unicorn, so wie beschrieben im gleichnamigen Song von Rhapsody of Fire
Wie ihr seht, hat eines der Einhörner zwei Hörner. Aber ansonsten stimmt es. Vor allem bin ich froh, dass die Anzahl der Beine stimmt — damit haben nämlich manche anderen AIs gerade bei Pferden so ihre Probleme.
Leonardo.AI (https://leonardo.ai/)
Für mich gerade mit Abstand das beste AI-Artwork-Tool — das war es mir auch wert, eine Subscription abzuschließen. Vor allem, weil einem hier die erstellten Bilder dann auch selbst gehören — zumindest laut Nutzungsbedingungen. Wenn das natürlich vor Gericht generell noch einmal anders aussieht, hat Leonardo darauf vermutlich keinen Einfluss. (Leonardo selbst sitzen in Australien.)
Was immer diese „Alchemy“-Pipeline ist, die Ergebnisse sind deutlich besser von der Qualität als vieles, was ich z.B. mit den beiden Dream-Websites erreichen konnte (wenngleich NightCafé mittlerweile manchmal schon nah drankommt). Seht selbst:
Commander Theresa Kendrick auf der Brücke des Generationenraumschiffs Exodus
Seit kurzem gibt es auch bei einigen Modellen auf der Leonardo-Website bzw. der App die Möglichkeit einer „Character Reference“.
Damit kann ich z.B. das oben gezeigte Artbreeder-Portrait hochladen, damit der Charakter in jedem neuen Bild möglichst gleich aussieht. Das sieht dann so aus:
Commander Theresa Kendrick vor der Crew der Exodus in der Haupthalle
Man kann auch weitere Bilder hochladen, um von einem z.B. das Charakter-Gesicht, von einem anderen den Stil / die Stimmung (Farbgebung, Licht etc.) zu verwenden.
Es gab auch noch eine andere Website, wo Public-Domain-Seiten wie Pixabay direkt eingebunden waren. Die muss ich nochmal suchen, weiß den Namen gerade nicht mehr — ich habe sie nicht viel verwendet, aber vor allem, um Darstellungen von bestimmten berühmten Orten zu machen bzw. abzuwandeln. Mit Wahrzeichen etc. hat die AI nämlich so ihre Probleme. Den Eiffelturm bekommt sie noch hin (wobei sie einem dann gerne mehrere Eiffeltürme ins Bild setzt), aber die Wahrzeichen weniger bekannter Städte dann eben nicht.
Eine weitere Kuriosität: Wenn ihr irgendetwas im Sci-Fi-Bereich malen lasst, rechnet damit, dass euch die AI amerikanische Flaggen auf die Uniformen / Raumanzüge der Charaktere klatscht. Ich schreibe daher mittlerweile „USA flag, American flag“ standardmäßig in meine negativen Prompts hinein (also das, was ich NICHT sehen möchte). Ebenso wie „adidas logo, Nike logo“, weil die gerne auch mal auf Uniformen landen, wenn diese etwas an Sportoutfits erinnern.
Kleine Details kann man aber z.B. auch im Nachhinein noch ändern, ohne dafür in Photoshop herumhantieren zu müssen. Bei Leonardo geht das im „Canvas Mode“. So z.B. bei dieser jungen Dame hier, wo Leonardo nicht mehr hinbekam als ein einzelnes rotes Kreuz auf der Schulter und ich die anderen vier ergänzen musste. Außerdem hatte sie vorher ein Namensschild auf der Brust, worauf allerdings nur Gekritzel stand. Nachdem ich viele Tokens darauf verwendet hatte, Leonardo dazu zu bekommen, ihren Nachnamen korrekt auf dieses Schild zu schreiben, habe ich das Namensschild einfach entfernt.
Wichtig: Im Canvas Mode können die editierten Bilder momentan noch nicht auf der Leonardo-Website gespeichert werden, d.h. man muss sie direkt runterladen, wenn man sie behalten will. Und dann halt im Zweifel eine Sicherheitskopie machen oder sie in einem anderen Cloud-Service hochladen, wenn man sie online haben möchte.
Fähnrich Nina Meladze, auf dem Farm-Ring des Generationenraumschiffs Exodus
Probleme hat die AI also meistens bei:
- Händen / Fingern (bekannt, weil man Hände in so vielen verschiedenen Konfigurationen sieht und die AI das nicht versteht)
- Gliedmaßen allgemein (die sind gerne mal verbogen, oder zu viele, wie bei den Pferden)
- Buchstaben (die erkennt die AI nämlich auch nicht; positive Ausnahme hier: das neue „Leonardo Phoenix“-Modell von Leonardo.AI)
- Wahrzeichen (s. oben); das klappt besser, wenn ihr ein echtes (gemeinfreies) Foto vom betreffenden Wahrzeichen als Ausgangsbasis nehmt
Hier mal ein Beispiel, was NightCafé.AI aus dem Hochzeitspalast in Aschgabat, Turkmenistan macht, wenn man ihm ein Original-Foto vorgibt und „Depth to Image“ verwendet, damit es die Konturen übernimmt. (Die Nordlichter über dem Gebäude waren Teil des Prompts; es soll hier um einen besonders heftigen Sonnensturm gehen, der im ersten Prequel meiner Geschichte auftritt.)
Es gibt natürlich noch mehr — im musikalischen Bereich zum Beispiel. Obwohl ich zum Singen nicht auf AI angewiesen bin , gibt es doch bestimmte Passagen, die man mal von einer anderen Stimme interpretiert hören möchte — oder man holt sich zum eigenen Live-Gesang noch ein paar AI-Background-Sänger dazu.
Hier wäre zum einen Synthesizer V von Dreamtonics zu nennen — tendenziell eher für Lead Vocals gedacht, aber man kann natürlich mehrere Spuren verschiedener Einzelstimmen kombinieren, um einen Chor zu erzeugen. So habe ich mal einen AI-Chor die Hymne meines Generationenraumschiffs singen lassen . Die meisten der Stimmen-Packs für Synthesizer V sind auf japanisch / chinesisch ausgelegt, aber es gibt auch ein paar, die konkret für Englisch gemacht sind (Solaria, Natalie, Kevin, Hayden, und Asterian verwende ich bisher; die „Default“-Stimme heißt Mai und ist eigentlich für Japanisch gedacht. Sie kann auch auf Englisch singen, dann aber mit einem gewissen japanischen Akzent / Timbre. )
Wenn es konkret Chöre sein sollen, gibt es auch noch von East West den Hollywood Choir, Symphonic Choir, und die Backup Singers. Alle drei haben einen „Word Builder“, denen kann man also ebenfalls sämtliche Worte in den Mund legen. Hier muss man allerdings den kompletten Text ins Textfeld schreiben und dann darin ein bisschen hantieren, bis die Verteilung der Silben auf die Noten stimmt. In Synthesizer V ist das leichter, weil man den Text direkt an den einzelnen MIDI-Noten verändern kann (aber auch da kann man ihn „zentral“ in einem Text-Eingabefeld vorgeben).