KI-Bildgenerierung: Entdecke die faszinierende Welt jenseits der Pixel
David Blum
Kategorie:in
Internet & Recht
Veröffentlicht am 3. Okt. 2023
Aktualisiert am 10. Sept. 2024
Ein Gastbeitrag von David Blum, KI-Artist bei Smart Rebels
Inhalt dieses Beitrags:
Was sind KI-generierte Bilder?
Die Fotografie und das Grafikdesign haben in den letzten Jahren eine beeindruckende Transformation erlebt. Mit KI-generierten Bildern betreten wir eine neue Dimension der digitalen Kunst. Diese Bilder sind nicht bloss das Produkt von Algorithmen, sondern das Resultat von maschinellem Lernen. Stell Dir vor, ein Künstler hätte Zugriff auf eine unendliche Inspirationsquelle – genau das ermöglicht die KI.
Aber wie funktioniert das genau? KI-Systeme werden mit Milliarden von Bildern «gefüttert», lernen daraus Muster, Formen und Farben und können so neue, einzigartige Bilder kreieren. Jedes Bild wird von Grund auf neu generiert und von der Künstlichen Intelligenz phantasiert.
Warum KI-Bilder für Websites und Blogs verwenden?
Jeder Blogger oder Website-Besitzer weiss, wie entscheidend visuell ansprechende Inhalte sind. Mit KI-generierten Bildern erhältst Du genau das Bild, das Du Dir vorstellst (manchmal auch nicht, haha), ohne auf Stock-Fotos zurückgreifen zu müssen. Es ist, als hättest Du einen persönlichen Bob Ross an Deiner Seite, der Deine Vision in die Realität umsetzt. Aber es geht nicht nur um Ästhetik. KI-generierte Bilder können auch dabei helfen, Deine Marke zu stärken, Deine Botschaft klarer zu kommunizieren und Deine Zielgruppe besser zu erreichen.
Die besten Tools zum Generieren von KI-Bildern
Es gibt viele Tools da draussen, aber nicht alle sind gleich geschaffen. Midjourney hat mich persönlich am meisten überzeugt. Die Qualität der Bilder ist brutal beeindruckend. Wer auf Qualität setzen will und es gerne auch etwas nerdig mag, der kommt (aktuell) nicht um Midjourney herum. Via Discord kann man sich einen eigenen Server machen und dann den Midjourney-Bot dazu einladen.
Für Einsteiger empfehle ich allerdings eher Adobe Firefly & leonardo.ai (Stable Diffusion). Sie sind benutzerfreundlicher als Midjourney und bieten dennoch beeindruckende Ergebnisse.
Tipps für die Arbeit mit KI-Bildgeneratoren
Die Magie liegt im Detail. Ein gut formulierter Prompt kann den Unterschied ausmachen. Sei präzis, aber auch kreativ. Experimentiere und entdecke, wie die KI auf verschiedene Anweisungen reagiert. Und ja, obwohl viele dieser Tools mehrere Sprachen unterstützen, liefert Englisch oft die besten Resultate. Aber das ist noch nicht alles. Es ist auch wichtig, die Ergebnisse zu prüfen, Anpassungen vorzunehmen und den Prozess zu verfeinern, bis Du das perfekte Bild erhältst.
Pro-Tipp: trainiere im kostenpflichtigen ChatGPT-4 einen Chat, den du mit der Dokumentation deines KI-Bildgenerators und Beispielprompts fütterst. Danach kannst du mit wenigen Anweisungen komplexere Prompts von ChatGPT schreiben lassen und Änderungswünsche an den Prompt formulieren, wenn die Bild-Resultate nicht deinen Erwartungen entsprechen. Als Abkürzung gibt es auch ein ChatGPT-Plugin (names «Photorealistic»), welches hilft Prompts für Midjourney zu schreiben.
Einheitlicher Bildstil für z.B. Blogpost-Covers
Die Natur der KI-Bildgeneratoren versucht hartnäckig immer ein neues Bild zu generieren. Das kann leider manchmal etwas unpraktisch sein, wenn man im gleichen Stil Bilder generieren möchte. Mit einem guten Prompt aber schafft man es trotzdem, einen durchgehenden Stil über mehrere Bilder hinweg zu generieren.
Wichtig ist dabei, dass man z.B. bei Midjourney mit —repeat gleich mehrere Prompts abfeuert und so schneller zum gewünschten Resultat kommt.
In folgendem Beispiel (für Midjourney V5.2) kann das Subjekt in den eckigen Klammern variert werden, um verschiedene Bilder zu generieren:
vector illustration of a [open macbook on a desk], waves, single line, modern art, geometric shapes, colored background, orange and blue colors --ar 16:9 --s 40
Die Parameter: –ar steht für Aspect Ratio und erzwingt das Seitenverhältnis des Bildes, –s steht für Stylize und setzt den Standard-Wert von 100 auf 40, damit die KI mehr dem Prompt folgt. Hier drei Beispiele generiert mit dem Prompt oben:
Ethik und Urheberrecht von KI-Bildern
Ein Thema, das oft diskutiert wird und von den Medien manchmal auch falsch interpretiert wird. Es ist wichtig zu verstehen, dass diese Bilder das Produkt von komplexen Neuronalen Netzwerken basierend auf Deep Learning sind. Und keine Photoshop-Montage aus zusammengesetzten Bildern! Die Generatoren kopieren nicht, sie werden inspiriert (im Fall von Midjourney von 10 Milliarden trainierten Bilddaten!). Es ist, als würde ein Künstler sich von der Welt um ihn herum inspirieren lassen.
Aber es fairerweise sind solche Bedenken auch berechtigt: Wo ziehen wir die Grenze zwischen Inspiration und Kopie? Und wem gehört das Urheberrecht an einem KI-generierten Bild? Dies sind Fragen, die in den kommenden Jahren sicherlich weiter diskutiert werden.
Aktuell fehlt auch teilweise noch eine klare Gesetzeslage, zum Beispiel zum Urheberrecht. Wichtig: wenn du Bilder generierst, kann es trotzdem sein, dass die KI ein Bild erzeugt, welches gegen bestehende Urheberrechte (oder z.B. Markenschutz- oder Persönlichkeitsrechte) verstossen könnte.
Doch das ist generell nichts Neues, das kann auch in der Fotografie oder beim erzeugen von 3D-Renderings / CGI passieren. Und zuletzt: darfst du die generierten Bildern privat und kommerziell nutzen? Lies dafür die Nutzungsbestimmungen des Generators genau durch. Bei Midjourney z.B. darf man die Bilder nutzen, wenn man sie mit einem kostenpflichtigen Abo generiert hat und nicht gegen die Nutzungsbedingungen verstösst (siehe Terms of Service).
Beispiele von KI-generierten Bildern (Midjourney)
Die Möglichkeiten sind schier endlos. Als ich zum ersten Mal Bilder generiert habe, war die Qualität nicht die, welche aktuell mit Midjourney V 5.2 möglich ist. Heute verblüffen mich die Resultate noch täglich. Von atemberaubenden Landschaften bis hin zu detaillierten Porträts, im Stil einer Fotografie oder Illustration – alles ist möglich. Lass Dich von einigen meiner Favoriten inspirieren und entdecke die Vielseitigkeit der KI.
Die Zukunft von KI-generierten Medien
Während KI-Bilder bereits beeindrucken, sind KI-generierte Videos der nächste grosse Schritt. Die Technologie entwickelt sich ständig weiter. Es ist aufregend sich vorzustellen, was in den nächsten Jahren möglich sein wird. Aber es geht nicht nur um Technologie. Es geht auch darum, wie wir als Gesellschaft diese Werkzeuge nutzen und wie sie unsere Art zu kommunizieren, zu lernen und zu interagieren verändern werden. Es bleibt spannend!
Nach meiner Einschätzung verbessert sich die Qualität generierter Videos etwa doppelt so schnell wie es bei den Bildgeneratoren der Fall war. So werden wir wohl bereits im Frühjahr 2024 Videos in Top-Qualität generieren können.
Teilweise bieten KI-Video-Tools bereits jetzt verblüffende Möglichkeiten. Hier an einem Beispiel mit dem Tool Heygen gezeigt, welches mein Video in Deutsch einfach mal auf Englisch und Französisch übersetzt, meine Stimme dabei synthetisiert und sogar meine Lippenbewegungen der übersetzten Sprachausgabe anpasst!
Fazit
Die Welt der KI-generierten Bilder (und Videos) ist faszinierend und bietet grossartige Möglichkeiten. Teste doch das Generieren von Bildern selber mal aus, lass Dich inspirieren, sei mutig und entdecke, wie du generierte Bilder für dich einsetzen kannst.
Als kleines Goodie für unsere Leser: Die ersten 3, die einen Kommentar hinterlassen und ein KI-generiertes Bild mit kurzem Beschrieb wünschen, bekommen eines von mir persönlich erstellt und ich ergänze damit den Blogpost.
Prompt-Goodies
Phil wünschte sich Belle (von die Schöne und das Biest) mit einer Dunce-Kappe auf, die von einem Gewichtheber gecurled wird:
Helene Umiker wünschte sich einen veganen Burger:
Yuri Weiss wünschte sich eine vektorbasierte Illustration zum Thema «Von einem quantitativen zu einem qualitativen Wachstum»:
Beteilige dich an der Diskussion
12 Kommentare
Sehr gerne! Für deine Anfrage habe ich bewusst einen anderen Bildgenerator benutzt (Dall-E 3 via ChatGPT4), da Midjourney aktuell nicht so geeignet ist für deine Idee.
Hier das gewünschte Bild:
Prompt, der ChatGPT geschrieben hat:
“Vektor-Illustration: Ein Stapel von Goldmünzen auf der linken Seite, der stetig ansteigt und das quantitative Wachstum symbolisiert. Auf der rechten Seite sieht man eine blühende Pflanze, die aus einer der Münzen wächst, was das qualitative Wachstum darstellt. Zwischen den beiden Bildern befindet sich eine Pfeilbewegung von links nach rechts.”
Hallo David. Danke für deinen tollen Beitrag.
Machst du mir ein schön angerichteten Teller mit einem veganen Burger (aus Kidneybohnen und Kichererbsen) mit Salat, Gurken, Tomaten und Sauce?
Grüssli Helene
“Es ist, als würde ein Künstler sich von der Welt um ihn herum inspirieren lassen.”
Das ist eine sehr naive Sichtweise scheint mir. Es ist die Sicht der Anbieter*innen dieser Software die sich ungefragt an digitalisierten Bildarchiven als Rohstoff bedienen, dass es “dasselbe ist wie eine Künstlerin die sich von der Welt um sie herum inspirieren lässt”.
Ich verstehe deine Gedanken und Bedenken. Es ist auch noch nicht wirklich klar, wie die Datasets trainiert wurden.
Trotzdem: was ist genau der Unterschied zwischen Menschen oder Maschinen die Bilder anschauen? Eine Illustratorin beispielsweise schaut auch “Referenzbilder” an, wenn sie etwas illustriert und verdient damit dann Geld. Das ist halt die Analogie die ich mache. Darf man aber gerne auch anderer Meinung sein. Ich finde die Diskussion dazu wichtig und richtig.
Der Unterschied ist dass Menschen zwar auch lernen Bilder zu machen indem sie andere Bilder anschauen und neu zusammensetzen, aber nicht nur. Der andere Teil ist natürlich dass sie Erfahrungen machen, leben. Ein Bild ist immer auch der Ausdruck einer erlebten Haltung, auch wenn für das herstellen des Bildes Referenzen verwendet werden oder Vorbilder existieren. Das schöne ist natürlich dass auch die generierten Bilder uns überraschen und begeistern können und dass das generieren an sich Spass macht und viele neue Möglichkeiten bietet. Der Unterschied scheint mir aber trotzdem wichtig.
Belle (von die Schöne und das Biest) mit einer Dunce-Kappe auf, die von einem Gewichtheber gecurled wird. Eben eine Dumb Belle. 🏋️♀️
Haha, ich selbst verstehe die Idee nicht.😅 Hab’s mal bizli so geändert, dass Midjourney was damit anfangen konnte: https://www.dropbox.com/t/WLDIOvo6neopRdJf
Ah, ein(e?) Dumbbell ist eine Hantel, wär ein Wortspiel mit Dumb Belle 😅
Das ist sowohl faszinierend und erstaunlich als sich beängstigend und erschreckend.
Manche Möglichkeiten von AI lassen sich kombinieren um beispielsweise blitzschnell seo-optimierte Posts oder eine komplette Website zu erstellen. (Vergl. dazu beispielsweise https://zipwp.com/ oder https://seowriting.ai/ und die Demos und Erläuterungen von Jamie Marsland (englisch), https://www.youtube.com/@jamiewp.
Trotzdem ist es mir beispielsweise noch nicht gelungen eine Infografik erstellen zu lassen, die für Laien verständlich erklärt, wie Domain, Hosting und Content bzw. Contenttool wie WordPress, zusammenhängen. Fühl dich frei mir hier ein Bild oder einen Prompt zu liefern ;-)
Hoi Christian,
danke für deinen Kommentar und die Links!
Dein Promptwunsch kann ich leider nicht erfüllen, da Bildgeneratoren (noch) nicht so detailierten Anweisungen befolgen können.
Du hast aber immer noch einen Prompt-Wunsch frei 😎
Danke, sehr spannend! Ich habe ich bis jetzt noch nicht daran gewagt. – Kannst Du mir eine vektorbasierte Illustration anfertigen lassen zum Thema „Von einem quantitativen zu einem qualitativen Wachstum“?