Generative KI

KI Bilder erstellen: Die 8 besten KI-Bildgeneratoren (kostenlos und kostenpflichtig)

Autor
Martin Gschwentner
Letzte Aktualisierung
21. März 2024

Mit einem KI-Bildgenerator können Sie in Sekundenschnelle hochwertige Bilder und Grafiken erstellen. Sie müssen das Bild, das Sie sich vorstellen, nur beschreiben – den Rest übernimmt die KI. Doch die Auswahl an KI-Tools ist mittlerweile groß. Welches erzielt die passendsten Ergebnisse?

Wir stellen einige der aktuell besten KI-Bildgeneratoren vor und verraten, wie viel sie kosten und was mit ihnen möglich ist.

Was sind KI-Bildgeneratoren?

KI-Bildgeneratoren sind Software-Tools, die mithilfe von künstliche Intelligenz Bilder generieren. Sie nutzen Machine Learning und komplexe Algorithmen, um basierend auf bestimmten Parametern – die von Nutzern durch Texteingaben, sogenannte Prompts, vorgegeben werden – einzigartige Bilder zu erstellen.

Sie müssen also nur einen Prompt in ein Textfeld eingeben, um den „kreativen“ Prozess zu starten: Die KI analysiert Ihre Beschreibung und nutzt ihr umfangreiches Training auf Basis zahlreicher Bilder und Stile, um ein Bild zu erzeugen, das Ihren Anforderungen entspricht. Hier ein Beispiel:

So sieht die Bildgenerierung bei DALL-E 3 in ChatGPT aus.

Die Möglichkeiten sind beinahe unbegrenzt: KI-Bildgeneratoren können eine breite Palette von Bildern erstellen, von realistischen Fotos über Kunstwerke in verschiedenen Stilen bis hin zu Marketing-Material oder Assets für geschäftliche Zwecke.

KI-Plattform vs. KI-Modell

Wenn von KI-Bildgeneratoren die Rede ist, können damit sowohl KI-Plattformen als auch die dahinterstehenden KI-Modelle gemeint sein.

  • KI-Plattformen sind Online-Tools, die KI-Modelle für Nutzer zugänglich machen. Sie bieten ein intuitives Frontend, in dem Sie Ihre Text-Prompts eingeben können, um daraus Bilder zu erstellen.

  • Die KI-Modelle selbst sind die Algorithmen, die auf Basis riesiger Datensätze trainiert wurden, um Textvorgaben in Bilder zu verwandeln. Sie liefern die technologische Basis für die Funktionalität von KI-Plattformen.

Manche KI-Plattformen nutzen eigene, proprietäre KI-Modelle, andere „mieten“ sich bekannte KI-Modelle und stellen nur das Frontend bereit. Wir gehen auf beide Kategorien ein.

Wie gut sind KI-Bildgeneratoren?

KI-Bildgeneratoren sind zweifelsohne beeindruckend – und sie werden immer besser. Sie sind bereits heute in der Lage, fotorealistische Bilder und komplexe Kunstwerke in verschiedensten Stilen zu erstellen, und werden zunehmend vielseitiger in der Anwendung.

Die innovativen KI-Tools haben damit das Potenzial, Design-Prozesse zu revolutionieren und ganze Branchen zu transformieren. Doch wie jede neue Technologie bergen sie auch Gefahren, sowohl technisch als auch gesellschaftlich.

Hier sind ein paar Aspekte, die Sie beachten sollten, wenn Sie KI-Bildgeneratoren nutzen:

  • Gute Ergebnisse erfordern gute Prompts
    Talent und Hirnschmalz machen auch bei der KI-Bildgenerierung einen Unterschied. Die Qualität und Relevanz der erzeugten Bilder hängen nämlich stark von der Qualität und Spezifität der eingegebenen Prompts ab. Schlechte oder unpräzise Prompts können zu unerwarteten oder irrelevanten Ergebnissen führen.

  • KI-Inhalte sind oft sofort erkennbar
    Die KI wird zwar immer besser darin, ihre Spuren zu verstecken (was natürlich ganz neue Probleme mit sich bringt), doch aktuell sind viele KI-Inhalte schon auf den ersten Blick als solche zu erkennen. Sie haben oft einen ganz bestimmten, sterilen KI-Look, charakterisiert durch eine gewisse Glätte oder unnatürliche Perfektion.

  • Visuelle Unstimmigkeiten: 8 Finger, unmögliche Perspektiven
    Aber auch Imperfektionen können KI-Inhalte verraten. Oft sieht auf den ersten Blick alles gut aus – doch bei genauerem Hinsehen stellt sich heraus, dass drei Menschen auf dem Bild insgesamt vier Paar Beine haben oder die Perspektive merkwürdig verzerrt ist, sodass Gebäude oder Gegenstände in unmöglichen Winkeln zueinander stehen.

  • Probleme mit Texten
    Es gibt KI-Textgeneratoren und KI-Bildgeneratoren – doch eine Kombination der beiden Elemente bekommt bisher niemand so richtig hin. Texte sind häufig falsch platziert und haben meist viele Rechtschreibfehler oder sind komplettes Kauderwelsch.

  • Wie war das mit dem Urheberrecht?
    KI-generierte Bilder stellen uns vor neue urheberrechtliche Herausforderungen. Plattformen räumen Nutzern zwar in der Regel die vollen Rechte an den generierten Bildern ein, doch weil diese Bilder oft auf bestehenden Werken basieren, die die KI während ihres Trainingsprozesses „gesehen“ hat, sind aktuell noch viele Fragen offen.

  • Ethik und Verantwortung
    KI-Bilder werfen aber nicht nur rechtliche, sondern auch ethische Fragen auf. Die Fähigkeit, realistische Bilder von Personen ohne deren Zustimmung zu erstellen, ist etwa problematisch. Darüber hinaus können diese Tools zur Erstellung von Desinformation oder manipulativen Inhalten missbraucht werden. Dazu kommt der Schaden, den sie auf dem Arbeitsmarkt anrichten können – beispielsweise, wenn Designer durch KI ersetzt werden.

KI-Bildgeneratoren sind also ein zweischneidiges Schwert. Wer sie nutzt, sollte sich ihrer Schwächen und Gefahren bewusst sein.

Eins ist aber klar: Die KI-Tools sind hier, ob wir das möchten oder nicht, und wie viele Maschinen und Automatisierungen werden sie unseren (Arbeits-)Alltag in der einen oder anderen Form verändern. Wer die Augen davor verschließt, riskiert, den Anschluss zu verlieren.

Welche KI-Bildgeneratoren sind am besten?

Nicht nur KI-Inhalte überschwemmen das Netz – sondern auch die Tools, mit denen Sie KI-Inhalte erstellen können. Es gibt immer mehr KI-Bildgeneratoren, die alle mehr oder weniger dasselbe versprechen.

Wir haben einige der besten, aktuell erhältlichen KI-Bildgeneratoren für Sie zusammengestellt und verraten, was sie auszeichnet.

Unsere Kriterien für den Bildervergleich

Unsere Einschätzung basiert auf mehreren Kriterien, insbesondere auf der Qualität, dem Funktionsumfang, den Kosten und der Benutzerfreundlichkeit der Plattformen. Für einen möglichst direkten Vergleich der Qualität der generierten Bilder, haben wir jeden KI-Bildgenerator mit den vier gleichen Prompts gefüttert:

  • 1.

    Ein einsamer Roboter mit Stofftier in einer neonbeleuchteten Straße einer futuristischen Metropole, kurz nach dem Regen.

  • 2.

    Ein beleuchtetes Baumhaus in einem Fantasy-Wald im Zeichentrickstil.

  • 3.

    Drei frei erfundene, nicht aus Büchern oder Mythologie bekannte Fantasiewesen, die auf einer Klippe vor einem Leuchtturm im Meer versammelt sind, im Pixelart-Stil.

  • 4.

    Ein fotorealistisches Bild von John F. Kennedy während seiner „Ich bin ein Berliner“-Rede.

Darüber hinaus testen wir auch die Tauglichkeit der KI-Programme für geschäftliche Zwecke. Dafür nutzen wir folgende Beispiele:

  • 1.

    Social Media-Bild
    Ein Social Media Asset für eine Tech-Firma, das eine B2B-Kundenreferenz hervorhebt. Der Kunde ist eine Hotelkette, die durch ein innovatives Buchungssystem Zeit und Kosten gespart hat. Das Asset soll eine Illustration eines Miniatur-Hotels in einem modernen Stil mit lebendiger Farbpalette (blau und orange) zeigen, die diese Vorteile visualisiert. In einer Ecke soll prominent der Schriftzug '20 % mehr Direktbuchungen durch Simplibook' integriert sein.

  • 2.

    Geschäftliche Präsentation
    Ein Cover für einen jährlichen Finanzbericht, das Stärke und Wachstum visualisiert, mit einem abstrakten Bild von aufsteigenden Balkendiagrammen und einer Erdkugel im Hintergrund. Der Titel ‚Jahresbericht 2024‘ soll oben im Bild stehen, mit dem Untertitel ‚Globale Expansion und Innovation‘

Hier ist unsere Top 8 der besten KI-Bildgeneratoren auf dem Markt:

1.

DALL-E: Gutes Verständnis von Prompts

  • Kostenlose Version: Ja (mit Einschränkungen)

  • Kosten für Premium: 20 USD/ Monat

  • Maximale Auflösung: 1792x1024

DALL-E ist ein KI-Modell aus dem Hause OpenAI, das auch den Textgenerator ChatGPT entwickelt hat. Auch DALL-E basiert auf der Architektur von GPT (Generative Pre-trained Transformer). Der Name ist eine Kombination aus „Wall-E“, dem berühmten Pixar-Roboter, und „Dalí“, dem surrealistischen Künstler.

DALL-E hat bereits mehrere Versionen durchlaufen, beginnend mit DALL-E 1, gefolgt von fortgeschritteneren Iterationen wie DALL-E 2 und DALL-E 3, die jeweils verbesserte Fähigkeiten und realistischere Bildgenerierungen bieten.

Wie funktioniert DALL-E?

Sie können DALL-E direkt in der ChatGPT-Plattform auf der OpenAI-Website nutzen. Dafür benötigen Sie aber einen ChatGPT-Account. Entwickler und Unternehmen können auch die OpenAI API verwenden, um DALL-E-Funktionalitäten in ihre eigenen Anwendungen oder Dienste zu integrieren.

Für jeden Prompt werden zwei Bilder generiert, von denen Sie dann das Passende auswählen können.

DALL-E ist direkt in die ChatGPT-Plattform integriert.

Wie gut ist die Qualität bei DALL-E?

DALL-E generiert hochwertige, detailreiche Bilder in unterschiedlichen Stilen und Formaten. Das OpenAI-Tool ist besonders gut in der Analyse der Textvorgaben: Resultate gehen fast immer in die richtige Richtung, komplette Ausreißer sind selten.

Allerdings ist DALL-E 3 weniger für fotorealistische Bilder geeignet und dargestellte Menschen und Gesichter sehen oft aus, als wären sie von einer Wachs-Schicht umgeben, was typisch für KI-Inhalte ist.

Hier sind die Ergebnisse der von uns getesteten Prompts:

Diese Bilder haben wir mit DALL-E 3 generiert.

Wie gut eignet sich DALL-E für geschäftliche Zwecke?

Die Rechte der Bilder, die Sie mit DALL-E erstellen, gehören laut OpenAI Ihnen. Sie können damit machen, was Sie möchten – sie also auch für kommerzielle Zwecke nutzen.

Auch im geschäftlichen Bereich hat DALL-E viele Einsatzzwecke. Durch das gute Prompt-Verständnis kann es viele unterschiedliche Assets, von Social Media-Bildern über Grafiken für Präsentationen bis hin zu Produktinformationsblättern und Werbeanzeigen erstellen. Mit Texten hat DALL-E allerdings noch Probleme, die sollten Sie also auf anderem Wege einfügen:

Diese geschäftlichen Assets haben wir mit DALL-E 3 erstellt.

Was sind die Kosten und Konditionen von DALL-E?

Reguläre Konsumenten können DALL-E mit einem ChatGPT-Abo nutzen. Aktuell stehen drei Tarife zur Auswahl:

Tarif

Kosten pro Monat

Konditionen

Plus

20 USD

  • Zugriff zu GPT-4 und DALL-E 3

  • 50 Prompts alle 3 Stunden

Team

25 USD pro Nutzer (jährliche Zahlung)

  • [LIMITS]

  • Team-Features und Adminkonsole

  • 2-Nutzer-Minimum

Enterprise

Individuell

  • unbegrenzter GPT-4- und DALL-E-Zugriff

  • Erweiterte Funktionen und Sicherheits-Einstellungen

Es ist aber auch möglich, DALL-E per API zu nutzen und die Lösung beispielsweise in andere Tools zu integrieren. Dann erfolgt die Bezahlung über ein (relativ kompliziertes) Token-System, das OpenAI auf seiner Website näher erklärt.

Was sind Vor- und Nachteile von DALL-E?

  • Qualität und Vielfalt
    DALL-E 3 erzeugt beeindruckende Grafiken und Bilder in vielen unterschiedlichen Stilen und Bereichen.

  • Benutzerfreundlich durch Integration in ChatGPT
    Weil DALL-E ins benutzerfreundliche ChatGPT-Dashboard integriert ist, könnte die Bedienung kaum einfacher sein. Sie müssen nur Ihre Prompts ins Textfeld eingeben, der Rest geht von allein.

  • Gutes Verständnis von Prompts
    DALL-E zeigt ein gutes Verständnis für Texteingaben, die Resultate sind in der Regel sehr nah an den Vorgaben.

  • Weniger gut für fotorealistische Bilder
    Fotorealistische Bilder sind keine Stärke von DALL-E 3.

  • Undurchsichtiges Preismodell
    Leider sind die Prompt-Limits bei ChatGPT nicht offensichtlich – was auch daran liegen könnte, dass sie sich häufig ändern.

  • Wenig Kontrolle über die Bildgenerierung
    Die Kontrolle über den Output haben Sie bei DALL-E nur über den Chat-Prompt. Bei anderen Modellen können Sie den Prozess und bestimmte Bildeigenschaften in Bedienfeldern genauer konfigurieren.

2.

Midjourney: Spektakulärer Fotorealismus

  • Kostenlose Version: Nein

  • Kosten für Premium: ab 10 USD/ Monat

  • Maximale Auflösung: 1024x1024

Die Ergebnisse von DALL-E sind Ihnen nicht (foto)realistisch genug? Dann könnte Midjourney für Ihre Bedürfnisse die bessere Wahl sein. Das KI-Tool, das vom gleichnamigen Forschungsinstitut aus San Francisco entwickelt wurde, befindet sich aktuell in einer offenen Beta-Phase und ist für Interessierte frei (wenn auch kostenpflichtig) zugänglich.

Wie funktioniert Midjourney?

Leider ist Midjourney nicht so benutzerfreundlich wie ChatGPT und andere KI-Tools. Es gibt kein dediziertes Midjourney-Dashboard, stattdessen ist der Bildgenerator in die Kommunikationsplattform Discord integriert und kann nur dort genutzt werden.

In Discord können Sie – ähnlich wie bei Slack – auf unterschiedlichen Kanälen mit anderen Discord-Nutzern kommunizieren. Einer dieser Nutzer ist der Midjourney-Bot, den Sie mit dem Befehl „/imagine“ mit Prompts füttern können.

Sie können dafür bereits existierende Kanäle nutzen, in denen sich auch andere Midjourney-Nutzer aufhalten, oder Ihren eigenen Server erstellen und den Midjourney-Bot in diesen privaten Chat einladen.

Midjourney ist in Discord integriert.

Doch egal, welchen Kanal Sie nutzen: Die Bilder, die Sie generieren, sind bei Midjourney grundsätzlich nicht privat, sondern können in der Galerie von allen gesehen werden. Einen Privat-Modus gibt es zwar auch, jener ist aber erst im (teuren) Pro-Tarif enthalten.

Wie gut ist die Qualität bei Midjourney?

Die Resultate von Midjourney sind spektakulär und noch eine Ecke beeindruckender als die von DALL-E. Die Plattform generiert detailreiche, visuell imposante Bilder in unterschiedlichen Stilen und Formaten. Im Gegensatz zu DALL-E ist Midjourney dabei auch für fotorealistische Darstellungen gut geeignet.

Was das Auslesen von Prompts angeht, ist Midjourney aber weniger schlau als der OpenAI-Konkurrent: Es kam häufiger vor, dass ein explizit gewünschtes Element in unserem Bild fehlte oder falsch dargestellt wurde.

Diese Bilder haben wir mit Midjourney generiert.

Wie gut eignet sich Midjourney für geschäftliche Zwecke?

Auch Midjourney räumt Ihnen – mit wenigen Ausnahmen – die vollen Rechte an den generierten Bildern ein. Dass Midjourney ein schlechteres Prompt-Verständnis aufweist, macht die Generierung von Bildern, die genau zum gewünschten Einsatzbereich passen, aber etwas schwieriger.

Die Resultate unserer Beispiel-Prompts waren solide, aber weniger beeindruckend als bei DALL-E. Unsere Bitte, Texte einzubauen, wurde einfach komplett ignoriert:

Diese geschäftlichen Assets haben wir mit Midjourney erstellt.

Was sind die Kosten und Konditionen von Midjourney?

Midjourney hat vier Tarife mit aufsteigenden Leistungen. Feste Bilder-Limits gibt es in den Tarifen nicht, stattdessen werden die verbrauchten Ressourcen in GPU-Zeit – also der Zeit, die für die Bildgenerierung aufgebraucht wird – gemessen.

Im günstigsten Basic-Tarif ist die GPU-Zeit generell auf 3.3 Stunden im Monat begrenzt. Wenn sie aufgebraucht ist, können Sie keine Bilder mehr erstellen. In den anderen Tarifen erhalten Sie nicht nur mehr GPU-Zugriff, sondern auch die Garantie, unbegrenzt viele Bilder erstellen zu können. Deren Generierung dauert aber etwas länger, wenn die schnelle GPU-Zeit aufgebraucht ist.

Hier sind die Tarife von Midjourney:

Tarif

Kosten pro Monat (jährliche Bezahlung)

Konditionen

Basic

8 USD

  • ca. 200 Bilder/ Monat

  • 3.3 Stunden schnelle GPU-Zeit pro Monat

Standard

24 USD

  • unbegrenzte Bilder

  • 15 Stunden schnelle GPU-Zeit pro Monat

Pro

48 USD

  • unbegrenzte Bilder

  • 30 Stunden schnelle GPU-Zeit pro Monat

Mega

96 USD

  • unbegrenzte Bilder

  • 60 Stunden schnelle GPU-Zeit pro Monat

Was sind Vor- und Nachteile von Midjourney?

  • Exzellente Qualität
    Midjourney erstellt visuell beeindruckende, detailreiche und realistische Bilder. Mit den richtigen Prompts sind spektakuläre Ergebnisse möglich.

  • Fotorealistische Ergebnisse
    Midjourney glänzt bei der Erstellung fotorealistischer Inhalte und ist somit besonders für Porträts oder die realistische Darstellung echter, historischer Figuren geeignet.

  • Günstiger Einsteiger-Tarif
    Der günstigste Tarif von Midjourney kostet nur ca. halb so viel wie der günstigste DALL-E-Tarif.

  • Umständliche Bedienung
    Midjourney fehlt ein dediziertes Interface, das sich mit Chat-Prompts bedienen lässt. Die etwas klobige Discord-Integration macht die Bildgenerierung umständlicher als bei ChatGPT & Co.

  • Schlechteres Verständnis von Prompts
    Midjourney versteht Prompts nicht so zuverlässig wie DALL-E, was manchmal zu unpassenden oder imperfekten Ergebnissen führt.

3.

Microsoft Copilot: DALL-E 3 kostenlos nutzen

  • Kostenlose Version: Ja

  • Kosten für Premium: 22 €/ Monat

  • Maximale Auflösung: 1024x1024

Sie möchten DALL-E 3 nutzen, ohne dafür zu bezahlen? Dann können Sie sich mit Ihrem Microsoft-Account beim Microsoft Copilot (ehemals Bing Chat) anmelden. Darin ist der Copilot Designer enthalten – ein Bildgenerator, der auf DALL-E 3 basiert.

Wie funktioniert Microsoft Copilot?

Microsoft Copilot ist ein KI-Chatbot, der ähnlich wie ChatGPT funktioniert. Sie müssen im Auswahlmenü nur den Designer auswählen und Ihren Text-Prompt eingeben, dann generiert das KI-Tool vier passende Bilder.

Im Gegensatz zu ChatGPT hat die Plattform auch gleich einige Tools zur Bildbearbeitung eingebaut. Sie können Filter anwenden und die generierten Grafiken mit einer Reihe von Tools editieren.

Leider ist der das KI-Angebot von Microsoft aktuell etwas konfus: Es gibt unterschiedliche Versionen des Copilots, jeweils mit unterschiedlichen Benutzeroberflächen und Funktionen.

Der Designer ist Teil der Copilot-Suite von Microsoft.

Wie gut ist die Qualität bei Microsoft Copilot?

Weil die Bildgenerierung von DALL-E erledigt wird, ist die Qualität der Grafiken hoch. Manchmal verweigerte Microsoft Copilot allerdings den Dienst, weil unsere Prompts blockiert wurden. Die fotorealistische Darstellung von urheberrechtlich geschützten Ereignissen oder realen Personen war zum Testzeitpunkt beispielsweise nicht möglich, was die beiden unpassenden Kennedy-Testbilder erklärt.

Diese Bilder haben wir mit Microsoft Copilot generiert.

Wie gut eignet sich Midjourney für geschäftliche Zwecke?

Was die Bildrechte angeht, zeigt sich Microsoft etwas intransparent. Auf der Copilot-Website steht zum Thema gar nichts und die Microsoft-Nutzungsbedingungen schreiben, dass Services auf den persönlichen Gebrauch beschränkt sind – „sofern nichts anderes spezifiziert“ ist.

Im Support erklärt uns ein Mitarbeiter hingegen, dass wir unsere Copilot-Bilder sehr wohl für kommerzielle Zwecke verwenden dürfen. Er empfahl uns aber, Bildern ein Wasserzeichen hinzuzufügen, um Plagiate und andere Probleme zu vermeiden. Die Bildrechte-Situation ist aktuell somit etwas unklar.

Weil DALL-E zum Einsatz kommt, sind die Resultate ähnlich gut wie bei OpenAI, mit den gleichen Text-Problemen:

Diese geschäftlichen Assets haben wir mit Microsoft Copilot erstellt.

Was sind die Kosten und Konditionen von Microsoft Copilot?

Microsoft Copilot ist grundsätzlich kostenlos verfügbar. Strikte Bilder-Limits gibt es dabei nicht, doch Sie erhalten nur 15 Boosts pro Tag, mit denen Sie Bilder schneller erstellen können. Wenn jene verbraucht sind, dauert die Bildgenerierung deutlich länger.

Alternativ können Sie auch ein Copilot Pro-Abo abschließen, das Ihnen 100 Boosts pro Tag sichert. Es kostet 22 € pro Monat.

Was sind Vor- und Nachteile von Microsoft Copilot?

  • Kostenloses DALL-E 3
    Microsoft Copilot ist eine kostenlose Möglichkeit, DALL-E 3 zu nutzen.

  • Einfache Chatbot-Bedienung
    Die Bildgenerierung erfolgt über simple Text-Prompts in einem ChatGPT-ähnlichen Umfeld.

  • Eingebaute Designwerkzeuge
    Microsoft Copilot hat einige Design-Features eingebaut, mit denen Sie die generierten Bilder auch gleich bearbeiten können.

  • Konfuse Produktpolitik
    Namensänderungen und Interface-Wirrwarr: Microsoft macht den Rollout seiner KI-Lösungen unnötig kompliziert und verwirrt mit unterschiedlichen Plattformen und Benutzeroberflächen.

  • Blockierte Prompts
    Microsoft Copilot ist im Vergleich zum OpenAI-Original restriktiver, was Prompts angeht. Die fotorealistische Darstellung von realen Personen ist beispielsweise nicht möglich.

  • Typische DALL-E-Schwächen
    Weil die Bilder mit DALL-E generiert werden, teilt der Microsoft Copilot die Schwächen von ChatGPT. Für fotorealistische Bilder ist die Plattform weniger geeignet, die Ergebnisse haben den für DALL-E typischen „Wachs“-Look.

4.

Stable Diffusion: Open Source und lokal installierbar

  • Kostenlose Version: Ja (Open Source)

  • Kosten für Premium: 10 USD für ca. 5.000 Bilder

  • Maximale Auflösung: 2048x2048

Kommerzielle Software hat Ihnen zu viele Einschränkungen? Dann ist Stable Diffusion von Stability AI einen Blick wert. Das fortschrittliche KI-Modell ist eine Open Source-Alternative zu DALL-E & Co., die Ihnen deutlich mehr Kontrolle über die Generierung Ihrer KI-Bilder gibt. Allerdings ist etwas mehr technisches Wissen nötig, um das meiste aus Stable Diffusion herauszuholen.

Wie funktioniert Stable Diffusion?

Es gibt primär zwei Möglichkeiten, Stable Diffusion zu nutzen:

  • 1.

    Lokale Installation
    Sie können Stable Diffusion auf Ihrem Computer installieren, indem Sie den Quellcode von Plattformen wie GitHub herunterladen. Diese Methode erfordert eine kompatible Hardware, vorzugsweise mit einer leistungsstarken GPU, sowie Grundkenntnisse in der Softwareinstallation und -konfiguration. Dafür erhalten Sie die vollständige Kontrolle über den Generierungsprozess und sind nicht von den Launen kommerzieller Anbieter abhängig. Zudem bleiben die Bilder, die Sie generieren, privat.

  • 2.

    Online-Plattformen wie DreamStudio
    Sie können aber auch über Online-Plattformen auf das Stable Diffusion-Modell zugreifen. Stability AI selbst betreibt mit DreamStudio einen Cloud-basierten Service, der den Zugriff auf Stable Diffusion über eine einfache Web-Oberfläche ermöglicht. Diese Methode ist also deutlich zugänglicher, erlaubt aber weniger Personalisierung und Privatsphäre.

DreamStudio ist ein Cloud-basierter Service für Stable Diffusion.

Wie gut ist die Qualität bei Stable Diffusion?

Das hängt unter anderem davon ab, ob Sie die Web-Version von Stable Diffusion nutzen oder das Modell lokal installieren und von den umfassenden Anpassungsmöglichkeiten Gebrauch machen.

Wir haben für unseren Test DreamStudio genutzt und mit regulären Text-Prompts gearbeitet. Die Ergebnisse waren detailreich und hatten eine hohe visuelle Qualität, die Farbgebung und das generelle Design entsprachen den Prompts. Allerdings gab es auch einige Unstimmigkeiten: Teile unserer Prompts (Plüschtier, Fabelwesen) wurden ignoriert und Kennedy wurde verdoppelt.

Diese Bilder haben wir mit Stable Diffusion bei DreamStudio generiert.

Wie gut ist Stable Diffusion für geschäftliche Zwecke?

Das Stable Diffusion-Modell operiert unter der Creative ML OpenRAIL-M-Lizenz, die die kommerzielle Nutzung von Bildern grundsätzlich erlaubt.

Leider waren die Ergebnisse unserer Beispiel-Prompts nicht sonderlich gut. Das generierte Material war zu generisch und ungenau in Bezug auf die angeforderten Details, unsere Prompts wurden nicht korrekt umgewandelt. Texte konnte Stable Diffusion gar nicht wiedergeben.

Diese geschäftlichen Assets haben wir mit Stable Diffusion erstellt.

Was sind die Kosten und Konditionen von Stable Diffusion?

Stable Diffusion ist quelloffen und somit grundsätzlich kostenlos nutzbar. Online-Portale hingegen können eine Gebühr für die Nutzung ihrer Dienste verlangen.

DreamStudio nutzt beispielsweise ein Credit-System: Neue Nutzer erhalten 25 Credits, mit denen sich ca. 125 Bilder generieren lassen. Weitere Credits können Sie manuell nachkaufen, ein tägliches oder monatliches Kontingent gibt es nicht. Für 10 USD erhalten Sie 1.000 Credits, mit denen Sie ca. 5.000 Bilder generieren können.

Was sind Vor- und Nachteile von Stable Diffusion?

  • Open-Source
    Stable Diffusion ist quelloffen und ermöglicht es Nutzern, den Code zu modifizieren und zu erweitern. Sie können das Stable Diffusion-Modell sogar durch Training mit spezifischen Datensätzen personalisieren, um maßgeschneiderte Ergebnisse zu erzielen.

  • Lokale Installation
    Indem Sie das Stable Diffusion-Modell lokal installieren, können Sie auch offline Bilder erstellen und die Parameter der Generierung umfassender anpassen. Zudem sind Sie nicht von kommerziellen Anbietern abhängig und können Ihre Bilder privat halten.

  • Teils schlechtes Prompt-Verständnis
    Stable Diffusion ist nicht immer gut darin, Prompts auszulesen und korrekt zu visualisieren. Vor allem detaillierte Prompts, beispielsweise für geschäftliche Zwecke, können zu komplett falschen Ergebnissen führen.

  • Technische Barrieren
    Um das meiste aus Stable Diffusion herauszuholen, müssen Sie das Modell lokal installieren. Das erfordert nicht nur ein gewisses Maß an technischem Wissen, sondern auch gute Hardware.

5.

Leonardo.Ai: Vielseitiges KI-Tool mit vielen Konfigurationsmöglichkeiten

  • Kostenlose Version: Ja

  • Kosten für Premium: ab 10 USD pro Monat

  • Maximale Auflösung: 1536x1536

Leonardo.Ai ist ein KI-Tool, das mehrere KI-Modelle nutzt – unter anderem Stable Diffusion. Die Bilder werden also mithilfe der ausgewählten KI-Engine generiert, während Leonardo.Ai das benutzerfreundliche Frontend für die Erstellung und Bearbeitung der Grafiken liefert. Leonardo.Ai ist besonders auf die Erstellung von Gaming-Assets spezialisiert, aber für viele unterschiedliche Zwecke geeignet.

Wie funktioniert Leonardo.Ai?

Leonardo.Ai bietet eine intuitive, auch für Anfänger einfach zu bedienende Web-Plattform, in der Sie Ihre Prompts eingeben können. Das Besondere an Leonardo.Ai sind die vielen Werkzeuge, mit denen sich die Bilder selbst und die Details ihrer Generierung anpassen und individualisieren lassen.

Das Online-Interface von Leonardo.

Sie können Aspekte wie die Dimensionen, die Zahl der zu generierenden Bilder, die Auflösung und weitere Eigenschaften (z. B. Transparenz des Hintergrunds, Fotorealismus, Gewichtung der Prompts) individuell festlegen. Interessant ist auch die Möglichkeit, benutzerdefinierte Daten-Sets zu erstellen: Sie können eigene Bilder hochladen, um den visuellen Ton für den visuellen vorzugeben.

Wie gut ist die Qualität bei Leonardo.Ai?

Die Bilder sind grundsätzlich stimmig und punkten mit satten Farben und hohem Detailreichtum. Besonders gut gefielen uns die fotorealistischen Bilder – Leonardo.Ai lieferte den besten Kennedy aus unserem Vergleich.

Leider ignorierte Leonardo.Ai öfter mal wichtige Details unserer Prompts. Das betrifft sowohl Stil als auch Inhalt: Baumhaus und Leuchtturm wurden beispielsweise nicht im richtigen Stil generiert, unserem Roboter fehlte das Plüschtier und dem Leuchtturm die Fabelwesen.

Diese Bilder haben wir mit Leonardo.ai generiert.

Wie gut ist Leonardo.Ai für geschäftliche Zwecke?

Leonardo.Ai erlaubt die kommerzielle Nutzung von Bildern. Das etwas schwache Prompt-Verständnis der Plattform führte bei unseren detaillierten Business-Prompts jedoch zu enttäuschenden Ergebnissen, die unsere Suchintention nicht erfüllten.

Leonardo.Ai ist für bildgewaltige, kreative und künstlerische Anwendungen deutlich besser geeignet als für begleitendes Bildmaterial und Assets im geschäftlichen Kontext.

Diese geschäftlichen Assets haben wir mit Leonardo.Ai erstellt.

Was sind die Kosten und Konditionen von Leonardo.Ai?

Leonardo.Ai nutzt ein Token-System: Jede Aktion kostet eine gewisse Anzahl an Tokens, was sowohl die Bildgenerierung selbst als auch die damit verbundenen Funktionen und Einstellungen betrifft. Wenn Sie fotorealistische und generell hochwertigere Bilder erstellen möchten, müssen Sie also mehr dafür bezahlen.

Ähnlich wie bei Midjourney sind die Tokens Ihr Ticket zur schnellen Bildgenerierung. Wenn sie aufgebraucht sind, können Sie – zumindest ab dem Artisan Unlimited-Tarif – weiterhin Bilder erstellen, allerdings dauert es dann länger.

Neben dem Gratis-Tarif, der Ihnen 150 Tokens pro Tag zur Verfügung stellt, gibt es drei Premium-Tarife:

Tarif

Kosten pro Monat (jährliche Zahlung)

Konditionen

Apprentice Standard

10 USD

  • 8.500 Tokens pro Monat

Artisan Unlimited

24 USD

  • 25.000 Tokens pro Monat

  • privater Modus

Maestro Unlimited

48 USD

  • 60.000 Tokens pro Monat

  • Funktionen von Artisan Unlimited

Was sind Vor- und Nachteile von Leonardo.Ai?

  • Gute Bildqualität
    Mit Leonardo.Ai sind hochwertige, visuell ansprechende Bilder möglich. Die Plattform ist auch für fotorealistische Inhalte geeignet.

  • Viele Konfigurationsmöglichkeiten
    Sie können die Bildgenerierung und den Output mit vielen Werkzeugen an Ihre Anforderungen anpassen und die erstellten Bilder bearbeiten.

  • Eigene Bilder als Basis
    Sie können eigene Bilder hochladen und den visuellen Output dadurch genauer an Ihre Vorgaben anpassen.

  • Teils schwaches Prompt-Verständnis
    Leonardo.Ai ist nicht so smart wie ChatGPT, wichtige Aspekte der Prompts werden häufig ignoriert. Die Plattform ist für einfache Textvorgaben besser geeignet.

  • Komplizierte Preisstruktur
    Das Token-System von Leonardo.Ai ist unnötig kompliziert: Weil jede Aktion und Einstellungen Tokens verbraucht, kostet jede Bildgenerierung unterschiedlich viel.

  • Gratis-Tokens schnell aufgebraucht
    Mit seinen Gratis-Tokens ist Leonardo.Ai weniger großzügig als andere Plattformen (z. B. Microsoft), vor allem wenn Sie hochwertige Bilder erstellen möchten.

6.

Adobe Firefly

  • Kostenlose Version: Ja

  • Kosten für Premium: ab 5,49 € pro Monat

  • Maximale Auflösung: 2000x2000

Auch die alten Multimedia-Hasen sind mittlerweile auf den Generative-KI-Zug aufgesprungen. Case in Point: Adobe. Der US-Softwarehersteller hat mit Adobe Firefly sogar sein eigenes KI-Modell entwickelt, das auf Basis von Adobe Stock-Content und lizenzfreien Inhalten trainiert wurde.

Wie funktioniert Adobe Firefly?

Adobe Firefly ist ein benutzerfreundliches Web-Tool, das Sie mit Ihrem Adobe-Account im Browser nutzen können. Mit jedem Text-Prompt werden vier Bilder generiert, deren Details (z. B. Seitenverhältnis, Stil, Effekte) Sie in der Seitenleiste festlegen können.

Ähnlich wie bei Leonardo.Ai können Sie auch eine Referenzbildgalerie nutzen, um die visuelle Richtung für die Bildinhalte vorzugeben. Hierfür können Sie entweder vorgegebene Grafiken nutzen oder selbst Fotos hochladen. Und durch die Adobe-Verbindung können Sie Ihre frisch erstellten Bilder in Adobe Express weiter bearbeiten.

Adobe Firefly bietet eine intuitive Weboberfläche.

Wie gut ist die Qualität bei Adobe Firefly?

Adobe Firefly hat die Vorgaben unserer Prompts meist korrekt umgesetzt und grundsätzlich stimmige und hochwertige Bilder generiert. Die Ausnahme ist unser Kennedy-Testbild: Hier hat das KI-Modell zwar eine fotorealistische Person ausgespuckt, die mit John F. Kennedy aber nicht viel zu tun hat. Für die Darstellung echter Personen und historischer Momente ist Adobe Firefly somit nicht geeignet.

Insgesamt sind die Ergebnisse etwas „langweiliger“ und nicht ganz so imposant wie bei Midjourney oder DALL-E. Sie haben eine gewisse Stockfoto-Qualität, was natürlich auch am KI-Training mit Adobe Stock liegen kann.

Diese Bilder haben wir mit Adobe Firefly generiert.

Wie gut ist Adobe Firefly für geschäftliche Zwecke?

Adobe Firefly erlaubt die kommerzielle Nutzung der mit der Plattform generierten Bilder. Unsere Beispiel-Prompts führten jedoch zu durchwachsenen Ergebnissen: Sie gingen visuell in die richtige Richtung, erfüllten aber die in den Prompts dargelegte Suchintention für den Zweck der Bilder nicht.

Ähnlich wie Leonardo.Ai ist Adobe Firefly also besser für Stockfotos und künstlerische Darstellungen geeignet und weniger für sachbezogene Geschäftsanwendungen und Präsentationsmaterial. Texte wurden zudem komplett ignoriert.

Diese geschäftlichen Assets haben wir mit Adobe Firefly erstellt.

Was sind die Kosten und Konditionen von Adobe Firefly?

Solange Sie einen Adobe-Account haben, können Sie Firefly kostenlos nutzen, wobei Sie pro Monat nur 25 Generative Credits erhalten. Es gibt aber auch einen Firefly Premium-Tarif für 5,49 € im Monat, der 100 Credits pro Monat enthält.

Praktisch ist, dass Ihnen auch andere Adobe-Abos Zugriff zu Firefly geben. Wenn Sie also bereits für Photoshop, Illustrator oder Premiere Pro zahlen, erhalten Sie monatlich bis zu 500 Firefly-Credits dazu. Nutzer der Creative Cloud erhalten sogar 1.000 Credits pro Monat.

Was sind Vor- und Nachteile von Adobe Firefly?

  • Im Adobe-Abo integriert
    Alle Nutzer von Adobe-Produkten erhalten Credits für Adobe Firefly mit dazu.

  • Einfache Bedienung und Konfiguration
    Die Weboberfläche von Adobe Firefly ist kinderleicht zu bedienen. Sie können Bilder aus Texten generieren und die Parameter in der Seitenleiste anpassen.

  • Hochwertige Bilder
    Adobe Firefly generiert grundsätzlich hochwertige, stimmige Bilder mit Stockfoto-Qualität.

  • Bilder etwas langweilig
    Die Stockfoto-Qualität macht den Firefly-Output aber auch etwas langweilig. Midjourney und DALL-E liefern beispielsweise beeindruckendere Ergebnisse.

  • Prompt-Restriktionen
    Was kontroverses Material oder echte Personen angeht, ist Adobe Firefly etwas vorsichtiger. Ein Bild von John F. Kennedy konnten wir beispielsweise nicht generieren.

7.

ideogram: Bilder mit Texten

  • Kostenlose Version: Ja

  • Kosten für Premium: ab 7 USD pro Monat

  • Maximale Auflösung: 1024x1024

ideogram ist eine weitere KI-Plattform, mit der Sie aus Texten Bilder generieren können. Das Besondere an ideogram: Das eigens entwickelte KI-Modell ist im Vergleich zur Konkurrenz besser dafür geeignet, in den KI-Bildern auch kohärente Texte zu rendern.

Durch die Verbindung von Schrift und Illustrationen ergeben sich somit Einsatzmöglichkeiten, die von anderen KI-Tools bisher nur unzureichend abgedeckt werden.

Wie funktioniert ideogram?

ideogram stellt eine benutzerfreundliche Web-Plattform zur Verfügung, in der Sie Ihre Text-Prompts ins Bedienfeld eingeben und einige Einstellungen zum Design und den Bildeigenschaften vornehmen können. In den Bezahltarifen hat ideogram auch einen Editor eingebaut, mit dem Sie das soeben erstellte Bild weiter bearbeiten können.

Die Benutzeroberfläche von ideogram.

Wie gut ist die Qualität bei ideogram?

ideogram liefert überzeugende Ergebnisse. Die stilisierten Bilder – insbesondere das Baumhaus – waren am beeindruckendsten, auch wenn unsere Pixelart-Vorgabe leider nicht umgesetzt wurde.

Die realistischen Bilder waren weniger überzeugend: Dem Roboter-Bild fehlt es im Vergleich zu den Resultaten bei anderen Modellen an Detailtiefe und die „Ich bin ein Berliner“-Rede zeigt eher Sir Michael Palin als John F. Kennedy – noch dazu mit sechs Fingern:

Diese Bilder haben wir mit ideogram generiert.

Wie gut ist ideogram für geschäftliche Zwecke?

Eindrucksvoll, besonders im Vergleich zu den mauen Ergebnissen der Konkurrenz, waren die Resultate unserer geschäftlichen Prompts. ideogram verstand die Prompt-Intention und lieferte passende Assets für Social Media und Präsentationen. Die Texte waren leider auch hier nicht ganz korrekt, aber immerhin beinahe.

Die Nutzung der Inhalte für kommerzielle Zwecke ist laut den Nutzungsbedingungen von ideogram erlaubt.

Diese geschäftlichen Assets haben wir mit ideogram erstellt.

Was sind die Kosten und Konditionen von ideogram?

ideogram bietet einen Gratis-Tarif, mit dem Sie täglich 25 Prompts in Bilder verwandeln können. Allerdings ist die Geschwindigkeit der Erstellung gedrosselt und alle Bilder, die Sie erstellen, sind öffentlich zugänglich.

Es stehen zwei Premium-Tarife mit erweiterten Funktionen zur Auswahl:

Tarif

Kosten pro Monat im Jahrestarif

Konditionen

Basic

7 USD

  • 400 „schnelle“ Prompts pro Monat

  • 100 „langsame“ Prompts pro Tag

  • Zugriff zum ideogram-Editor

  • Volle Download-Qualität in PNG

Plus

17 USD

  • 1.000 „schnelle“ Prompts pro Monat

  • unbegrenzt „langsame“ Prompts

  • privater Modus

  • Image-Upload für Remixes

Was sind Vor- und Nachteile von ideogram?

  • Darstellung von Bild und Text
    ideogram bietet eines der wenigen KI-Modelle, dem es gelingt, generierte Bilder mit – nahezu – fehlerfreien Texten auszustatten. Damit eignet sich das Tool gut für die Erstellung von geschäftlichen Assets.

  • 25 Gratis-Bilder pro Tag
    Sie können ideogram kostenfrei nutzen und täglich 25 Bilder erstellen.

  • Bilder-Remix
    Im Plus-Tarif können Sie Bilder hochladen und mit dem Remix-Tool transformieren.

  • Probleme mit Fotorealismus
    Für fotorealistische Darstellungen ist ideogram weniger geeignet. Bilder von echten Personen wie John F. Kennedy konnten wir nicht generieren.

  • Textgenerierung nicht perfekt
    ideogram gelingt es zwar im Vergleich zu anderen Modellen gut, Texte zu rendern, doch perfekt und fehlerfrei sind die Texte bislang nicht.

8.

WOMBO Dream: KI-Bildgenerator fürs Smartphone

  • Kostenlose Version: Ja

  • Kosten für Premium: ca. 3,50 € pro Monat

Sie suchen einen KI-Bildgenerator für unterwegs? In den App-Stores von Apple und Google reiht sich mittlerweile ein KI-Tool ans nächste – doch die meisten davon taugen nichts. WOMBO Dream ist eine erfreuliche Ausnahme.

Wie funktioniert WOMBO Dream?

WOMBO Dream ist eine benutzerfreundliche Smartphone-App, die in Sekundenschnelle Bilder generiert. Sie müssen nur einen Prompt eingeben, einen Stil auswählen und das Seitenverhältnis festlegen. Die Bilder können Sie anschließend herunterladen oder in der WOMBO-App weiter bearbeiten.

Neben „Text zu Bild“-Funktionen bietet WOMBO auch typische Smartphone-KI-Features: Sie können Porträts in Avatare verwandeln und auch Ihre bereits aufgenommenen Fotos mit Text-Prompts transformieren.

Die WOMBO Dreams App ist benutzerfreundlich, wenn auch mit Werbung zugekleistert.

Wie gut ist die Qualität bei WOMBO Dream?

WOMBO liefert solide Ergebnisse: Die Bilder passen zu den Prompts und können sich – besonders für die Weiterverwendung am Smartphone, z. B. als Bildschirmhintergrund oder Avatar – sehen lassen.

Von Midjourney & Co. ist der Output aber qualitativ weit entfernt: Fotorealistische Resultate konnten wir nicht erzielen, stilisierte Inhalte sind etwas zu glatt und undetailliert. Wesentliche Aspekte unserer Prompts hat WOMBO zudem regelmäßig ignoriert.

Diese Bilder haben wir mit WOMBO Dream generiert.

Was sind die Kosten und Konditionen von WOMBO Dream?

Sie können WOMBO grundsätzlich kostenlos nutzen, müssen aber einige Einschränkungen hinnehmen. Sie können beispielsweise immer nur ein Bild generieren, während Premium-Nutzer bis zu vier Bilder gleichzeitig erstellen können. Zudem haben kostenlos generierte Bilder ein WOMBO-Wasserzeichen.

Das Premium-Abo von WOMBO kostete zum Testzeitpunkt ca. 40 € im Jahrestarif.

Was sind Vor- und Nachteile von WOMBO Dream?

  • Kostenlose KI-Bildgenerierung am Smartphone
    Mit WOMBO Dream können Sie schnell, unkompliziert und kostenlos KI-Bilder am Smartphone erstellen.

  • Text-zu-Bild und Bild-zu-Bild
    Mit WOMBO Dream können Sie nicht nur komplett neue Bilder aus Texten generieren, sondern auch bestehende Bilder transformieren, beispielsweise für Avatare.

  • Qualität nur OK
    Bilder wie von Midjourney sollten Sie hier nicht erwarten: Die Qualität ist solide, doch der Output ist weniger visuell beeindruckend, kreativ und detailreich als bei KI-Modellen der Oberklasse.

  • Prompts nur teilweise erfüllt
    Die Bilder gehen meist in die richtige Richtung, doch sowohl Stil- als auch Inhaltsvorgaben unserer Prompts wurden von WOMBO Dream öfter einmal ignoriert.

Fazit

Nicht nur KI-Inhalte überfluten das Internet – auch die Tools, die diese KI-Inhalte produzieren, schießen wie Pilze aus dem Boden. Was die Kosten, die Qualität der Inhalte, das Verständnis von Prompts und die Bearbeitungsmöglichkeiten angeht, gibt es zwischen den Programmen teils große Unterschiede.

Viele Tools leisten bereits heute beeindruckende Arbeit: DALL-E von OpenAI interpretiert Prompts mit eindrucksvoller Genauigkeit, Midjourney erstellt atemberaubend realistische Bilder, Stable Diffusion gibt Ihnen eine umfangreiche Kontrolle über den Generierungsprozess. Jedes Programm hat Stärken und Schwächen.

Egal, für welches Programm Sie sich entscheiden: Verwenden Sie KI-Bildgeneratoren nicht mit Bedacht – besonders, wenn es um kommerzielle Zwecke geht. Urheberrechtsfragen, ethische Bedenken, Fehlinterpretationen von Anweisungen: KI-Tools können eine große Hilfe sein, aber auch schnell großen Schaden anrichten. Gehen Sie also vorsichtig damit um.

Sie benötigen KI-Texte zu den KI-Bildern? Die besten KI-Textgeneratoren haben wir hier für Sie zusammengestellt.

Martin Gschwentner hat Amerikanistik und Medienwissenschaft in Deutschland, den USA und Frankreich studiert und arbeitet als freier Redakteur in Paris. Er forscht als Doktorand am Institut für England- und Amerikastudien der Universität Paris Diderot zum Einfluss des Geldes auf die US-Politik. Auf EXPERTE.de schreibt er über IT-Sicherheit, Datenschutz und Software für Selbständige und Kleinunternehmen.
Mehr zum Thema
Generative KI
KI-Bildgeneratoren
KI-Textgeneratoren