Von Kunst bis künstlich: Corporate Images mittels künstlicher Intelligenz

12 Min. Lesezeit
12.06.2024

Die Fähigkeit künstlicher Intelligenz (KI), Bilder zu erzeugen, die den spezifischen Anforderungen eines Unternehmens entsprechen, hat einen Paradigmenwechsel im Marketing und in der visuellen Kommunikation ausgelöst. Statt sich auf traditionelle, oft zeitaufwendige und kostenintensive Methoden der Bildproduktion zu verlassen, können Unternehmen nun vermehrt auf KI-Tools zurückgreifen, um maßgeschneiderte Bilder zu kreieren, die den individuellen Stil des Unternehmens widerspiegeln. Doch wie effektiv ist die Bildgenerierung im Corporate Style mittels KI wirklich?

Vorteile der KI-basierten Bildgenerierung

  • Zeit- und Kostenersparnis
  • Skalierbarkeit und Effizienz durch schnelle Erstellung großer Bildmengen in kurzer Zeit
  • Reduzierte Abhängigkeit von externen Dienstleistern wie Agenturen oder Grafikdesigner:innen
  • Experimentiermöglichkeiten
  • Schnelle Anpassungen und Optimierungen möglich

Funktionsweise von KI-Algorithmen bei der Bildgenerierung

Wie funktioniert die Bildgenerierung mit KI-Tools? Die KI nimmt ihre Arbeit auf, sobald ein Prompt eingegeben wird. Doch was genau geschieht dabei im Hintergrund?

Zunächst werden große Mengen an Bilddaten gesammelt und für das Training des KI-Modells herangezogen. Diese Datensätze enthalten typischerweise Bilder, die mit entsprechenden Labels oder Kategorien versehen sind, um dem Algorithmus das Erkennen bestimmter Muster und Eigenschaften beizubringen.

Generative Modelle wie Generative Adversarial Networks (GANs) oder Variational Autoencoders (VAEs) sind gängige Architekturen für die Bildgenerierung mittels KI. GANs bestehen aus zwei neuronalen Netzen, dem Generator und dem Diskriminator, die miteinander „konkurrieren“. Der Generator erzeugt Bilder, während der Diskriminator versucht, zwischen echten und generierten Bildern zu unterscheiden. Dieser „Wettbewerb“ zwischen den Netzwerken führt zu einer kontinuierlichen Verbesserung der erzeugten Bilder.

Die Qualität der generierten Bilder hängt stark von der Qualität und Diversität der Trainingsdaten, der Modellarchitektur, den Hyperparametern des Modells und anderen Faktoren wie der Eingabe der Prompts ab.

Je besser der Prompt, desto besser das Bild

Um eine erfolgreiche Bildgenerierung mittels KI zu erreichen, ist die präzise Formulierung des Prompts von entscheidender Bedeutung. Mit dem Prompt geben Sie der KI – in der Regel in englischer Sprache – Anweisungen, welche Art von Bild sie generieren soll. Um optimale Ergebnisse zu erzielen, sollten Sie einige Tipps und Hinweise bei der Eingabe des Prompts beachten.

  1. Präzise Formulierung: Beschreiben Sie die gewünschten visuellen Elemente, Stile, Farben, Kompositionen oder andere spezifische Merkmale des gewünschten Bildes so genau wie möglich. Je detaillierter der Prompt ist, desto besser kann die KI Ihre Anforderungen umsetzen.
  2. Konkrete Referenzen: Geben Sie der KI konkrete Objekte, Szenarien oder visuelle Referenzen, auf die sie sich beziehen kann. Dies erleichtert der KI das Verständnis Ihrer Erwartungen und fördert präzisere Ergebnisse.
  3. Natürliche Sprache: Kommunizieren Sie mit der KI wie mit eine:r menschlichen Designer:in. Beschreiben Sie das Bild, das Sie möchten, in klaren und prägnanten Worten. Vermeiden Sie dabei überflüssige Füllwörter und konzentrieren Sie sich auf das Wesentliche.
  4. Experimentieren und anpassen: Möglicherweise sind mehrere Versuche und Anpassungen des Prompts erforderlich, um das gewünschte Bild zu erzeugen. Experimentieren Sie mit verschiedenen Formulierungen, um herauszufinden, welche präziseren Anweisungen die besten Ergebnisse liefern.
  5. Positive Formulierungen: Beschreiben Sie, was Sie sehen möchten, anstatt zu erklären, was Sie nicht sehen möchten. Negative Angaben können zu unerwünschten Ergebnissen führen. Beispielsweise wird bei der Eingabe „Wedding party with no cake“ wahrscheinlich ein Bild einer Hochzeitsfeier mit einem Kuchen erstellt. Verzichten Sie daher auf solche Formulierungen und nutzen Sie gegebenenfalls den „--no“-Parameter in Midjourney-Prompts, um bestimmte Inhalte auszuschließen.
  6. Seitenverhältnis festlegen: Beachten Sie, dass das Seitenverhältnis einen erheblichen Einfluss auf das Ergebnis haben kann. Um sicherzustellen, dass das Bild Ihren Vorstellungen entspricht, geben Sie das gewünschte Seitenverhältnis direkt im Prompt an. Wenn Sie beispielsweise eine einzelne Person darstellen möchten, funktioniert oft das Hochformat besser, es sei denn, es handelt sich um mehrere Personen. In Midjourney kann das Seitenverhältnis durch die Eingabe von „--ar 16:9“ nach dem Textbefehl festgelegt werden. Auch in DALL·E geben Sie das gewünschte Seitenverhältnis im Prompt an. In Adobe Firefly und Lexica können Sie das Seitenverhältnis durch Anklicken oder mit einem Schieberegler auswählen.

Vergessen Sie nicht Ihr Corporate Design

Besonders die ersten Experimente mit KI-Tools können äußerst faszinierend sein. Doch welche Möglichkeiten bieten die Tools genau? Was geschieht, wenn man den Prompt leicht abändert? In solchen Momenten kann schnell die Neugier überwiegen und das Corporate Design gerät in den Hintergrund. Dies ist nicht empfehlenswert, denn Bilder sind ein wesentlicher Bestandteil des Corporate Designs. Sie stellen eine starke visuelle Verbindung zur Marke her und fördern die Wiedererkennung bei der Zielgruppe.

Die KI-basierte Generierung von Corporate Images erfordert ein tiefes Verständnis des Corporate Designs. Wenn Sie Agenturen oder Grafikdesigner:innen beauftragen, geben Sie diesen Ihren Brand Styleguide mit. Ähnlich funktioniert es auch mit KI-Tools. Die KI muss den Styleguide interpretieren und umsetzen können. Im Gegensatz zu Agenturen oder Designer:innen hat die KI jedoch kein Gedächtnis. Daher ist Erfahrung durch Experimentieren hier von großer Bedeutung.

Bevor Sie beginnen, ist es ratsam, sich mit der Bildgebung, die im Brand Styleguide festgehalten ist, auseinanderzusetzen. Was wird typischerweise dargestellt? Welche Lichtverhältnisse werden bevorzugt? Welche Farbgebung ist üblich? Diese Informationen sollten in den Prompt integriert werden, quasi als Hintergrundwissen.

In vielen Tools können auch Referenzbilder aus bestehenden Bilddatenbanken hochgeladen werden, an denen sich die KI orientieren kann. Auf diese Weise kann eine größere Konsistenz mit dem Corporate Design sichergestellt werden.

Wichtig ist, dass Sie alle generierten Bilder kontrollieren. Entspricht die Bildgestaltung den Regeln Ihres Corporate Designs? Sind die Bilder ansonsten einwandfrei oder treten Fehler auf? Oftmals werden Hände oder Hintergrundpersonen unvollständig dargestellt – darauf sollten Sie achten.

Herausforderungen der KI-basierten Bildgenerierung

Trotz des Hypes und der Begeisterung dürfen wir nicht übersehen, dass die KI-basierte Bildgenerierung auch einige Herausforderungen und Schwierigkeiten mit sich bringt.

  1. Qualität der Bilder: Die Qualität der erzeugten Bilder entspricht möglicherweise nicht immer den gewünschten Standards. Insbesondere bei begrenzten oder unzureichenden Trainingsdaten kann es schwierig sein, komplexe Details, Texturen oder feine Nuancen korrekt darzustellen. Häufig sind Personen oder Objekte im Vordergrund fehlerfrei, während der Hintergrund chaotisch wirkt.
  2. Ethik und Bildrechte: Der Einsatz von KI zur Bilderzeugung wirft ethische Fragen auf, insbesondere im Hinblick auf die Datennutzung, möglichen Missbrauch mit gefälschten oder irreführenden Inhalten sowie die Verantwortung für Bilder, die falsch interpretiert werden könnten. Außerdem besteht oft Unklarheit bezüglich der Rechte an den Bildern.
  3. Vorurteile und Stereotypen: Wenn die Trainingsdaten von KI-Modellen Vorurteile enthalten oder nicht vielfältig genug sind, können auch die erzeugten Bilder Vorurteile oder Stereotypen aufweisen.
  4. Datenschutz und Datensicherheit: Der Einsatz von KI-Modellen zur Bildgenerierung erfordert meist große Datenmengen. Dabei müssen die Sicherheit und der Schutz sensibler Daten gewährleistet sein, um Datenschutzrichtlinien sowie ethische Standards einzuhalten.

Zusätzlich ist nicht jeder Lebensbereich für die Bildgenerierung durch künstliche Intelligenz geeignet. So könnte der Einsatz von KI-basierten Bildern im Kontext der humanitären Hilfe problematisch sein. Beispielsweise könnte eine fehlende Authentizität von Bildern, die in erster Linie dazu dienen, Emotionen zur Generierung von Spenden zu wecken, die Glaubwürdigkeit der Organisation massiv beeinträchtigen und damit potenzielle Spender:innen abschrecken. Es ist daher wichtig, sorgfältig abzuwägen, wann und in welchem Zusammenhang KI-generierte Bilder eingesetzt werden.

KI-basierte Bildgeneratoren

Der Markt für verfügbare Tools ist groß und wächst kontinuierlich. In der Regel liefern kostenpflichtige Tools eine höhere Qualität als kostenlose. Dennoch können kostenlose Tools für den Einstieg in die Welt der KI-basierten Bildgenerierung ausreichend sein und vielfältige Möglichkeiten bieten.

Wenn Sie mit der Qualität der erzeugten Bilder zufrieden sind und diese auch kommerziell nutzen möchten, beispielsweise in Marketingkampagnen, ist es wichtig, Tools zu wählen, die eine kommerzielle Nutzung ausdrücklich erlauben. Vor einer potenziellen Veröffentlichung empfiehlt es sich, umfassende Recherchen anzustellen und bei Bedarf professionelle Beratung einzuholen.

Bekannte Tools sind Midjourney und DALL·E von OpenAI (ChatGPT). Darüber hinaus bieten auch Unternehmen wie Canva, Adobe oder Lexica eigene Bildgeneratoren an.

Die Bedienung dieser Tools ist im Wesentlichen immer ähnlich. Sie loggen sich auf der entsprechenden Plattform ein und geben in das dafür vorgesehene Feld ein, was Sie von der KI generieren lassen möchten. Innerhalb von etwa 20 Sekunden erhalten Sie verschiedene Ergebnisse. Wählen Sie Ihren Favoriten aus oder passen Sie den Prompt an, falls Sie noch nicht zufrieden sind. Im Endergebnis steht Ihr KI-generiertes Bild zum Download bereit.

Praxistest: KI-generierte Corporate Images

Die Ergebnisse können je nach dem verwendeten KI-Tool variieren. Wir von empower haben einen Praxistest durchgeführt, um ein Corporate Image zu generieren, das unseren Guidelines entspricht und im Idealfall für das Cover dieser Ausgabe verwendet werden kann.

In DALL·E, Adobe Firefly, Lexica und Midjourney haben wir folgenden Prompt getestet:

Create a reportage style photography showing a business woman working on a laptop, looking into the camera, in a modern office and make sure there is a general positive feeling.

Use natural light sources and a combination of warm skintones and highlights and blue/cyan untertones. Include accents of blue in elements of the image, such as colours or objects.

Hier sind die Ergebnisse:

DALL·E (ChatGPT)

DALL·E sowie die Nachfolger DALL·E 2 und DALL·E 3 sind KI-Bildgeneratoren, die von OpenAI entwickelt wurden. Um sie nutzen zu können, ist ein Benutzerkonto bei OpenAI erforderlich. Es steht nur eine begrenzte Anzahl kostenloser Tests zur Verfügung, da derzeit Credits benötigt werden, um weitere Bilder zu erzeugen. Nachdem Sie 50 Credits aufgebraucht haben, „schenkt“ Ihnen OpenAI 15 Credits pro Monat, sofern Ihr Konto vor dem 6. April 2023 erstellt wurde. Falls Sie mehr Credits wünschen oder Ihr Zugang nach dem 6. April 2023 eingerichtet wurde, ist eine Bezahlung erforderlich.

KI-generierte Frau im Büro Dall-EKI-generierte Frau im Büro Dall-E 2. VersuchKI-generierte Frau im Büro Dall-E 3. VersuchKI-generierte Frau im Büro Dall-E 4. Versuch


Die Ergebnisse unseres Tests zeigen durchweg makellose Personen: volle Lippen, ebenmäßige und strahlende Haut. Die Personen lächeln wie gewünscht in die Kamera. Auffällig ist jedoch, dass die Augen oft unterschiedliche Farben haben und nicht besonders realistisch wirken. Bei den Fingern hingegen konnten wir vergleichsweise wenige Unstimmigkeiten feststellen. Gerade die Darstellung von Fingern stellt für viele KI-Tools noch eine Herausforderung dar. In unserem Test wurden ausschließlich Personen mit weißer Hautfarbe dargestellt.

Im Hintergrund werden moderne Bürolandschaften dargestellt. Hier finden sich die gewünschten blauen Akzente: blaue Lampen, Möbel und Büroaccessoires. Zudem sind warme, natürliche Lichtquellen vorhanden, obwohl die Bilder einen eher dunklen Gesamteindruck vermitteln.

Obwohl die KI alle Anforderungen aus dem Prompt erfüllt hat, wirken die Bilder insgesamt sehr glatt, ziemlich dunkel und wenig realistisch, weshalb sie sich nicht für unsere Unternehmenskommunikation eignen.

Adobe Firefly

Adobe Firefly ist ein Produkt der Adobe Creative Cloud und steht Adobe-Abonnent:innen kostenlos zur Verfügung.

Die Ergebnisse sind beeindruckend. Dank vieler kleiner Details wie Schmuck, Armbanduhren und feiner Gesichtsmerkmale wie Falten oder Sommersprossen wirken die Bilder sehr realistisch und lebendig. Die Wiedergabe der Fingerpartien ist zwar auch bei Adobe Firefly nicht immer fehlerfrei, gelegentlich erscheint der Gesichtsausdruck der Personen etwas abwesend. Die dargestellten Personen sind vielfältiger und abwechslungsreicher als bei DALL·E.

KI-generierte Frau im Büro Adobe FireflyKI-generierte Frau im Büro Adobe Firefly 2. VersuchKI-generierte Frau im Büro Adobe Firefly 3. VersuchKI-generierte Frau im Büro Adobe Firefly 4. VersuchKI-generierte Frau im Büro Adobe Firefly 5. Versuch

Die Büroumgebung im Hintergrund ist etwas simpler gehalten als bei DALL·E. Dennoch sind auch hier blaue Akzente und Untertöne zu finden, ebenso in der Kleidung der Personen. Dank natürlicher Lichtquellen wirken die Bilder hell und einladend.

Die Vorgaben aus unserem Prompt wurden nahezu zu 100 % umgesetzt. Die Ergebnisse kommen unseren Corporate Images sehr nahe.

Lexica

Lexica Art ist eine Suchmaschine für Bilder, die mithilfe von künstlicher Intelligenz erstellt wurden. Sie ermöglicht die Suche nach Bildern, die mit Stable Diffusion erzeugt wurden, oder die Erstellung eigener Bilder auf der Grundlage von Text. Die ersten Bilder können kostenlos generiert werden.

Die von Lexica generierten Ergebnisse wirken auf den ersten Blick sehr ansprechend und beeindruckend. Bei genauerer Betrachtung fallen jedoch zunehmend Fehler auf, insbesondere im Bereich der Hände.

Die im Rahmen unseres Tests abgebildeten Personen sind sehr vielfältig und unterschiedlich. Allerdings fällt auf, dass viele von ihnen nicht in die Kamera blicken, obwohl dies im Prompt vorgegeben war. Einige Personen haben sogar geschlossene Augen.

KI-generierte Frau im Büro LexicaKI-generierte Frau im Büro Lexica 2. VersuchKI-generierte Frau im Büro Lexica 3. VersuchKI-generierte Frau im Büro Lexica 4. Versuch

Die Hintergründe der Bilder sind im Vergleich zu Adobe Firefly deutlich detailreicher und vermitteln einen modernen Eindruck. Auffällig ist, dass auf den meisten Bildern Pflanzen im Hintergrund oder auf dem Schreibtisch abgebildet sind. Teilweise werden jedoch auch Gegenstände dargestellt, die keinen erkennbaren Nutzen haben und etwas deplatziert wirken. Während wir auf vielen Bildern blaue Akzente oder Untertöne vermissen, wurden die Vorgaben zu den Lichtquellen weitgehend beachtet.

Midjourney

Midjourney gilt als eines der bekanntesten KI-Tools zur Erzeugung von Bildern. Um Midjourney nutzen zu können, ist ein Discord-Account erforderlich. Die kostenlose Nutzung wird immer wieder pausiert und ist nicht durchgehend verfügbar. Midjourney bietet vier verschiedene Abonnements an, deren Kosten je nach Art des Abonnements variieren.

Die erzielten Ergebnisse sind insgesamt vielversprechend. Einige Bilder wirken weniger modern als andere. Die abgebildeten Personen sind größtenteils blond und hellhäutig, wobei das Alter variiert. Sie erscheinen realistisch, allerdings gibt es auch hier Probleme mit der Darstellung der Finger.

KI-generierte Frau im Büro MidjourneyKI-generierte Frau im Büro Midjourney 2. VersuchKI-generierte Frau im Büro Midjourney 3. VersuchKI-generierte Frau im Büro Midjourney 4. Versuch

Die Hintergründe sind äußerst vielfältig und überwiegend modern gestaltet. In allen Bildern finden sich blaue Akzente, wobei der blaue Blazer besonders beliebt zu sein scheint. Im Bild unten links hat Midjourney eine ganz neue Variante von Laptop entwickelt.

Trotz einiger Fehler in den Bildern kommen die mit Midjourney erstellten Bilder den Anforderungen unseres Corporate Designs mit am nächsten, dicht gefolgt von den Bildern, die mit Adobe Firefly generiert wurden.

Fazit

Der Praxistest zur KI-gestützten Generierung von Corporate Images hat eine Vielzahl von Ergebnissen geliefert, die sowohl das immense Potenzial dieser Technologie als auch die damit verbundenen Herausforderungen verdeutlichen.

Einige Tools neigen dazu, idealisierte und stereotype Bilder zu erzeugen. Dies kann auf verschiedene Faktoren zurückgeführt werden, darunter die Trainingsdaten des Modells und vorherrschende kulturelle Normen in Bezug auf Schönheit und Ästhetik. Es ist wichtig zu beachten, dass KI-Modelle die Muster der Daten widerspiegeln, mit denen sie trainiert wurden. Dem kann jedoch durch gezielte Anpassungen im Prompt entgegengewirkt werden, um mehr Diversität zu fördern.

Eine sorgfältige Überprüfung der generierten Bilder ist entscheidend, um sicherzustellen, dass sie den Richtlinien des Corporate Designs entsprechen und die nötigen Anforderungen erfüllen. Mit dem richtigen Augenmerk und genug Erfahrung können diese Tools effektiv genutzt werden, um Corporate Images schnell und kostengünstig zu erstellen. Es ist ratsam, sorgfältig abzuwägen, in welchem Kontext und zu welchem Zweck KI-generierte Bilder eingesetzt werden sollen. Wir von empower können uns zum Beispiel vorstellen, KI-generierte Bilder in E-Books oder Whitepapers zu verwenden.

empower AI Assistant

Zum Newsletter anmelden