Stell Dir vor, Du lässt Deine Fantasie spielen und erstellst ein Bild von einer Straße, die durch eine Wüste führt. Was siehst Du? Vielleicht endloses, staubiges Land, einen strahlend blauen Himmel und die gerade Straße, die bis zum Horizont führt. Du weißt genau, wie Du dieses Bild malen oder modellieren würdest, um es zum Leben zu erwecken.
Jetzt stell dir vor, du lässt eine Künstliche Intelligenz (KI) dasselbe tun. Aber anstatt eines strahlend blauen Himmels gibt Dir die KI einen grünen. Statt einer Wüste bekommst Du einen dichten Wald. Die KI hat Deine Anweisungen nicht richtig umgesetzt. Warum passiert das? Und warum kann das gut sein? Finden wir es gemeinsam heraus.
Warum erzeugen KIs viele falsche Bilder?
Was bedeutet es, wenn wir sagen, dass eine KI ein „falsches“ Bild erzeugt? Eine KI, die für die Erstellung von Bildern programmiert wurde, lernt, indem sie eine große Anzahl von Bildern untersucht. Sie nimmt all diese Daten auf, analysiert Muster und versucht dann, auf der Grundlage dessen, was sie gelernt hat, ein neues Bild zu erstellen.
Eine KI ist jedoch nur so gut wie die Daten, mit denen sie gefüttert wird. Wenn eine KI noch nie ein Bild einer Wüstenlandschaft gesehen hat, kann sie auch kein genaues Bild davon erstellen. Sie könnte versuchen, die fehlenden Daten zu kompensieren, indem sie Elemente aus anderen Landschaften verwendet, zum Beispiel Wälder. Das Ergebnis könnte faszinierend sein, aber es wäre definitiv falsch.
Wie lernen KIs aus Fehlern?
Ein falsches Bild ist nicht das Ende der Welt. Eigentlich ist es ein Anfang. Denn jede KI ist darauf programmiert, aus Fehlern zu lernen. Jedes Mal, wenn eine KI ein falsches Bild erzeugt und korrigiert wird, nimmt sie diese Information auf und speichert sie für die Zukunft. Sie „versteht“, dass sie einen Fehler gemacht hat, und versucht, ihn bei künftigen Versuchen zu vermeiden.
Dies ist vergleichbar mit dem Lernprozess eines Kindes. Wenn ein Kind zum ersten Mal einen Stift in die Hand nimmt, wird es wahrscheinlich nicht in der Lage sein, ein perfektes Bild zu malen. Aber mit der Zeit, durch Übung und Korrektur, wird es besser. Genauso lernt eine KI.
Warum braucht es Zeit, um zu einem brauchbaren Ergebnis zu kommen?
Lernen, ob von Menschen oder Maschinen, ist ein Prozess. Es braucht Zeit, Erfahrung und viel Versuch und Irrtum, um Fortschritte zu machen. Das ist der Grund, warum eine KI, selbst nachdem sie Tausende oder sogar Millionen von Bildern gesehen hat, immer noch Fehler machen kann. Es braucht Zeit, um all diese Informationen zu verarbeiten und zu lernen, wie sie effektiv genutzt werden können.
Außerdem ist es wichtig, sich daran zu erinnern, dass „nützlich“ relativ ist. Was für einen Zweck geeignet ist, kann für einen anderen nicht geeignet sein. Eine KI, die darauf trainiert wurde, realistische Landschaftsbilder zu erzeugen, könnte Schwierigkeiten haben, abstrakte Kunst zu schaffen, und umgekehrt.
Fehler sind also nicht nur unvermeidlich, sondern auch notwendig. Sie sind Teil des Lernprozesses und führen zu Verbesserungen. Mit Geduld und Zeit wird eine KI immer bessere Bilder erstellen, die immer genauer auf die Anweisungen des Benutzers reagieren.
Und auch wenn die Ergebnisse manchmal nicht dem entsprechen, was Du Dir vorgestellt hast, vergiss nicht: KI ist auch eine Quelle der Kreativität. Ein „falsches“ Bild kann Dich zu neuen Ideen und Perspektiven inspirieren.
Bilderstecke: Ich will doch nur einen Hund!
Exemplarisch darf ich ein paar Bilder herzeigen, die die KI so „ausgespuckt“ hat. Ich wollte eigentlich nur einen Hund! Dabei errechnete die KI ein paar eigenartige Exemplare. Zuviele Köpfe, verdrehte Körper und andere Nettigkeiten.
Und nach vielen weiteren Versuchen und Optimierungen (Stichwort: „Negative Prompts“, siehe unten) kam ich dann zum von mir gewünschten Ergebnis:
Ein „negative prompt“ bei KI-Bildgeneratoren bezieht sich auf einen Anweisungstext oder eine Eingabe, die darauf abzielt, das Modell dazu zu bringen, ein Bild zu generieren, das das Gegenteil oder das Gegenteil von dem darstellt, was normalerweise erwartet wird.
Bei der Verwendung von KI-Bildgeneratoren werden normalerweise sogenannte „positive prompts“ verwendet, bei denen die gewünschten Merkmale oder Objekte beschrieben werden, die im generierten Bild enthalten sein sollen. Ein Beispiel für einen positiven Prompt könnte lauten: „Generiere ein Bild von einem sonnigen Strand mit Palmen und blauem Himmel.“
Ein negativer Prompt würde hingegen darauf abzielen, dem Modell zu sagen, was nicht im Bild enthalten sein sollte oder welche Merkmale vermieden werden sollen. Ein Beispiel für einen negativen Prompt könnte lauten: „Generiere ein Bild von einem Strand, aber ohne Menschen oder Wasser.“
Durch die Verwendung von negativen Prompts können Entwickler die Generierung von Bildern steuern und spezifische Einschränkungen oder Anforderungen festlegen. Dies kann hilfreich sein, um unerwünschte Inhalte zu vermeiden oder die Ausgabe des Modells genauer anzupassen.
Quelle: Das sagt uns ChatGPT