Midjourney v7: Wenn KI-Bilder nicht mehr von der Realität zu unterscheiden sind

06.04.2025
von Jörg Schieb

Die neueste Version der populären KI-Bildgenerierung schockiert mit fotorealistischer Hautdarstellung – ein Durchbruch mit Folgen

Es ist ein stiller Paradigmenwechsel, der sich gerade vor unseren Augen vollzieht: Mit der Veröffentlichung von Midjourney v7 hat die KI-Bildgenerierung einen Meilenstein erreicht, der die Grenzen zwischen Realität und künstlicher Kreation nahezu auflöst.

Was bisher noch relativ leicht als „KI-generiert“ zu erkennen war, stellt selbst Experten jetzt vor Herausforderungen – mit weitreichenden Konsequenzen für unseren Umgang mit visuellen Medien.

Vor allem bei Nahaufnahmen sind die Stärken der neuen Version von Midjourney zu sehen
Vor allem bei Nahaufnahmen sind die Stärken der neuen Version von Midjourney zu sehen

Haut wie echt: Der entscheidende Durchbruch

Wer die Entwicklung von KI-Bildgeneratoren verfolgt hat, kennt das Problem: Während Landschaften, Gebäude oder abstrakte Szenen schon länger beeindruckend realistisch dargestellt werden konnten, blieb die authentische Wiedergabe menschlicher Haut eine hartnäckige Hürde. Zu glatt, zu makellos, zu künstlich – das „Uncanny Valley“ war deutlich spürbar.

Midjourney v7 hat diese Barriere nun überwunden. Die neue Version erzeugt Hautbilder mit einem bisher unerreichten Grad an Natürlichkeit. Feine Falten bilden sich in Augenwinkeln, subtile Hautunreinheiten wie Rötungen oder kleine Pigmentflecken tauchen auf, Poren sind sichtbar, und selbst die Art, wie Licht von unterschiedlichen Hauttypen reflektiert wird, entspricht nun physikalischen Realitäten.

„Es ist beängstigend realistisch“, erklärt Digitalkünstlerin Sara Meier, die seit Jahren mit KI-Bildgeneratoren arbeitet. „Ich kann jetzt Porträts erstellen, bei denen selbst meine Kollegen aus der Fotografie nicht mehr sicher sagen können, ob es sich um ein echtes Foto oder ein KI-Bild handelt. Die kleinen Unvollkommenheiten machen den Unterschied – paradoxerweise wirkt die Haut realistischer, weil sie nicht mehr perfekt ist.“

Mit Buchstaben hat Midjourney 7 immer noch gewisse Probleme
Mit Buchstaben hat Midjourney 7 immer noch gewisse Probleme

Die technischen Hintergründe

Der Durchbruch basiert auf mehreren technischen Innovationen. Zum einen hat Midjourney sein Trainingsmaterial deutlich erweitert und verfeinert. Zum anderen kommen verbesserte neuronale Netzwerke zum Einsatz, die speziell auf die Simulation von Hautbeschaffenheit und Mikrodetails optimiert wurden.

Ein wichtiger Faktor ist auch das verbesserte Verständnis für die Interaktion zwischen Licht und Haut. Echte Haut ist ein komplexes, teilweise durchscheinendes Material, das Licht nicht nur reflektiert, sondern teilweise absorbiert und streut – ein Phänomen, das als „Subsurface Scattering“ bekannt ist. Midjourney v7 simuliert diesen Effekt nun mit erstaunlicher Präzision.

Risiko Deepfake: Dieser Imbisswagen hat niemals vor dem Kölner Dom gebrannt - sieht aber so aus
Risiko Deepfake: Dieser Imbisswagen hat niemals vor dem Kölner Dom gebrannt – sieht aber so aus

Chance und Risiko: Die zwei Seiten der Medaille

Für kreative Branchen eröffnet diese Entwicklung faszinierende Möglichkeiten. Produktdesigner können fotorealistische Prototypen erstellen, ohne teure Fotoshootings organisieren zu müssen. Filmemacher bekommen Zugang zu virtuellen Charakteren, die von echten Schauspielern kaum zu unterscheiden sind. Werbeagenturen können Kampagnen mit „perfekt unperfekten“ Models gestalten, die genau die gewünschte Zielgruppe repräsentieren.

Doch die Kehrseite dieser Medaille wird immer deutlicher: Wenn selbst Experten KI-Bilder nicht mehr zuverlässig erkennen können, wie sollen es dann Normalverbraucher schaffen? Die Gefahr von Missbrauch – sei es durch Fake News, Identitätsdiebstahl oder Deepfakes – wächst exponentiell.

„Wir stehen an einem kritischen Punkt“, warnt Medienforscher Dr. Thomas Berger. „Wenn wir unseren Augen nicht mehr trauen können, hat das massive Auswirkungen auf unser Informationsverhalten. Das Vertrauen in visuelle Medien könnte grundlegend erschüttert werden.“

Technologischer Wettlauf: Die Suche nach Erkennungsmethoden

Parallel zur Entwicklung immer besserer Bildgeneratoren läuft ein Wettlauf um effektive Erkennungstechnologien. Verschiedene Startups und Forschungseinrichtungen arbeiten an Tools, die KI-generierte Inhalte automatisch identifizieren sollen.

Einige Ansätze konzentrieren sich auf digitale Wasserzeichen oder versteckte Signaturen, die in KI-Bilder eingebettet werden. Andere versuchen, subtile Muster zu erkennen, die typisch für generative Algorithmen sind. Doch mit jedem Fortschritt der Generatoren werden auch diese Erkennungsmethoden herausgefordert.

Neue digitale Kompetenz gefordert

Für Internetnutzer bedeutet diese Entwicklung, dass eine neue Form der Medienkompetenz erforderlich wird. „Wir müssen lernen, Bilder nicht mehr als selbstverständlichen ‚Beweis‘ zu akzeptieren“, betont Medienpädagogin Julia Werner. „Stattdessen wird Kontextprüfung wichtiger: Wer hat das Bild veröffentlicht? Gibt es Bestätigungen aus anderen Quellen? Erscheint die Darstellung plausibel?“

Schulen und Bildungseinrichtungen stehen vor der Herausforderung, diese kritische Kompetenz zu vermitteln – in einer Zeit, in der visuelle Inhalte immer wichtiger werden und gleichzeitig immer weniger vertrauenswürdig sind.

Regulatorische Herausforderungen

Auch Gesetzgeber weltweit ringen mit der Frage, wie mit dieser Technologie umzugehen ist. Erste Ansätze reichen von Kennzeichnungspflichten für KI-generierte Inhalte bis hin zu Einschränkungen bestimmter Anwendungsfälle. Doch die Durchsetzung solcher Regelungen gestaltet sich schwierig in einer globalisierten, digitalen Welt.

Fazit: Ein neues visuelles Zeitalter beginnt

Midjourney v7 markiert einen entscheidenden Wendepunkt in der Geschichte visueller Medien. Die Fähigkeit, menschliche Haut mit all ihren natürlichen Unvollkommenheiten zu simulieren, schließt eine der letzten erkennbaren Lücken zwischen künstlich erzeugten und realen Bildern.

Wir treten in ein Zeitalter ein, in dem das bloße Auge nicht mehr ausreicht, um Wahrheit von Fiktion zu unterscheiden. Diese Entwicklung bringt enorme kreative Möglichkeiten mit sich – aber auch die Verantwortung, einen neuen, bewussteren Umgang mit visuellen Inhalten zu finden.

Eines ist sicher: Die Welt der Bilder wird nie mehr dieselbe sein. Und während wir über die beeindruckenden technischen Fortschritte staunen, müssen wir gleichzeitig lernen, mit ihren gesellschaftlichen Konsequenzen umzugehen.