Bilderkennung mit KI

08.04.2025
von Andreas Erle

Eine normale Suche beinhaltet bisher fast immer einen Suchbegriff in Form eines geschriebenen Textes. Manchmal habt ihr aber ein Bild oder eine Grafik, die ihr erklärt haben wollt. Oder seht ein Bild, könnt den Inhalt aber nicht zuordnen. Ob es sich nun um eine Person oder einen Gegenstand handelt, die KI kann euch hier helfen. Zwei Beispiele:

Google Lens

Auch Google selbst hat erkannt, dass die Suche nach Bildern für viele Anwender eine Funktion ist, die sie  vermehrt verwenden. Daher gibt es mit Google Lens eine eigene Bildersuche in der Google App.

  • Öffnet die Google-App oder die Google-Suche im Internet. Dort findet ihr neben dem Eingabefeld ein Symbol mit einer kleinen Kamera. Klickt dieses an.
  • Zieht nun das Bild, das ihr analysiert haben wollt, in den Detailbereich des sich öffnenden Fensters. Alternativ könnt ihr auch auf dem Smartphone auf eure Bild-Mediathek zugreifen und ein Bild davon auswählen.   
  • Google sucht nun das Bild aus dem Internet heraus und analysiert es. Nach der Analyse bekommt ihr zugehörige Bilder angezeigt, beispielsweise also die derselben Person, angezeigt.
  • Google Lens kann aber noch viel mehr: Beispielsweise erkennt die KI fremdsprachige Texte und übersetzt diese direkt im Bild auf Deutsch. Ohne, dass ihr sie manuell identifizieren oder markieren müsst.
  • Erkennt Lens Waren, dann sucht die KI automatisch nach Quellen dafür und bietet euch die Links direkt im Suchergebnis an. Shopping leicht gemacht!
image

Perplexity und ChatGPT als Bildersuche

Die meisten Chatbots bieten die Möglichkeit, ein Bild als Eingabe ins Chatfenster zu ziehen und dieses dann analysieren zu lassen. Entweder automatisch oder unterstützt durch Sprachprompts.

  • Bei Perplexity beispielsweise zieht das Bild einfach in das Eingabefeld des Chatfensters.
  • Perplexity nimmt das Bild jetzt als Grundlage für die weiteren Prompts. Fragt zum Beispiel Wer ist das?, um die Person identifizieren zu lassen und weitere Informationen aus verschiedenen Quellen  zu bekommen.
  • Wollt ihr die Person kontaktieren? Dann fragt einfach Wie kann man ihn kontaktieren?
image
  • Ihr wollt wissen, wann ihr die Person das nächste Mal live erleben könnt? Dann fragt einfach danach, beispielsweise Wann findet sein nächster Vortrag statt?
  • Genauso könnt ihr bei einem Objekt fragen Was ist das? und bekommt nach der Analyse des Bildes sowohl eine Erklärung als auch viele Links zu anderen Quellen zum identifizierten Objekt angezeigt.

ChatGPT mit seiner Komponente ChatGPT Vision geht sogar noch ein wenig automatischer vor:

  • Zieht das Bild in das Chatfenster von ChatGPT.
  • ChatGPT startet sofort die Analyse der Inhalte und stellt euch dann einen bunten Strauß von Informationen zusammen: Was stellt es dar, wo kann man es finden?
  • Natürlich könnt ihr danach über Prompts auch eure eigenen Fragen zum Bild eingeben.