IMG
SRC
ORG

 

 
 5

 

 

 5_2_1

5_2_1 Content-based Image Retrieval
Oder: Inhaltsbasierte Bilder-Suche

«Digital visual information is here to stay.»

— Michael S. Lew[1]

 

Wie das letzte Kapitel zeigte, sind Bilder im World Wide Web über Text (Metadaten, «tags», Dateinamen und den Kontext, in dem sie auf einer Web Site platziert sind) eingebunden. Über diese Texte sind sie adressierbar und durch die so in dem Text-Medium Web entstehende Pseudo-Semantik durch Vergleiche auch von Suchmaschinen auffindbar.

[1] Michael S. Lew im Vorwort zu Principles of Visual Information Retrieval, London 2001, S. VII

Die Digitalisierung großer Bildarchive und das Wachstum des World Wide Web haben in letzter Zeit die Bemühungen der Forschung nach einer Bilder-Suche, die über eine Adressierung durch Text hinausgeht, gesteigert. Viele Forschungen streben heute eine Suchmöglichkeit für Bilder an, die deren Inhalt in die Suche miteinbezieht. Diese inhaltsbasierte Suche wird als «Content-based Image Retrieval» bezeichnet.

[2] Toshikazu Kato: Database architecture for content-based image retrieval, in: SPIE Conference on Image Storage and Retrieval Systems, Nummer 1662, 1992 (Registrierung erforderlich)

[3] CBIR wird auch mitunter als CBVIR (Content-based Visual Information Retrieval) bezeichnet.

Der Begriff des «CBIR» wurde erstmals 1992 von Toshikazu Kato in «Database architecture for content-based image retrieval»[2] geprägt und steht der gewohnten Suche nach Text entgegen, da sie primär mit visuellen Kriterien arbeiten soll.

Der potenzielle Markt des angewandten Content-based Image Retrieval[3] wird ersichtlich, führt man sich die vielen möglichen Aufgabengebiete vor Augen: in medizinischen oder geographischen Datenbanken könnten mit «CBIR» nicht nur schlagwortartige, sondern auch Anfragen nach visuellen Kriterien formuliert werden, Bilder in Galerien stünden nicht mehr nur nach Epoche und Künstler zur Verfügung; aber auch polizeiliche Ermittlungen könnten beschleunigt und die Ahndung des Missbrauchs geistigen Eigentums und die Verfolgung strafbarer Benutzung von Trademarks erleichtert werden.

Zur Abfrage aktueller Bilddatenbanken mit «CBIR-System» haben sich inzwischen folgende Techniken etabliert: «Query By Example» (QBE), «Query by Sketch» und die «Mosaic-Suche». Alle Techniken können auch nach der gleichnamigen Software von IBM als «Query by Image Content» bezeichnet werden. Unter «Query By Example» versteht man die Suche als direkter Bildvergleich. Meistens kann per Upload ein eigenes Bild in die «CBIR-Software» eingefügt werden. Dieses Bild dient der Software dann als Ausgangspunkt zur Suche nach ähnlichen Bildern. Die skizzierte Suchanfrage oder «Query By Sketch» ermöglicht es dem Benutzer, eine eigene Skizze anzufertigen, nach der ähnliche Bilder gesucht werden.

[4] Carlo Colombo und Alberto del Bimbo: Visible Image Retrieval, in: Vittorio Castelli und Lawrence D. Bergman (Hg.): Image Databases – Search and Retrieval of Digital Imagery, New York 1996, S. 11

[5] Dirk Lewandowski: Web Information Retrieval, Frankfurt am Main 2005, s. das Kapitel «Das Invisible Web»

[6] Die erste ähnlichkeitsbasierte Suche im WWW: Altavista Photo Finder — damals powered by Virage Image Engine

In den letzten zwei Jahrzehnten intensiver Forschung wurde das «CBIR» besonders zur medizinischen Diagnose und zur Strafverfolgung etabliert. Eine umfassende Auswirkung dieser Technologie zeichnet sich zur Zeit gesellschaftlich erst ab. Besonders die Suche im World Wide Web nach ähnlichen Bildern wird von den Informatikern Carlo Colombo und Alberto del Bimbo als bahnbrechende Neuerung verstanden,[4] erweitert diese Methode doch das indizierbare und ersuchbare Netz um riesige visuelle Datenbestände des bisher «Truly Invisble Web.»[5]

Doch einige visuelle Suchtechnologien wie die ähnlichkeitsbasierte Suchen von AltaVista und «Virage»[6] haben sich bereits vor Jahren aus das Weiten des World Wide Web zurückgezogen. «QBIC» fristet auf der Homepage der Eremitage St. Petersburg zwar ein renommiertes aber peripheres Dasein, und die Formeln und Methoden von «Retrivr» hätte bereits vor einem Jahrzehnt in ein größeres Projekt umgewandelt werden können.


 



 


 5_2_1

 

IMG
SRC