IMG
SRC
ORG

 

 
 5

 

 

 5_3_7

5_3_7 Viper/GIFT (2000)
Oder: Der Mensch im Zentrum

a) Einleitung

Die «Viper-Gruppe» ist eine Forschungsgruppe an der Universität zu Genf, die sich mit dem Prozessieren und dem Verwalten multimedialer Daten auseinander setzt. Im Besonderen beschäftigt sich diese Gruppe mit der Organisation und dem «Retrieval» — dem Abfragen — dieser Daten.

[1] Stephane Marchand-Maillet: Bilder-Suche oder Führer durch die Datenbank, «Medien Kunst Netz», 2004

Bezüglich der Bildersuche gilt für das «Viper-Team»: «Wir wollen das Konzept von voll automatisierten Interpretationssystemen für visuelle Inhalte nicht ganz aufgeben. Vielmehr wollen wir sie praktikabler machen, indem wir die menschliche Interaktion mit einbeziehen, wann immer sie (vorübergehend) benötigt wird.»[1]

Die Entwickler von «Viper» legen bei der Entwicklung ihrer Software und Datenbestände ein großes Augenmerk darauf, dass keine «Grauzone» in dem Bestand der verwendeten Datenbanken entsteht. Eine Grauzone sind Daten, die aufgrund struktureller Gegebenheiten zu anderen Daten benachteiligt sind, also schwieriger abzufragen oder gar nicht zugänglich sind.

[2] Homepage des «GNU Image Finding Tool»

[3] Lasse Scherffig: It's in Your Eyes. Gaze-based Image Retrieval in Context, Karlsruhe 2005

Durch die Genfer «Viper-Gruppe» wurde auch das GNU Image Finding Tool («GIFT») entwickelt.[2] «GIFT» ist eine Open-Source-Software, die es ermöglicht Bilder nach ihrem Inhalt abzufragen. In der Medienkunst arbeitet zum Beispiel der «Eye Vision Bot» von Lasse Scherffig mit «GIFT».[3]


b) Beschreibung des Interfaces und Beobachtungen

Das Interface von «Viper» ist in schlichtem, «wissenschaftlichen» HTML gehalten. Eine Einflussnahme durch den Benutzer erfolgt durch Web-Elemente wie Submit-Buttons, Links und Drop-Down-Leisten. Die von CSS unberührten H1-Tags für Überschriften, «horizontal rulers» und der gekachelte Hintergrund zeugen vom wissenschaftlichen Ausgangspunkt der «Viper-Gruppe».

[4] Zu finden auf der VIPER-Homepage

Auf der Seite der «Viper-Gruppe» finden sich zwei Interfaces. Das erste ist in PHP realisiert, das zweite ist ein Java-Applet. Da PHP eine serverseitige Skript-Sprache ist, die Programme beim Laden einer Internet-Seite ausführen, ist das Benutzen des PHP-Interface von Viper[4] durch eine Benutzerführung über mehrere Seiten angelegt.


Viper Online Demo - Step 1
Anmeldeformular «Viper PHP Demo» der «Viper-Gruppe»


Viper Online Demo - Step 2
Auswahl des durch die «Viper PHP Demo» zu verwendenden Algorithmus

Nachdem man sich auf der ersten Seite anonym eingeloggt hat, kann man auf der nächsten Seite per Drop-Down-Menü den zu verwendenden Algorithmus, die zu durchsuchende Bildersammlung sowie die Anzahl der im Suchergebnis angezeigten Bilder auswählen. In der zweiten Zeile hat man die Möglichkeit, auf die Konfiguration des Such-Algorithmus Einfluß zu nehmen: Unter «Algorithm options» kann man den Schalter «Modify default configuration» auf «ja<» oder «nein» stellen. Am unteren Ende der Seite wird das Interface durch die Buttons «Random», «Query» und «Clear», die jeweils mit einem kurzen erläuternden Hinweis versehen sind, abgeschlossen.


Viper Online Demo - Results (Step 3)
«Viper PHP Demo»

Ein Klick auf «Random» zeigt nach dem Laden der nächsten Seite ein zufälliges Bilderset aus der Datenbank an. Unter jedem dieser Bilder kann man per Drop-Down-Box das Bild als «neutral», «relevant» oder «nicht relevant» markieren. Beim Klick auf «Query» werden neue Bilder geladen, die einem vorher als «relevant» markierten Bild ähneln (oder nicht, wenn das vorherige Bild als nicht relevant markiert wurde). Dieses Prozedere setzt sich fort, bis der Benutzer ein seinen eigenen Vorstellungen entsprechendes Bild gefunden hat.


c) Folgerungen und Kritik

«Die verbreitete Annahme, dass der User immer nach etwas Spezifischem sucht bzw. weiß, was er sucht, scheint nicht immer richtig zu sein.»[5]

[5] Bilder-Suche oder Führer durch die Datenbank, ebd.

[6] Bilder-Suche oder Führer durch die Datenbank, ebd.

Dieser Ansatz der «Viper-Gruppe» setzt daher den User ins Zentrum der Suche und betont die Vorgänge zwischen Mensch und Computer. Durch dieses schrittweise Spezifizieren von relevanten bzw. nicht relevanten Bildern durch den Benutzer ergibt sich ein Prozess mit «Gedächtnis», der alle bisherigen Benutzereingaben in das aktuelle Suchergebnis münden lässt. Der Mensch steht dabei im Mittelpunkt des Systems: «Unser Ansatz räumt dem User den zentralen Platz im System ein und rückt damit von der Forderung ab, dass die Interaktion zwischen Mensch und Computer im Mittelpunkt stehen sollte.»[6]

Das Interface thematisiert den Such-Algorithmus zwar über eine Auswahlbox — eine die algorithmische Wirkungsweise versinnbildliche Entsprechung sucht man im Interface selbst allerdings vergebens.

Der Benutzer kann zudem bei der hier vorgestellten Technologie generell nur auf bestehende Bilder zurückgreifen. Dieses Vorgehen setzt die «Hemmschwelle» zur Formulierung einer Suchanfrage sicherlich sehr herab, allerdings wird so auch eine personalisierte (und damit auf Seiten des Benutzers konkret nützliche) Suche damit unterbunden.

[5] Bilder-Suche oder Führer durch die Datenbank, ebd.

Die Verwaltung von visuellen Multimedia-Informationen wird von der «Viper-Gruppe» in einem Kontext gesehen, der «ohne Suchanfrage» auskommt. Nach Auffassung der Viper Gruppe sieht sich der User heute vor allem mit einer (großen) Anzahl an Multimedia-Daten konfrontiert. «Die Tools sollen dem User dabei behilflich sein, auf effektive Art und Weise einen umfassenden Überblick über den Inhalt dieser Datenbanken zu bekommen.»[5]

Der Ähnlichkeits-Algorithmus des «GIFT» benutzt jeweils die gesamte Bildoberfläche zur Suche nach ähnlichen Bildern. Damit unterbunden wird eine Suche eines Bildteils. Kann man mit «QBIC» noch eine Suchanfrage formulieren, die die Spezifizierung eines Bildbereichs ermöglicht, wird bei «Viper» die Suche stets auf die gesamte Bildfläche appliziert.

[6] Macromedia: Rich Internet Client

[7] The #1 AJAX Development Framework: Rich Internet Applications: «AJAX and Beyond»

Zudem kann man am Beispiel von Viper erkennen, dass Technologien wie die der «Rich Internet Applications» von Macromedia[6] oder das mit Javascript und der Schnittstelle «XMLHttpRequest» realisierte «AJAX»[7], die nicht bei jeder Anfrage an den Server eine komplette Seite neu laden müssen, durchaus ihre Vorzüge haben könnten. Besonders bei einer visuellen Bildersuche scheint dies der Fall zu sein, da Viper durchaus eine Minderung seiner Leistung durch diese Verzögerung erfährt.

[8] Die Java-Demo auf der VIPER-Homepage

Diese Beobachtung bestätigt sich, wenn man die PHP Version mit dem Java-Applet vergleicht[8]. Obwohl sich an der Struktur nichts geändert hat, wirkt die Benutzung dieser Variante viel komfortabler. Das Auswählen der Bilder nach relevant und nicht-relevant erfolgt hier durch einen Links- bzw. Rechtsklick und sofort nach der Auswahl der Bilder werden die Ergebnisse zur Suchanfrage angezeigt. Neue Technologien wie Flash mit Serverinteraktion oder «AJAX» erfahren einen Mehrwert im Bereich der visuellen Bildersuche, da mit ihnen eine schnellere Reaktion des Systems auf die Anfrage des menschlichen Benutzers gewährleistet werden kann.

 


 



 


 5_3_7

 

IMG
SRC