IMG
SRC
ORG

 

 
 5

 

 

 5_2_4

5_2_4 Schritt Drei: Segmentierung
Oder: Erkennung nicht-semantischer Bildbereiche

Unter «Segmentierung» versteht man die Unterteilung der digitalen Bildfläche nach unterschiedlichen algorithmischen Kriterien und stellt sich so einem zentralen Problem der «Computer Vision» — dem Erkennen von Objekten vor einem Hintergrund. Dazu werden zur Zeit hauptsächlich drei Methoden eingesetzt: die schwellen-basierte («Threshold-based»), die kanten-basierte («Edge-based») und die bereich-basierte Technik («Region-based technique»).

[1] Robert M. Haralick: Texture features for image classification. IEEE Transactions on Systems, Man, and Cybernetics, SMC, Ausgabe 3 (6), New York 1973, S. 610 ff.

Die «Threshold technique» unterscheidet die Bildbereiche nach den Farbwerten der Pixel und ist demnach geeignet, wenn sich die abgebildeten Objekte auf dem Bild stark gegeneinander abzeichnen. Um dies zu erreichen wird der Wert jedes Pixels zu den Werten der anderen Pixel in seiner Umgebung in Beziehung gesetzt. Die Kriterien der Unterscheidung einzelner Pixel werden auf die gewünschte Differenzierung angepasst. Erfüllt ein Pixel die Kriterien seiner Nachbarn, wird dieselbe Kennung zugewiesen. Besitzen einige beieinanderliegende Pixel beispielsweise einen ähnlichen Rot-Anteil, handelt es sich mit hoher Wahrscheinlichkeit um einen Bereich. Pixel, die nicht auf diese Kriterien passen, wird eine andere Kennung zugewiesen.[1] Diese Kennung ermöglicht es nun, das Bild in verschiedene «homogene» Bereiche aufzuteilen. Unscharfe Objekte bereiten dieser Technik allerdings Probleme.

[2] T. Asano, D. Chen, N. Katoh, T. Tokuyama: Polynomial-time solutions to image segmentation, Proceedings of the 7th Ann. SIAM-ACM Conference on Discrete Algorithms (Jan. 1996), S. 104 ff.

Die «Edge-based Method» erkennt Konturen nach Kantenfiltern. Diese Filter subtrahieren meist das Ziel-Bild von einer weichgezeichneten Version desselben Bildes und erkennen durch die Differenz die Kanten zwischen zwei Farbflächen. Diese Methode ziegt besonders Schwächen, die erkannten Konturen zu einer (geschlossenen) Linie und damit einer weiter prozessierbaren Form zu verbinden.[2]

Die Stärke der «Region-based Method» ist das Zusammenspiel verschiedener Methoden: «A region-based method usually proceeds as follows: the image is partitioned into connected regions by grouping neighboring pixels of similar intensity levels. Adjacent regions are then merged under some criterion involving perhaps homogeneity or sharpness of region boundaries.»[3]


An image source (= IMG SRC) of IMG_SRC (= Image Source) the main program of IMG SRC ORG the visual image search :)
Diese Segmentierung des ersten Bildes im World Wide Web wurde durch das Modul «IMG_SRC» von «Sourcerer» durch ein Vergleichen der einzelnen Pixel durch die «Threshold Technique» erreicht — besitzt ein Pixel eine ähnliche Farbe wie seine Nachbarn, wird dieselbe Kennung zugewiesen.

Wie man sieht, bedeutet diese Segmentierung jedoch nicht, dass diese oberflächlich unterschiedlichen Bereiche auch semantisch zu unterscheiden sind.


 



 


 5_2_4

 

IMG
SRC