chevron_left
chevron_right

Maschinelles Lernen zur Problemlösung

Über Künstliche Neuronale Netzwerke wird gegenwärtig sehr viel geschrieben und aktiv geforscht. Obschon die zugrundeliegende Theorie aus den 1940er-Jahren stammt, begann der grosse Aufschwung dank immer leistungsfähigeren Prozessoren erst vor wenigen Jahren. Inzwischen haben Neuronale Netze auch den Weg in die Industrie gefunden.

Innerhalb der sogenannten Künstliche Intelligenz nimmt das Maschinelle Lernen eine Schlüsselfunktion ein und löst Probleme, für welche rein algorithmische Verfahren zu komplex wären. Im Gegensatz zum klassisch programmierten Algorithmus werden beim Maschinellen Lernen die Instruktionen nicht vom Programmierer in Quellcode umgesetzt, sondern es wird beispielsweise ein Neuronales Netz verwendet oder entworfen, das in der Lage ist, eine Problemlösung zu «lernen». Das wird an einem einfachen Beispiel erläutert: Es soll zuerst automatisch festgestellt werden, ob ein gegebenes Bild ein Fahrzeug (PW, LKW) zeigt; wenn ja, so soll zweitens der Ort ermittelt werden, wo sich das Nummernschild des Fahrzeugs befindet; und schliesslich soll der Text auf dem Kennzeichen identifiziert werden.

 

Grosse Mengen an Trainingsdaten

Um die erste Teilaufgabe zu lösen, verwendet Stettbacher Signal Processing AG (SSP) ein vortrainiertes Netz. Derartige Netze, welche die Lösung verschiedener Aufgaben schon erlernt haben, und die beispielsweise auf Fotos Menschen, Haustiere, oder eben Fahrzeuge erkennen können, sind frei verfügbar. Freilich ist die Qualität und die Zuverlässigkeit dieser Netze anhand von eigenen Daten (Bildern) zu prüfen. Falls nun ein Fahrzeug im Foto erkannt wurde, so gilt es, dessen Nummernschild zu lokalisieren. Für diese zweite Teilaufgabe hat SSP ein eigenes Netz trainiert. Dazu musste zuerst eine grosse Menge von Fotos als Trainingsdaten aufgenommen oder gesammelt werden. Die Bilder enthalten Nummernschilder aus unterschiedlichen Perspektiven und bei diversen Lichtverhältnissen. Da die Geometrie, Farbe und Erscheinung von Fahrzeugkennzeichen verhältnismässig uniform sind, waren nur wenige hundert Bilder notwendig. Andere Fälle verlangen tausende oder mehr Datensätze. Entsprechend rechenaufwendig ist dann das Training. Es wird üblicherweise auf speziell ausgerüsteteten Computern durchgeführt. Das so von SSP trainierte Netzwerk ortet und erkennt Nummernschilder zuverlässig. Schliesslich bleibt als dritter und letzter Schritt noch das Lesen des Kennzeichens: Dafür wird ein weiteres vortrainiertes Netzwerk verwendet, das Texte in Bildern identifizieren kann. Ihm wird der Bildausschnitt mit dem zuvor entzerrten Nummernschild übergeben. Die Aufgabe ist somit gelöst.

 

pdf Downloaden um den ganzen Artikel lesen oder im E-Paper lesen https://epaper.polyscope.ch/reader/?/ED7444D5F/