Der Kamera-Trainer
Wie Sicherheitskameras durch maschinelles Lernen freie Parkplätze erkennen
Sehen und verstehen – nach diesem Prinzip funktionieren intelligente Sicherheitskameras wie die Flexidome IP starlight 8000i Dome. Im Interview erklärt André-Luis Tournoux, ein Experte für Video Analytics, wie einfach das System funktioniert und welche neuen Möglichkeiten sich daraus ergeben.
Das intelligente, scharfe Auge
Wie bringt man einem Kind bei, wie ein Auto aussieht? Ganz einfach: indem man ihm ein Auto zeigt. Was sich beim Menschen bewährt hat, funktioniert jetzt auch bei Kameras – durch eine Software von Bosch namens Camera Trainer. Sie befähigt die Geräte zu maschinellem Lernen. Die Software lässt sich beispielsweise auf die Bosch-Sicherheitskamera Flexidome IP starlight 8000i Dome aufspielen und ermöglicht damit ganz neue Anwendungen. Bei der Flexidome-Kamera wurden grundlegende Funktionen verbessert: die Bildauflösung ist höher, die Lichtempfindlichkeit wurde optimiert und die Inbetriebnahme lässt sich nun bequem per Smartphone oder Tablet erledigen. Camera Trainer ist jedoch die größte Innovation, die in dem Gerät steckt. Warum? Das erzählt André-Luis Tournoux.
Herr Tournoux, was ist Camera Trainer?
Eine Software für maschinelles Lernen (ML), die direkt auf die Netzwerkkameras von Bosch gespielt werden kann. Die Kamera lässt sich dadurch auf die Erkennung von Objekten und Situationen „trainieren“. Erkennt die Kamera das festgelegte Szenario, führt sie in Echtzeit eine vordefinierte Aktion aus – zum Beispiel eine Zählung oder einen Alarm.
Wie trainiert man denn eine Kamera?
Wie bei vielen anderen Machine-Learning-Softwares werden auch hier Beispielbilder von den Objekten benötigt. Man zeigt der Software, welche Objekte oder Situationen relevant sind. Bei Camera Trainer reichen je nach Anwendung 25 bis 250 Bilder – und schon lernt die Software, wie beispielsweise ein Auto aussieht.
25
Beispielbilder können für die Erkennung eines Objekts mit Camera Trainer bereits ausreichen.
Was muss der Mensch dabei genau machen und was erledigt die Technologie?
In einem Softwareprogramm markieren die Nutzer relevante Dinge auf Bildern, indem sie ganz einfach mit der Maus ein Kästchen um sie ziehen. Das System merkt sich die Umrisse der Objekte und kann diese dann von allein erkennen. Man spricht hier von einem Positivbeispiel. Nach dem gleichen Muster werden Negativbeispiele erstellt. Das sind alle Dinge oder Hintergründe, bei denen es sich nicht um das relevante Objekt handelt.
Geben Sie uns bitte ein Anwendungsbeispiel.
Die Möglichkeiten der Technologie lassen sich auf verschiedene Situationen anwenden. Mit der Software kann eine Kamera zum Beispiel selbstständig erkennen, ob ein Parkplatz belegt ist oder nicht. Dazu markiert man auf Bildern Fahrzeuge als Positivbeispiele und freie Parkplätze als Negativbeispiele. Die Software lernt also, wie ein Auto aussieht und wie ein leerer Parkplatz aussieht. Anschließend kann sie beides voneinander unterscheiden. Das Ergebnis: Per Videokamera lässt sich automatisch ermitteln, wie viele freie Parkplätze es auf einer bestimmten Fläche gibt.
In drei Schritten zur Parkplatzkontrolle: So lernt Camera Trainer
Was ist das Besondere an dieser Lösung?
Es gibt da zwei Dinge. Erstens: Die intelligente Videoanalyse ist bereits jetzt sehr gut darin, bewegliche Objekte zu erkennen. Das entlastet Menschen – sie müssen nicht mehr die ganze Zeit auf einen Bildschirm starren und sich darauf konzentrieren, ob etwas passiert. Camera Trainer ermöglicht nun noch mehr Entlastung. Dank der Software lassen sich per Videoanalyse auch solche Objekte erkennen und beobachten, die sich nicht bewegen. So kann beispielsweise ermittelt werden, wie lange ein Auto auf einem Parkplatz steht.
Und zweitens?
Prinzipiell ist auf Sicherheitskameras wenig Rechenleistung vorhanden – dass man darauf Machine-Learning-Algorithmen laufen lässt, ist schon einzigartig. Die Technologie von Bosch schafft das, weil sich die vergleichsweise aufwendige Erkennung der Objekte und Hintergründe auf einem herkömmlichen Computer mit dem Camera Trainer-Konfigurator erledigen lässt und dann als schlankes Softwareprogramm auf die Kamera hochgeladen wird. Hier hat das große Know-how in unserem Unternehmen eine wichtige Rolle gespielt. Der Algorithmus wurde beispielsweise von der Abteilung Connected Mobility und Computer Vision aus dem Zentralbereich Forschung und Vorausentwicklung programmiert. Das Produktmanagement des Geschäftsbereichs Building Technologies stellte sicher, dass Camera Trainer sich in die Kamera integrieren lässt.
Welche Weiterentwicklung steht bei intelligenten Sicherheitskameras als nächstes an?
Die Sicherheitsbranche muss über die Art und Weise nachdenken, wie sie Lösungen für smarte Kameras entwickelt. Unsere neue Plattform INTEOX weist hier den Weg: Über sie können Programmierer individuelle Softwareanwendungen für die intelligente Videoanalyse anbieten. Das Betriebssystem von INTEOX basiert auf Android Open Source Project. Somit ist die Plattform für jeden offen, der Apps erstellen möchte. Diese können dann wie Camera Trainer auf Sicherheitskameras geladen werden – das Prinzip gleicht einem App-Store für Smartphones.
Im Fokus
André-Luis Tournoux
Video Analytics & Business Intelligence Developer bei Bosch Building Technologies
Ich sammle ständig neues Wissen über IT und technische Innovationen.
Für André-Luis Tournoux ist die Welt ein Dorf. Der Franzose studierte in Brasilien und Frankreich angewandte Mathematik, Computerphysik und Finanzlehre und arbeitete bereits im Bereich Management und IT-Entwicklung, ehe er 2017 zu Bosch in die Niederlande wechselte. Wenn er nicht gerade arbeitet, treibt er Wassersport und bereist die Erde – in 60 Ländern war er schon.