Deep Learning Abenteuer: Das Land von IoT

cloud-adoption-strategyBig data und Informationen: Maschinen werden zunehmend mit verschiedenen Arten von Sensoren ausgestattet. Diese Sensorinformationen sind das Herzstück der IoT-Revolution, in der wir uns befinden. Eine einfache Maschine kann Hunderte von Sensoren haben, und die komplexesten haben Zehntausende von ihnen. Stellen Sie sich das Volumen, die Geschwindigkeit und die Vielfalt der Daten vor, die in einem Geschäft von diesen Sensoren kommen. An dieser Stelle müssen große Datenmengen sofort in den Sinn kommen. Das Sammeln von Informationen von diesen Tausenden von Sensoren ist eine Sache, das Verstehen ist eine ganz andere. Wir sind sicher in einer großen Datensituation und Ihr Big Data Typ wird loT, Hadoop und Spark in das Problem werfen. Aber würde dies zu einer gewissen Einsicht führen? Würde dies zu einer Entdeckung oder einem konkreten Return on Investment führen?

Big intelligence

Informationen müssen verstanden werden, und das ist das Problem, bei dem AI eingreift und den Tag rettet. Das Verständnis der Informationen ist ein erheblicher Aufwand, insbesondere wenn wir unsere Investitionen in eine komplexe Dateninfrastruktur lohnenswert machen wollen.

Bei Nagarro hatten wir kürzlich die Möglichkeit, einem Kunden bei etwas Ähnlichem zu helfen. Wir wurden gebeten, fast ein Terabyte an Daten (ja, keine Übertreibung!) zu betrachten, die in Form von etwa 500 Sensoren auftraten, die 500 Zahlen (aller Art positive, negative Zahlen mit bis zu 15 signifikanten Ziffern) einmal pro Millisekunde ausspuckten. Der Kunde wollte auch einen rein mathematischen Ansatz zur Lösung des Problems und wollte kein spezielles Wissen über die Sensoren in irgendeiner Weise nutzen, um dieses Verständnis zu erleichtern.

image-1-1

Analysieren der eingehenden Streaming-Werte und Entdecken der verschiedenen Zustände, in denen sich die Maschine zu einem bestimmten Zeitpunkt befindet

Die Kunst der Datenwissenschaft

Es gibt verschiedene Ansätze zur Lösung eines solchen Problems und unser Deep Learning CoE (Center of Excellence) war begeistert, die Chance zu bekommen, sich mit einem solchen Problem zu beschäftigen.

Schritt 1: Der erste Schritt bestand darin, zu versuchen zu verstehen, welche Art von Werten jeder dieser 500 Sensoren repräsentiert. Dabei griff man unabhängig voneinander tiefer in jedes der Sensorsignale ein. Der Fachbegriff dafür ist die univariate Analyse. Interessanterweise kann die univariate Analyse, wenn sie richtig durchgeführt wird, viel von dem aufdecken, was besonders in den Fällen vor sich geht, in denen die Signale eine relativ einfache Maschine darstellen. In unserem speziellen Fall hatten wir jedoch 500 Sensoren und Datensignale von verschiedenen Sensoren, die sich auf nichtlineare Weise überlappen und zu extrem komplexen Zuständen führen. Sensorsignale haben eine Form.

image-2

Jedes Signal hat eine Form, die die Natur des Signals erklärte

Die Machine Learning Wissenschaft

Schritt 2: Nun war es an der Zeit, diese Sensorsignale in Clustern oder Gruppen zu betrachten. Signale bewegen sich auf unterschiedliche Weise miteinander. Die gemeinsame Erforschung ihrer Bewegung ist das Thema der multivariaten Analyse. Die multivariate Analyse bietet eine Reihe von Techniken, um die verfügbaren Daten in verschiedenen Verteilungen zu modellieren. Basierend auf diesen Verteilungen können Daten in verschiedene Cluster oder Gruppen unterteilt werden. Wir verwenden diese Technik, um normale Daten von anormalen Daten zu isolieren. Es ist eine komplexere Analyse, die existiert und von uns verlangt, Techniken wie Gaußsche Gemischanalyse, Dimensionsreduktion, Anomalieerkennung, Neuheitsdetektionsalgorithmen, etc. zu verwenden. Hier ging es darum, eine Gruppe wichtiger Signale zu entdecken und damit den Zustand der Maschine vorherzusagen. Wir haben diese Techniken angewendet und interessante Gruppenstrukturen in diesen Signalen gefunden. Als der Maschinenzustand bekannt wurde, konnten wir tiefer in die Daten sehen.

Deep neural networks

Schritt 3: Die multivariate Analyse ist wirklich hilfreich, aber wir hatten gehofft, tiefere Erkenntnisse aus tiefen neuronalen Netzen zu gewinnen. Neuronale Netze sind erfolgreich bei der Lösung vieler Probleme im Bereich der industriellen Bildverarbeitung, der Sprache, der natürlichen Sprachverarbeitung usw. tätig. Neuronale Netzwerkarchitekturen sind jedoch in der Regel komplex und erfordern große Anstrengungen, um sie darin zu trainieren, zugrunde liegende Muster zu entdecken. Das ist es, was unser Deep Learning CoE für den Lebensunterhalt tut. Lernen Sie, wie man neuronale Netze baut und trainieren Sie sie für verschiedene Arten von Aufgaben. Wir haben neuronale Netze trainiert, um 1000 verschiedene Objekte in Bildern zu erkennen und verschiedene Krankheitsstadien in einem Scan zu identifizieren. Diese neuronalen Netze können auch menschliche Emotionen und Empfindungen verstehen.

image-3

Dichte und konvolutionäre neuronale Netzwerke zur Darstellung räumlicher Strukturmuster

Eine interessante Eigenschaft neuronaler Netze ist, dass sie die wichtigen Dinge, auf die sie in den Daten achten müssen, selbst entdecken. Sie müssen nicht gelehrt werden, was die wichtigen Signale sind und was nicht. Das ist eine große Sache. Zumal dies die Pferdearbeit ist, die wir im univariaten und multivariaten maschinellen Lernen leisten. Wir müssen mit unseren mathematischen Intuitionen herausfinden, welche Signale zu beachten und welche zu ignorieren sind. Ein neuronales Netzwerk überrascht uns, indem es diese Entdeckung selbst macht. Und es ist erstaunlich, die Entdeckungen zu sehen, die es jedes Mal macht.

image-4

Wiederkehrende neurale Netzwerke

Wir bauen einige sehr komplexe und sehr tiefe neuronale Netze - mit Dutzenden von Schichten von Neuronen. Wir verwendeten wiederkehrende neuronale Netze in einigen sehr interessanten Kombinationen, um die strukturellen und zeitlichen Muster aufzudecken, die tief in den Terabytes der Daten lagen. Wir haben schließlich das wesentliche Muster in den Daten offenbart und es sah wunderschön aus.

Wunderschöne Muster

Das Ergebnis ist schön, und es wird vollständig von den neuronalen Netzwerken entdeckt, die wir aufgebaut haben. Der Herzschlag der Maschine, der uns viele Dinge sagt, die mit der Maschine passieren. Es sagt uns, wann die Maschine im Leerlauf ist, wenn sie langsam arbeitet, wenn sie schnell arbeitet, wenn sie sich fast am Rande eines Abgrunds befindet, wenn sie umfällt, wenn sie eine Wartungspause einlegt und so weiter. Wenn wir uns die Muster ansehen, können wir erkennen, ob es ein Montag, Dienstag oder Freitag ist. Wir können dies tun, weil die Maschine dem Regime des Montagebodens folgt und so die Muster beginnen, alles zu reflektieren. Alle Arten von strukturellen und zeitlichen Mustern zeigen sich plötzlich.

Die Mathematik funktioniert, und der Maschinenzustand ist nun aus den Daten, die die Maschinensensoren ausgeben, extrem vorhersehbar. Unsere Lösung ist ein Deep-Learning-Modell, das kontinuierlich lernt, wie es vorhergesagt wird, und einen Lebenszyklus hat, der dynamisch und einsatzbereit ist.

Tiefe Musterentdeckungen können dazu führen, dass Plattformen für seriöse Automatisierung und prädiktive Analytik aufgebaut werden. Tiefe Muster können die Grundlage für viele interessante Tooling-, Messaging-, Vorhersage- und Wartungsplattformen sein.

Tiefes Lernen ist hier angesagt und wird in den kommenden Jahren zu interessanten Durchbrüchen führen. Wir freuen uns sehr, die Möglichkeit zu haben, das tiefe Lernen in Nagarro zu fördern. Für eine detailliertere Diskussion über unsere obige Lösung können Sie uns gerne unter info@nagarro.com erreichen.