Anomaly Detection – Methoden, Bewertung & Anwendungsfälle

Dieser Kurs beinhaltet

4 Stunden komprimiertes Material

Beispiele aus der Praxis

Kursdetails

Lernzeit	ca. 4 Stunden
Zielpublikum
Format	Dies ist ein Online-Kurs zum Selbststudium. Du kannst den Kurs unterbrechen und in Deinem eigenen Tempo weiterlernen. Das Angebot umfasst einen videobasierten Kurs mit interaktiven Aktivitäten und Testfragen zur Überprüfung des eigenen Wissens.

Nach Abschluss des Kurses wirst du in der Lage sein:

die Leistungsfähigkeit verschiedener Algorithmen zur Anomalieerkennung zu bewerten und zu vergleichen

die effektivsten Methoden für bestimmte Anwendungsbereiche zu ermitteln.

Syllabus

Einführung in die Anomalieerkennung

In diesem Modul beschäftigen wir uns eingehend mit der Anomalieerkennung und ihren praktischen Anwendungen. Gemeinsam werden wir die Herausforderungen und die verschiedenen Arten von Anomalien untersuchen. Anschließend diskutieren wir das Kontaminations-Framework und schließen mit der Vorstellung von Bewertungsmetriken, die speziell auf die Anomalieerkennung zugeschnitten sind, wobei wir auch das Problem der Klassenungleichgewichte behandeln.

Anomalieerkennung durch Dichteabschätzung und Robustheit

In diesem Modul konzentrieren wir uns auf die Kernel-Dichteabschätzung (KDE) als generisches Beispiel für eine Methode zur Dichteabschätzung. Wenn die Trainingsdaten möglicherweise unerkannte Anomalien enthalten, ist Robustheit eine wichtige Eigenschaft des Abschätzungsverfahrens. Aus diesem Grund werden wir uns mit robusten KDE-Varianten befassen und diese auf einen realen Datensatz mit falsch beschrifteten Daten anwenden.

Anomalieerkennung durch Isolation

In diesem Modul lernen wir einen baumbasierten Ansatz zur Anomalieerkennung kennen: den Isolation-Forest-Algorithmus. Er basiert auf der Annahme, dass Anomalien selten und isoliert auftreten. Er hat in den letzten Jahren viel Aufmerksamkeit auf sich gezogen und gilt als modernster Algorithmus zur Anomalieerkennung mit hervorragender Leistung in einer Vielzahl von Benchmarks. Wir verwenden den Isolation Forest zur Erkennung von Netzwerkintrusionen im KDD99-Datensatz.

Anomalieerkennung über Rekonstruktionsfehler

Die Anomalieerkennung ist besonders schwierig, wenn es sich um hochdimensionale Daten handelt. Die zuvor vorgestellten Methoden leiden unter dem Fluch der Dimensionalität und verlieren in der Regel schnell an Leistungsfähigkeit, sobald die Dimension über einige Dutzend hinausgeht. In diesem Video lernen wir Autoencoder kennen, mit denen Anomalien erkannt werden können, indem der Rekonstruktionsfehler der Originaldaten mit dem Rekonstruktionsfehler der anomalen Daten verglichen wird. Wir wenden Autoencoder auf den MNIST-Datensatz an, um beschädigte Bilder zu erkennen.

Anomalieerkennung in Zeitreihen

In diesem Modul werden wir die Herausforderungen der Anomalieerkennung in Zeitreihen diskutieren und einige Hintergrundinformationen zur Zeitreihenanalyse geben, die für die Anomalieerkennung nützlich sind. Anschließend stellen wir das SARIMA-Modell als einfaches Prognosemodell vor, das zur Erkennung von Anomalien in Zeitreihen verwendet werden kann. Abschließend wenden wir das SARIMA-Modell auf den New Yorker Taxidatensatz an, um Anomalien in der Anzahl der Taxifahrten zu erkennen.

Extremwerttheorie zur Anomalieerkennung

In diesem Modul stellen wir die Extremwerttheorie (EVT) als Methode zur Ermittlung von Schwellenwerten für die Anomalieerkennung vor. Die EVT basiert auf der Annahme, dass die Werte anomaler Punkte deutlich höher sind als die Werte nominaler Punkte. Sie schätzt den Randbereich der Wertverteilung und nutzt diesen, um einen probabilistisch interpretierbaren Schwellenwert zu ermitteln. Wir wenden die EVT auf den New Yorker Taxidatensatz an, um einen Schwellenwert für die Erkennung von Anomalien in der Anzahl der Taxifahrten zu ermitteln.

Bereit, loszulegen?Starte hier den Kurs

Kurs starten

Creative Commons 4.0

Unsere Inhalte, die unter der Creative Commons Attribution 4.0 International License (CC BY 4.0) zur Verfügung stehen, können frei geteilt, angepasst und für kommerzielle Zwecke verwendet, wenn sie mit der korrekten Angabe "appliedAI Institute for Europe gGmbH" versehen werden. Wir bieten SCORM und Articulate Storyline Dateien zur einfachen Integration in Learning Management Systeme (LMS) oder Bildungswebseiten/persönliche Projekte. Articulate-Dateien sind vollständig editierbar, so dass Du die Inhalte nach Bedarf anpassen kannst. Darüber hinaus hast Du auch Zugang zu allen MP4-Videodateien.

KI Ressourcen

Mitmachen

KI Ressourcen

Mitmachen

TransferLab:Practical Anomaly Detection

Dieser Kurs beinhaltet

Kursdetails

Syllabus

Bereit, loszulegen?Starte hier den Kurs