Autor: Michael Herter
Predictive Risk Analytics
Von der Wahrscheinlichkeit, dass etwas passieren wird.
Predictive Analytics dient dazu, mithilfe von (möglichst vielen) Daten und statistischen Algorithmen das Eintreffen zukünftiger Ereignisse auf der Grundlage historischer Geschehnisse zu prognostizieren. Über Machine Learning lässt sich die Vorhersagequalität der Analyse stetig verbessern. Predicitve Risk Analytics versucht über eine Gefahrenvorhersage mögliche Risiken (auch die, die damit einhergehen) zu minimieren.
Predictive Analytics und die Bedeutung von Daten
Bei der Predictive Analytics spielen grundsätzlich alle Daten eine tragende Rolle. Und darin besteht auch die eigentliche Herausforderung: Genau die Variablen für ein prädiktives Modell zu finden, die für das Eintreffen eines bestimmten Ereignisses relevant sind. Dabei gibt es Daten, die
- direkt mit den (vergangenen) Ereignissen zu tun haben oder
- indirekt damit in Verbindung stehen.
Man kann auch sagen, dass es sich unter Punkt 1 um die offensichtlichen Merkmale zur Beschreibung eines Ereignisses handelt und unter Punkt 2 um die versteckten Merkmale.
Dazu ein Beispiel: Es soll die zukünftige Kursentwicklung eines an der Börse notierten Unternehmens vorausgesagt werden.
- Zu Daten der Gruppe 1 zählen etwa der Kursverlauf selbst, die Börsenperformance gesamt, Veröffentlichungen, Ad-Hoc-Nachrichten zu Umsatz und Ertrag, usw.
- Zu Daten der Gruppe 2 gehören potenzielle Einflussfaktoren des Kurses oder des Unternehmens. Das können die unterschiedlichsten Informationen sein (z.B. Zulieferketten, Digitalisierungsrate, Altersstruktur, Frauenanteil, Hobbys der Manager usw.). Diese Parameter sind häufig (zunächst) nicht offensichtlich.
In Zeiten von Big Data wächst die Bedeutung der indirekten, nicht offensichtlichen Daten, wozu auch beispielsweise Nachbarschaftsbeziehungen gehören, die in Geodaten versteckt liegen.
Kriminaldelikte von morgen vorhersagen
Predicitve Policing oder auch vorhersagende Polizeiarbeit genannt, folgt der Auffassung, dass (sich wiederholende) Kriminaldelikte einem Muster folgen und dass dieses Muster (Wer, Wen, Wann, Wo und Warum) anhand statistischer Daten beschrieben und analysiert werden kann. Ein Verbrechen, so willkürlich es auch aussehen mag, steht immer in einem Gesamtkontext. Vor allem (Big) Data kann dabei unterstützen, diesen Kontext besser (statistisch) zu erkennen und zu verstehen. Mithilfe entsprechender Modelle kann dann mit einer bestimmten Wahrscheinlichkeit ein weiteres Verbrechen (bzw. dessen Ort, Art, Opfertyp, Zeitpunkt usw.) vorhergesagt werden.
Der Unterschiede zwischen Vorhersage und Prognose
Eine interessante Unterscheidung zwischen Vorhersage und Prognose machen übrigens die Seismographen. N. Silver bezeichnet in seinem Buch „Berechnung der Zukunft“ eine Prediction als den Versuch, für ein zukünftiges Geschehen (Erdbeben) einen konkreten Zeitpunkt (und Ort) vorherzusagen. Ein Forecast dagegen bezieht sich auf Vorhersagen für einen längeren Zeitraum. Statistisch gesehen ist das Modell der genauen Orts- und Zeitbestimmung (Prediction) immer einer höheren Fehlerquote ausgesetzt.