Repräsentative Befragungen

Repräsentativität durch Methoden-Mix – und das regionalisiert

Autor: Julia Kroth

Die Durchführung von repräsentativen Befragungen mit belastbaren Daten stellt eine große Herausforderung in der Markt- und Umfrageforschung dar. Idealerweise sollte eine Zufallsauswahl erfolgen, also jedes Element der Grundgesamt muss die gleiche Chance haben, in die Stichprobe zu gelangen. Bei Online-Befragungen kann dies nicht gewährleistet werden, da nur die Online-Bevölkerung Teil der Stichprobe werden kann, d. h. die Älteren sind z. B. unterrepräsentiert. Hingegen sind die nötigen sehr hohen Fallzahlen mit klassischen Erhebungen mit Zufallsstichprobe kaum zu finanzieren. Daher hat infas 360 gemeinsam mit dem infas Institut ein Gewichtungsverfahren – die sogenannte Blended Calibration – neu angewendet, bei dem die Vorteile aus beiden Methoden kombiniert und belastbare Befragungsergebnisse generiert werden. Anschließend erfolgt eine bevölkerungsrepräsentative Regionalisierung.

Methoden-Mix

Beim CASA Monitor, der online-repräsentativ regionalisierbaren Befragung von infas 360, handelt es sich um ein Non-Probability-Sample. Da die Wahrscheinlichkeiten, mit denen Befragungsteilnehmer aus der Grundgesamtheit ausgewählt werden, nicht bekannt sind, kann beim CASA Monitor nicht von einer Zufallsstichprobe gesprochen werden. Nun wird aber diese Befragungsmethode mit einem Probability-Sample kombiniert. Dabei handelt es sich um eine monatlich fortlaufende telefonische Befragung des infas Instituts, die auf einer ADM-Zufallsstichprobe basiert und bei der der Dual-Frame-Ansatz angewendet wird. Das Probability-Sample weist im Vergleich zum Non-Probability-Sample eine erheblich geringere Fallzahl auf.

Blended Calibration

Im ersten Schritt erfolgt eine sogenannte Designgewichtung, um die Auswahlwahrscheinlichkeit des kleineren Probability-Samples auszugleichen. Anhand bekannter Eckwerte aus dem Mikrozensus (sozioökonomisch und regionale Verteilung) erfolgt anschließend eine Kalibrierung. Dadurch wird die Verzerrung reduziert. Danach werden die beiden Stichproben zusammengeführt und das gemischte Blended Sample mit i. d. R. ca. 12.000 Befragten wird an den oben genannten Eckwerten kalibriert. Im dritten Schritt werden zusätzliche Merkmale herangezogen, die zwischen den beiden Samples erheblich variieren und somit im Idealfall die beiden Populationen voneinander abgrenzen (z. B. Nutzung von Festnetz, Mobiltelefon, Internet, Facebook, weitere Social Media Plattformen). Diese Merkmale werden nach der Gewichtung zwischen den beiden Samples verglichen. Zuletzt wird die Kalibrierung aus dem zweiten Schritt um die trennenden Merkmale erweitert. Dabei stammen die Soll-Verteilungen aus dem Probability-Sample. Im Ergebnis stehen repräsentative Daten je Bundesland zur Verfügung, wie die Karte der Impfabwägenden zeigt. Diese Anteile bilden wiederum die Basis für feinräumigere Regionalisierungen.

Regionalisierung

Die Online-Befragten geben freiwillig ihre Wohnadresse an, sodass diese geocodiert und mit mikrogeographischen Merkmalen aus der infas 360 Datenbank angereichert werden können. Diese beinhaltet Daten zu allen 23 Mio. Adressen in Deutschland sowie Informationen zu verschiedenen höheren räumlichen Ebenen, z. B. Siedlungsblock, Stadtteil, Gemeinde oder Kreis. Mit Hilfe von multivariaten Schätzmodellen werden die Ergebnisse anschließend bundesweit und flächendeckend auf alle 19 Mio. Adressen mit Privathaushalten übertragen. Die Schätzwerte können auf beliebige höhere Ebenen aggregiert werden. So wurden beispielsweise Homeoffice-Anteile für alle 401 Landkreise und kreisfreien Städte berechnet und an der erhobenen Homeoffice-Quote je Bundesland geeicht.

Vor- und Nachteile gegenüber Online-Befragungen

Das Non-Probability-Sample des CASA Monitors kann zwar eine Online-Repräsentativität erreichen, jedoch die Gesamtbevölkerung nicht vollständig repräsentativ widerspiegeln. Obwohl die Verzerrungen durch die Verknüpfung zur CASA Datenbank bekannt sind, erfordert eine rechnerische Behandlung dieser einen enormen Zeit- und Kostenaufwand. Die Vorteile von reinen Online-Befragungen liegen aber neben hohen Fallzahlen gerade in erheblichen Zeit- und Kostenersparnissen. Das hier beschriebene Verfahren kann hingegen einem wissenschaftlichen Anspruch genügen, indem es erwartungstreue Schätzer liefern und Befragungsdaten bevölkerungsrepräsentativ regionalisieren kann – mit hoher Fallzahl und bei vergleichsweise günstigen Konditionen. Durch die Kombination zweier Methoden können die Stärken von Probability- und Non-Probability-Samples optimal genutzt und Schwächen überwunden werden.

 

 

Feinräumige Kfz-Daten zeigen schwierigen Wachstumsmarkt E-Auto

Geht es nach der Politik, sollen 2030 bundesweit 15 Mio. E-Autos zugelassen sein. Bisher sind es nur ein Bruchteil davon…

Unterwegs im Wald: Mobilitätsdaten für besseres Forstmanagement

Im Wald, da ist schon wieder was los! Präzise Mobilitätsdaten von Waldbesuchern finden nun auch Anwendung bei den Niedersächsischen Landesforsten…

KFZ-Daten SUV, in Städten stark wie nie

Mit 29,6% stellt SUV wieder das stärkste Segment bei allen Neuzulassungen dar. Fast eine halbe Millionen Autos der limousinenartigen Geländewagen…

Send this to a friend