Autor: Julia Kroth
Repräsentative Befragungen
Repräsentativität durch Methoden-Mix – und das regionalisiert
Die Durchführung von repräsentativen Befragungen mit belastbaren Daten stellt eine große Herausforderung in der Markt- und Umfrageforschung dar. Idealerweise sollte eine Zufallsauswahl erfolgen, also jedes Element der Grundgesamt muss die gleiche Chance haben, in die Stichprobe zu gelangen. Bei Online-Befragungen kann dies nicht gewährleistet werden, da nur die Online-Bevölkerung Teil der Stichprobe werden kann, d. h. die Älteren sind z. B. unterrepräsentiert. Hingegen sind die nötigen sehr hohen Fallzahlen mit klassischen Erhebungen mit Zufallsstichprobe kaum zu finanzieren. Daher hat infas 360 gemeinsam mit dem infas Institut ein Gewichtungsverfahren – die sogenannte Blended Calibration – neu angewendet, bei dem die Vorteile aus beiden Methoden kombiniert und belastbare Befragungsergebnisse generiert werden. Anschließend erfolgt eine bevölkerungsrepräsentative Regionalisierung.
Methoden-Mix
Beim CASA Monitor, der online-repräsentativ regionalisierbaren Befragung von infas 360, handelt es sich um ein Non-Probability-Sample. Da die Wahrscheinlichkeiten, mit denen Befragungsteilnehmer aus der Grundgesamtheit ausgewählt werden, nicht bekannt sind, kann beim CASA Monitor nicht von einer Zufallsstichprobe gesprochen werden. Nun wird aber diese Befragungsmethode mit einem Probability-Sample kombiniert. Dabei handelt es sich um eine monatlich fortlaufende telefonische Befragung des infas Instituts, die auf einer ADM-Zufallsstichprobe basiert und bei der der Dual-Frame-Ansatz angewendet wird. Das Probability-Sample weist im Vergleich zum Non-Probability-Sample eine erheblich geringere Fallzahl auf.
Blended Calibration
Im ersten Schritt erfolgt eine sogenannte Designgewichtung, um die Auswahlwahrscheinlichkeit des kleineren Probability-Samples auszugleichen. Anhand bekannter Eckwerte aus dem Mikrozensus (sozioökonomisch und regionale Verteilung) erfolgt anschließend eine Kalibrierung. Dadurch wird die Verzerrung reduziert. Danach werden die beiden Stichproben zusammengeführt und das gemischte Blended Sample mit i. d. R. ca. 12.000 Befragten wird an den oben genannten Eckwerten kalibriert. Im dritten Schritt werden zusätzliche Merkmale herangezogen, die zwischen den beiden Samples erheblich variieren und somit im Idealfall die beiden Populationen voneinander abgrenzen (z. B. Nutzung von Festnetz, Mobiltelefon, Internet, Facebook, weitere Social Media Plattformen). Diese Merkmale werden nach der Gewichtung zwischen den beiden Samples verglichen. Zuletzt wird die Kalibrierung aus dem zweiten Schritt um die trennenden Merkmale erweitert. Dabei stammen die Soll-Verteilungen aus dem Probability-Sample. Im Ergebnis stehen repräsentative Daten je Bundesland zur Verfügung, wie die Karte der Impfabwägenden zeigt. Diese Anteile bilden wiederum die Basis für feinräumigere Regionalisierungen.
Regionalisierung
Die Online-Befragten geben freiwillig ihre Wohnadresse an, sodass diese geocodiert und mit mikrogeographischen Merkmalen aus der infas 360 Datenbank angereichert werden können. Diese beinhaltet Daten zu allen 23 Mio. Adressen in Deutschland sowie Informationen zu verschiedenen höheren räumlichen Ebenen, z. B. Siedlungsblock, Stadtteil, Gemeinde oder Kreis. Mit Hilfe von multivariaten Schätzmodellen werden die Ergebnisse anschließend bundesweit und flächendeckend auf alle 19 Mio. Adressen mit Privathaushalten übertragen. Die Schätzwerte können auf beliebige höhere Ebenen aggregiert werden. So wurden beispielsweise Homeoffice-Anteile für alle 401 Landkreise und kreisfreien Städte berechnet und an der erhobenen Homeoffice-Quote je Bundesland geeicht.
Vor- und Nachteile gegenüber Online-Befragungen
Das Non-Probability-Sample des CASA Monitors kann zwar eine Online-Repräsentativität erreichen, jedoch die Gesamtbevölkerung nicht vollständig repräsentativ widerspiegeln. Obwohl die Verzerrungen durch die Verknüpfung zur CASA Datenbank bekannt sind, erfordert eine rechnerische Behandlung dieser einen enormen Zeit- und Kostenaufwand. Die Vorteile von reinen Online-Befragungen liegen aber neben hohen Fallzahlen gerade in erheblichen Zeit- und Kostenersparnissen. Das hier beschriebene Verfahren kann hingegen einem wissenschaftlichen Anspruch genügen, indem es erwartungstreue Schätzer liefern und Befragungsdaten bevölkerungsrepräsentativ regionalisieren kann – mit hoher Fallzahl und bei vergleichsweise günstigen Konditionen. Durch die Kombination zweier Methoden können die Stärken von Probability- und Non-Probability-Samples optimal genutzt und Schwächen überwunden werden.