Methodik

Methodik der Homeoffice-Studien

In den folgenden Abschnitten werden methodische Details zur Datenerhebung, notwendigen Datenbereinigung und Fallgewichtung der Studie „Digitalisierung durch Corona? Homeoffice im Mai 2021“ beschrieben. Die verwendeten Befragungsdaten wurden in vier Wellen im März und Juni 2020 sowie im Februar und Mai 2021 erhoben. Eine Übersicht aller vier Wellen finden Sie hier.

Datenerhebung

Die hier verwendeten Primärdaten wurden in vier Querschnittsbefragungen vom Bayerischen Forschungsinstitut für Digitale Transformation (bidt) unter Nutzung von Google Surveys erhoben. Die erste Befragungswelle fand zu Beginn des ersten Lockdowns im Zeitraum vom 27. bis 29. März 2020 statt, die zweite Welle nach einer längeren Phase schrittweiser Lockerungen vom 12. bis 15. Juni 2020 und die dritte kurz nach Inkrafttreten einer neuen Arbeitsschutzverordnung im Zeitraum vom 4. bis 8. Februar 2021. Die vierte Befragung begann kurz nach Inkrafttreten der bislang striktesten Homeoffice-Regelungen und dauerte vom 6. bis 28. Mai 2021. Die Feldzeit der jüngsten Welle war somit deutlich länger als die der ersten drei. Konkrete Gründe hierfür konnten von Google Surveys nicht genannt werden. Ein mutmaßlicher Effekt dieser längeren Erhebungsdauer ist allerdings, dass diesmal die „Online-Bevölkerung“ regional und hinsichtlich der Altersverteilung besser durch die Stichprobe abgebildet wurde. Die Gewichtungsfaktoren (s. u.) sind somit deutlich kleiner ausgefallen. Alle vier Fragebögen umfassen je sieben Fragen zum Thema Homeoffice mit unterschiedlichen Schwerpunkten pro Welle und drei zu soziodemografischen Merkmalen (Stellung im Beruf, Alter und Geschlecht).

Google Surveys verfügt über ein Netzwerk an Webseiten, auf denen ausgewählten Besucherinnen und Besuchern der Fragebogen vorgelegt wird. Die Fragen erscheinen dabei in Form einer sogenannten Surveywall, bei der die Besucherinnen und Besucher der Webseite den Fragenbogen beantworten, um daraufhin Zugang zu weiteren Inhalten zu erlangen. Bereits während der Feldphase der Umfrage erfolgte eine Stichprobenschichtung, wonach im Verlauf unterrepräsentierte Bevölkerungsgruppen im Hinblick auf die Verteilung nach Region, Alter und Geschlecht den Fragebogen mit einer höheren Wahrscheinlichkeit vorgelegt bekamen, überrepräsentierte Bevölkerungsgruppen dahingegen mit einer geringeren Wahrscheinlichkeit. Für eine ausführliche Darstellung siehe Google (2018).

Diese Art der Stichprobengewinnung („River-Sampling“) lässt sich weder reinen Zufallsstichproben noch vorrekrutierten Online-Panels zuordnen. Im Unterschied zu einer reinen Zufallsstichprobe im klassischen Sinn lässt sich beispielsweise keine exakte Grundgesamtheit definieren. Daraus folgt, dass sich keine Auswahlwahrscheinlichkeit eines Elements dieser Stichprobe bestimmen lässt. Dennoch zeigen Vergleiche hinsichtlich u. a. demografischer Merkmale eine gute Übereinstimmung mit anderweitig erhobenen Studien von Internetnutzerinnen und -nutzern (vgl. Pew Research Center 2012).

Datenbereinigung

Ursprünglich wurden mittels Google Surveys jeweils rund 2.500 (Wellen 1-3) bzw. 3.000 (Welle 4) vollständige Antworten erhoben. Bei Onlinebefragungen handelt es sich in der Regel um sogenannte selbst administrierte Befragungen. Hier unterliegt die Interviewsituation – anders als bei persönlich oder telefonisch geführten mündlichen Befragungen – keinerlei Kontrolle. Somit ist eine intensivere Datenprüfung und Bereinigung nötig, um z. B. Antworten von „Spaßantwortern“ und „Schnellausfüllern“ auszuschließen. In einem ersten Schritt wurden Befragte identifiziert, die den Onlinefragebogen in äußerst kurzer Zeit absolviert hatten. Als Ausschlusskriterium wurde in allen vier Erhebungen das unterste Perzentil der Beantwortungszeit festgelegt. Es ist davon auszugehen, dass ein aufmerksames Lesen und Beantworten der Fragen unterhalb dieses Schwellenwertes kaum erfolgen kann. Auch Analysen von ungewöhnlichen Teilergebnissen dieser „Schnellausfüller“ stützen das Vorgehen einer entsprechenden Datenbereinigung.

In einem zweiten Schritt wurden ferner Fälle identifiziert, die im Verlauf der Befragung widersprüchliche Angaben zu ihrer Berufstätigkeit bzw. ihrer Homeoffice-Nutzung abgegeben hatten. Solche Inkonsistenzen waren im Vorfeld nicht auszuschließen, da in den Fragenbögen bei Google Surveys keine komplexere Filterführung möglich ist. So konnten entsprechende Fragenfilter erst „ex post“ auf inkonsistente Antworten angewendet werden. Für einige Befragte trafen mehrere Ausschlussgründe gleichzeitig zu, sodass letztendlich in den ersten drei Wellen rund 2.000 Fälle in die nachfolgend beschriebene Gewichtung der Daten eingingen. Bei der Welle 4 waren dies 2.350 Fälle.

Gewichtung

Für die meisten sozialwissenschaftlichen Stichproben gilt, dass Ausfälle in der Regel nicht zufällig verteilt sind, z. B. weil manche Personengruppen von einer bestimmten Befragungsart besser oder schlechter erreicht werden können. Dies führt dazu, dass Subpopulationen nicht gemäß der Grundgesamtheit in der Stichprobe vertreten sind. Auch bei der hier vorliegenden Befragung ergeben sich trotz der während der Feldphase vorgenommenen Stichprobenschichtung systematische Abweichungen. Damit die erhaltenen Beobachtungen dennoch so weit wie möglich die Struktur der erwachsenen Internetnutzerinnen und -nutzer in Deutschland widerspiegeln, wurde eine Redressement-Gewichtung bezüglich der kombinierten Alters- und Geschlechtsstruktur der Onlinebevölkerung sowie der regionalen Verteilung der Gesamtbevölkerung vorgenommen. Die dabei verwendeten Zielstrukturen wurden der jeweils aktuellen amtlichen Statistik entnommen (Destatis 2019; Destatis 2020a, Destatis 2020b, Destatis 2021). Dabei kam das iterative Randsummenverfahren unter Verwendung von IPFWEIGHT (Bergmann 2011) in Stata 16 zum Einsatz. Die Gewichtungsfaktoren liegen über die ersten drei Befragungswellen hinweg zwischen 0,5 und 5,2 (bzw. 2,2 in der vierten Welle) und somit in einem gemeinhin als unkritisch angesehenen Bereich (vgl. DeBell et al. 2009, 31, zitiert nach Bergmann 2011).

Da zum einen bei Google Surveys das Alter (in Gruppen) und Geschlecht aufgrund des Browsing-Verhaltens der Teilnehmenden „geschätzt“ vorlag (vgl. Google 2018), zum anderen aber auch direkt im Rahmen der Befragung erhoben wurde, konnten beide Angaben geeignet kombiniert werden. Für die Gewichtung wurde demnach primär auf die Selbstauskunft und im Falle fehlender Angaben auf die Schätzung von Google abgestellt, falls vorhanden. Bei Angabe des Geschlechts konnte neben weiblich und männlich bei der Selbstauskunft auch die Kategorie „divers“ ausgewählt werden. Da amtliche Daten für die Internetnutzung aktuell nur für männliche und weibliche Personen vorliegen, wurde in diesen Fällen für die Gewichtung die von Google ermittelte mutmaßliche Geschlechtszugehörigkeit verwendet. Somit verblieben nur wenige Fälle, zu denen keine gewichtungsrelevanten Alters- und Geschlechtsangaben vorlagen.

Die regionale Zuordnung wurde von Google mittels der IP-Adresse vorgenommen, zumeist auf Bundeslandebene, im Falle einiger Großstädte auch auf Gemeindeebene. Aufgrund der zum Teil geringen Zellbesetzung wurden für die regionale Gewichtung die Bundesländer zu sieben Nielsen-Gebieten zusammengefasst. In sehr wenigen Fällen konnte keine Regionalinformation erfasst werden. Alle Befragten, denen keine Werte für die gewichtungsrelevanten Variablen zugeordnet werden konnten, erhielten im entsprechenden Gewichtungsschritt einen Faktor von 1,0.

Analysegrundlage

Für die hier beschriebenen Analysen wurden nur berufstätige Befragte berücksichtigt. Insgesamt befanden sich nach Selbstauskunft in der ersten Welle 1.579, in der zweiten 1.478 und in der dritten 1.564 Berufstätige in den bereinigten Datensätzen. In der vierten Welle waren trotz höherer Ausgangsbasis mit 1.559 ähnlich viele Berufstätige in der Stichprobe wie in den anderen Befragungsswellen. Grund hierfür ist die bessere Abbildung älterer Bevölkerungsgruppen in der Stichprobe (s. o.), die zumeist nicht mehr erwerbstätig sind.

Zurück zur Studie

NEWSLETTER

Neuigkeiten zur digitalen Transformation

Jetzt abonnieren