Methodik der Homeoffice-Studien

In den folgenden Abschnitten werden methodische Details zur Datenerhebung, notwendigen Datenbereinigung und Fallgewichtung der Studienreihe „Digitalisierung durch Corona? Verbreitung und Akzeptanz von Homeoffice in Deutschland“ beschrieben.

Die verwendeten Befragungsdaten wurden in sieben Wellen im März und Juni 2020, Februar, Mai und September/Oktober 2021 sowie März und Juni 2022 erhoben. Eine Übersicht über alle sieben Wellen finden Sie hier.

Datenerhebung

Die hier verwendeten Primärdaten wurden in fünf Querschnittsbefragungen vom Bayerischen Forschungsinstitut für Digitale Transformation (bidt) unter Nutzung von Google Surveys erhoben. Die erste Befragungswelle fand zu Beginn des ersten Lockdowns im Zeitraum vom 27. bis 29. März 2020 statt, die zweite Welle nach einer längeren Phase schrittweiser Lockerungen vom 12. bis 15. Juni 2020 und die dritte kurz nach Inkrafttreten einer neuen Arbeitsschutzverordnung im Zeitraum vom 4. bis 8. Februar 2021. Die vierte Befragung begann kurz nach Inkrafttreten der bislang striktesten Homeoffice-Regelungen und dauerte vom 6. bis 28. Mai 2021. Die fünfte Befragungswelle fand vom 20. September bis zum 10. Oktober 2021 statt. Die sechste fand vom 3. bis 20. März 2022 statt und damit kurz vor Auslaufen der Homeoffice-Pflicht in Deutschland. Die siebte und bisher letzte Befragung wurde vom 22. bis 29. Juni 2022 durchgeführt. Die Feldzeit einiger Wellen war somit deutlich länger als die der ersten drei und auch als die letzte. Konkrete Gründe hierfür konnten von Google Surveys nicht genannt werden. Ein mutmaßlicher Effekt dieser längeren Erhebungsdauer ist allerdings, dass bei den beiden betroffenen Erhebungen die „Online-Bevölkerung“ regional und hinsichtlich der Altersverteilung besser durch die Stichprobe abgebildet wurde. Die Gewichtungsfaktoren (s. u.) sind somit bei den entsprechenden Befragungswellen deutlich kleiner ausgefallen. Alle siebenFragebögen umfassen je sieben Fragen zum Thema Homeoffice mit unterschiedlichen Schwerpunkten pro Welle und drei Fragen zu soziodemografischen Merkmalen (Stellung im Beruf, Alter und Geschlecht).

Google Surveys verfügt über ein Netzwerk an Webseiten, auf denen ausgewählten Besucherinnen und Besuchern der Fragebogen vorgelegt wird. Die Fragen erscheinen dabei in Form einer sogenannten Surveywall, bei der die Besucherinnen und Besucher der Webseite den Fragenbogen beantworten, um daraufhin Zugang zu weiteren Inhalten zu erlangen. Bereits während der Feldphase der Umfrage erfolgte eine Stichprobenschichtung, wonach im Verlauf unterrepräsentierte Bevölkerungsgruppen im Hinblick auf die Verteilung nach Region, Alter und Geschlecht den Fragebogen mit einer höheren Wahrscheinlichkeit vorgelegt bekamen, überrepräsentierte Bevölkerungsgruppen dahingegen mit einer geringeren Wahrscheinlichkeit. Für eine ausführliche Darstellung siehe Google (2018).

Diese Art der Stichprobengewinnung („River-Sampling“) lässt sich weder reinen Zufallsstichproben noch vorrekrutierten Online-Panels zuordnen. Im Unterschied zu einer reinen Zufallsstichprobe im klassischen Sinn lässt sich beispielsweise keine exakte Grundgesamtheit definieren. Daraus folgt, dass sich keine Auswahlwahrscheinlichkeit eines Elements dieser Stichprobe bestimmen lässt. Dennoch zeigen Vergleiche hinsichtlich u. a. demografischer Merkmale eine gute Übereinstimmung mit anderweitig erhobenen Studien von Internetnutzerinnen und -nutzern (vgl. Pew Research Center 2012).

Datenbereinigung

Ursprünglich wurden mittels Google Surveys jeweils rund 2.500 (Wellen 1-3 & 5) bzw. 3.000 (Welle 4) vollständige Antworten erhoben. Bei Onlinebefragungen handelt es sich in der Regel um sogenannte selbst administrierte Befragungen. Hier unterliegt die Interviewsituation – anders als bei persönlich oder telefonisch geführten mündlichen Befragungen – keinerlei Kontrolle. Somit ist eine intensivere Datenprüfung und Bereinigung nötig, um z. B. Antworten von „Spaßantwortern“ und „Schnellausfüllern“ auszuschließen. In einem ersten Schritt wurden Befragte identifiziert, die den Onlinefragebogen in äußerst kurzer Zeit absolviert hatten. Als Ausschlusskriterium wurde in allen vier Erhebungen das unterste Perzentil der Beantwortungszeit festgelegt. Es ist davon auszugehen, dass ein aufmerksames Lesen und Beantworten der Fragen unterhalb dieses Schwellenwertes kaum erfolgen kann. Auch Analysen von ungewöhnlichen Teilergebnissen dieser „Schnellausfüller“ stützen das Vorgehen einer entsprechenden Datenbereinigung.

In einem zweiten Schritt wurden ferner Fälle identifiziert, die im Verlauf der Befragung widersprüchliche Angaben zu ihrer Berufstätigkeit bzw. ihrer Homeoffice-Nutzung abgegeben hatten. Solche Inkonsistenzen waren im Vorfeld nicht auszuschließen, da in den Fragenbögen bei Google Surveys keine komplexere Filterführung möglich ist. So konnten entsprechende Fragenfilter erst „ex post“ auf inkonsistente Antworten angewendet werden. Für einige Befragte trafen mehrere Ausschlussgründe gleichzeitig zu, sodass letztendlich bei den ersten drei Wellen rund 2.000 Fälle, bei der vierten Welle 2.350 Fälle und bei der fünften Welle 1.755 Fälle, bei der sechsten Welle rund 1.950 Fälle und bei der siebten Welle rund 1.710 Fälle in die nachfolgend beschriebene Gewichtung der Daten eingingen.

Gewichtung

Für die meisten sozialwissenschaftlichen Stichproben gilt, dass Ausfälle in der Regel nicht zufällig verteilt sind, z. B. weil manche Personengruppen von einer bestimmten Befragungsart besser oder schlechter erreicht werden können. Dies führt dazu, dass Subpopulationen nicht gemäß der Grundgesamtheit in der Stichprobe vertreten sind. Auch bei der hier vorliegenden Befragung ergeben sich trotz der während der Feldphase vorgenommenen Stichprobenschichtung systematische Abweichungen. Damit die erhaltenen Beobachtungen dennoch so weit wie möglich die Struktur der erwachsenen Internetnutzerinnen und -nutzer in Deutschland widerspiegeln, wurde eine Redressement-Gewichtung bezüglich der kombinierten Alters- und Geschlechtsstruktur der Onlinebevölkerung sowie der regionalen Verteilung der Gesamtbevölkerung vorgenommen. Die dabei verwendeten Zielstrukturen wurden der jeweils aktuellen amtlichen Statistik entnommen (Destatis 2019Destatis 2020aDestatis 2020bDestatis 2021). Dabei kam das iterative Randsummenverfahren unter Verwendung von IPFWEIGHT (Bergmann 2011) in Stata 16 zum Einsatz. Die Gewichtungsfaktoren liegen über die ersten drei Befragungswellen hinweg zwischen 0,5 und 5,2 (bzw. 2,2 in der vierten Welle) und somit in einem gemeinhin als unkritisch angesehenen Bereich (vgl. DeBell et al. 2009, 31, zitiert nach Bergmann 2011).

Da zum einen bei Google Surveys das Alter (in Gruppen) und Geschlecht aufgrund des Browsing-Verhaltens der Teilnehmenden „geschätzt“ vorlag (vgl. Google 2018), zum anderen aber auch direkt im Rahmen der Befragung erhoben wurde, konnten beide Angaben geeignet kombiniert werden. Für die Gewichtung wurde demnach primär auf die Selbstauskunft und im Falle fehlender Angaben auf die Schätzung von Google abgestellt, falls vorhanden. Bei Angabe des Geschlechts konnte neben weiblich und männlich bei der Selbstauskunft auch die Kategorie „divers“ ausgewählt werden. Da amtliche Daten für die Internetnutzung aktuell nur für männliche und weibliche Personen vorliegen, wurde in diesen Fällen für die Gewichtung die von Google ermittelte mutmaßliche Geschlechtszugehörigkeit verwendet. Somit verblieben nur wenige Fälle, zu denen keine gewichtungsrelevanten Alters- und Geschlechtsangaben vorlagen.

Die regionale Zuordnung wurde von Google mittels der IP-Adresse vorgenommen, zumeist auf Bundeslandebene, im Falle einiger Großstädte auch auf Gemeindeebene. Aufgrund der zum Teil geringen Zellbesetzung wurden für die regionale Gewichtung die Bundesländer zu sieben Nielsen-Gebieten zusammengefasst. In sehr wenigen Fällen konnte keine Regionalinformation erfasst werden. Alle Befragten, denen keine Werte für die gewichtungsrelevanten Variablen zugeordnet werden konnten, erhielten im entsprechenden Gewichtungsschritt einen Faktor von 1,0.

Analysegrundlage

Für die hier beschriebenen Analysen wurden nur berufstätige Befragte berücksichtigt. Insgesamt befanden sich nach Selbstauskunft in der ersten Welle 1.579, in der zweiten 1.478 und in der dritten 1.564 Berufstätige in den bereinigten Datensätzen. In der vierten Welle waren trotz höherer Ausgangsbasis mit 1.559 ähnlich viele Berufstätige in der Stichprobe wie in den anderen Befragungsswellen. Grund hierfür ist die bessere Abbildung älterer Bevölkerungsgruppen in der Stichprobe (s. o.), die zumeist nicht mehr erwerbstätig sind. In der fünften Welle bei niedrigerer Ausgangsbasis aber ähnlichen Stichprobeneffekten wie bei der vierten Welle befanden sich 1.126 Berufstätige in dem bereinigten Datensatz. In sechsten Welle waren es mit 1.307 Berufstätigen wieder mehr, ebenso wie in der siebten Befragungswelle mit insgesamt 1.121 Berufstätigen.