Methodik der Homeoffice-Studien

In den folgenden Abschnitten werden methodische Details zur Datenerhebung, notwendigen Datenbereinigung und Fallgewichtung der Studienreihe „Verbreitung und Akzeptanz von Homeoffice in Deutschland“ beschrieben.

Die verwendeten Befragungsdaten wurden in neun Wellen im März und Juni 2020, Februar, Mai und September/Oktober 2021, März, Juni und Oktober 2022 sowie im September 2023 erhoben. Eine Übersicht über alle neun Wellen finden Sie hier.

Befragungswelle 9

Die neunte Befragungswelle zum Thema Homeoffice des Bayerischen Forschungsinstituts für Digitale Transformation (bidt) wurde im Zeitraum vom 12. bis zum 22. September 2023 durch das Marktforschungsinstitut DCore durchgeführt. Im Rahmen dessen wurden erwerbstätige Internetnutzerinnen und -nutzer ab 18 Jahren online innerhalb des „opt-in“ Talk Online Panels befragt. Dabei wurden bevölkerungsrepräsentative Quoten für Geschlecht, Alter und Bundesland berücksichtigt. Nach der Bereinigung des Datensatzes von „Schnellantwortern“ und Befragten mit inkonsistentem oder unrealistischem Antwortverhalten verblieben 994 Fälle im Datensatz. Dieser wurde anschließend für erwerbstätige Internetnutzende nach Geschlecht, Alter und Bundesland (b4p 2022) gewichtet.

Im Vergleich zu den acht bisherigen Wellen kam es in der neunten Befragung zu einer grundsätzlichen Änderung der Datenerhebung. So wurden die vorherigen Befragungen mit Google-Surveys durchgeführt, welches jedoch im November 2022 eingestellt wurde.

Befragungswelle 1-8

Datenerhebung

Die für die Befragungswelle eins bis acht verwendeten Primärdaten wurden in acht Querschnittsbefragungen vom Bayerischen Forschungsinstitut für Digitale Transformation (bidt) unter Nutzung von Google Surveys erhoben. Die erste Befragungswelle fand zu Beginn des ersten Lockdowns im Zeitraum vom 27. bis 29. März 2020 statt, die zweite Welle nach einer längeren Phase schrittweiser Lockerungen vom 12. bis 15. Juni 2020 und die dritte kurz nach Inkrafttreten einer neuen Arbeitsschutzverordnung im Zeitraum vom 4. bis 8. Februar 2021. Die vierte Befragung begann kurz nach Inkrafttreten der bislang striktesten Homeoffice-Regelungen und dauerte vom 6. bis 28. Mai 2021. Die fünfte Befragungswelle fand vom 20. September bis zum 10. Oktober 2021 statt. Die sechste fand vom 3. bis 20. März 2022 statt und damit kurz vor Auslaufen der Homeoffice-Pflicht in Deutschland. Die siebte Befragung wurde vom 22. bis 29. Juni 2022 durchgeführt. Vom 14. bis zum 28. Oktober fand die achte Befragungswelle vor dem Hintergrund der Energiekrise statt. Die benötigte Feldzeit zur Erreichung der Fallzahlen war von unterschiedlicher Dauer. Konkrete Gründe hierfür konnten von Google Surveys nicht genannt werden. Ein mutmaßlicher Effekt dieser längeren Erhebungsdauer ist allerdings, dass bei den beiden betroffenen Erhebungen die „Online-Bevölkerung“ regional und hinsichtlich der Altersverteilung besser durch die Stichprobe abgebildet wurde. Die Gewichtungsfaktoren (s. u.) sind somit bei den entsprechenden Befragungswellen deutlich kleiner ausgefallen. Alle acht Fragebögen umfassen je sieben Fragen zum Thema Homeoffice mit unterschiedlichen Schwerpunkten pro Welle und drei Fragen zu soziodemografischen Merkmalen (Stellung im Beruf, Alter und Geschlecht).

Google Surveys verfügt über ein Netzwerk an Webseiten, auf denen ausgewählten Besucherinnen und Besuchern der Fragebogen vorgelegt wird. Die Fragen erscheinen dabei in Form einer sogenannten Surveywall, bei der die Besucherinnen und Besucher der Webseite den Fragenbogen beantworten, um daraufhin Zugang zu weiteren Inhalten zu erlangen. Bereits während der Feldphase der Umfrage erfolgte eine Stichprobenschichtung, wonach im Verlauf unterrepräsentierte Bevölkerungsgruppen im Hinblick auf die Verteilung nach Region, Alter und Geschlecht den Fragebogen mit einer höheren Wahrscheinlichkeit vorgelegt bekamen, überrepräsentierte Bevölkerungsgruppen dahingegen mit einer geringeren Wahrscheinlichkeit. Für eine ausführliche Darstellung siehe Google (2018).

Diese Art der Stichprobengewinnung („River-Sampling“) lässt sich weder reinen Zufallsstichproben noch vorrekrutierten Online-Panels zuordnen. Im Unterschied zu einer reinen Zufallsstichprobe im klassischen Sinn lässt sich beispielsweise keine exakte Grundgesamtheit definieren. Daraus folgt, dass sich keine Auswahlwahrscheinlichkeit eines Elements dieser Stichprobe bestimmen lässt. Dennoch zeigen Vergleiche hinsichtlich u. a. demografischer Merkmale eine gute Übereinstimmung mit anderweitig erhobenen Studien von Internetnutzerinnen und -nutzern (vgl. Pew Research Center 2012).

Datenbereinigung

Ursprünglich wurden mittels Google Surveys jeweils rund 2.500 (Wellen 1-3 & 5-8) bzw. 3.000 (Welle 4) vollständige Antworten erhoben. Bei Onlinebefragungen handelt es sich in der Regel um sogenannte selbst administrierte Befragungen. Hier unterliegt die Interviewsituation – anders als bei persönlich oder telefonisch geführten mündlichen Befragungen – keinerlei Kontrolle. Somit ist eine intensivere Datenprüfung und Bereinigung nötig, um z. B. Antworten von „Spaßantwortern“ und „Schnellausfüllern“ auszuschließen. In einem ersten Schritt wurden Befragte identifiziert, die den Onlinefragebogen in äußerst kurzer Zeit absolviert hatten. Als Ausschlusskriterium wurde in allen acht Erhebungen das unterste Perzentil der Beantwortungszeit festgelegt. Es ist davon auszugehen, dass ein aufmerksames Lesen und Beantworten der Fragen unterhalb dieses Schwellenwertes kaum erfolgen kann. Auch Analysen von ungewöhnlichen Teilergebnissen dieser „Schnellausfüller“ stützen das Vorgehen einer entsprechenden Datenbereinigung.

In einem zweiten Schritt wurden ferner Fälle identifiziert, die im Verlauf der Befragung widersprüchliche Angaben zu ihrer Berufstätigkeit bzw. ihrer Homeoffice-Nutzung abgegeben hatten. Solche Inkonsistenzen waren im Vorfeld nicht auszuschließen, da in den Fragenbögen bei Google Surveys keine komplexere Filterführung möglich ist. So konnten entsprechende Fragenfilter erst „ex post“ auf inkonsistente Antworten angewendet werden. Für einige Befragte trafen mehrere Ausschlussgründe gleichzeitig zu, sodass letztendlich bei den ersten drei Wellen rund 2.000 Fälle, bei der vierten Welle 2.350 Fälle und bei der fünften Welle 1.755 Fälle, bei der sechsten Welle rund 1.950 Fälle, bei der siebten Welle rund 1.710 Fälle und in der achten Welle rund 1.700 Fälle in die nachfolgend beschriebene Gewichtung der Daten eingingen.

Gewichtung

Für die meisten sozialwissenschaftlichen Stichproben gilt, dass Ausfälle in der Regel nicht zufällig verteilt sind, z. B. weil manche Personengruppen von einer bestimmten Befragungsart besser oder schlechter erreicht werden können. Dies führt dazu, dass Subpopulationen nicht gemäß der Grundgesamtheit in der Stichprobe vertreten sind. Auch bei der hier vorliegenden Befragung ergeben sich trotz der während der Feldphase vorgenommenen Stichprobenschichtung systematische Abweichungen. Damit die erhaltenen Beobachtungen dennoch so weit wie möglich die Struktur der erwachsenen Internetnutzerinnen und -nutzer in Deutschland widerspiegeln, wurde eine Redressement-Gewichtung bezüglich der kombinierten Alters- und Geschlechtsstruktur der Onlinebevölkerung sowie der regionalen Verteilung der Gesamtbevölkerung vorgenommen. Die dabei verwendeten Zielstrukturen wurden der jeweils aktuellen amtlichen Statistik entnommen (Destatis 2019Destatis 2020aDestatis 2020bDestatis 2021). Dabei kam das iterative Randsummenverfahren unter Verwendung von IPFWEIGHT (Bergmann 2011) in Stata 16 zum Einsatz. Die Gewichtungsfaktoren liegen über alle Befragungswellen hinweg zwischen 0,5 und 5,2 und somit in einem gemeinhin als unkritisch angesehenen Bereich (vgl. DeBell et al. 2009, 31, zitiert nach Bergmann 2011).

Da zum einen bei Google Surveys das Alter (in Gruppen) und Geschlecht aufgrund des Browsing-Verhaltens der Teilnehmenden „geschätzt“ vorlag (vgl. Google 2018), zum anderen aber auch direkt im Rahmen der Befragung erhoben wurde, konnten beide Angaben geeignet kombiniert werden. Für die Gewichtung wurde demnach primär auf die Selbstauskunft und im Falle fehlender Angaben auf die Schätzung von Google abgestellt, falls vorhanden. Bei Angabe des Geschlechts konnte neben weiblich und männlich bei der Selbstauskunft auch die Kategorie „divers“ ausgewählt werden. Da amtliche Daten für die Internetnutzung aktuell nur für männliche und weibliche Personen vorliegen, wurde in diesen Fällen für die Gewichtung die von Google ermittelte mutmaßliche Geschlechtszugehörigkeit verwendet. Somit verblieben nur wenige Fälle, zu denen keine gewichtungsrelevanten Alters- und Geschlechtsangaben vorlagen.

Die regionale Zuordnung wurde von Google mittels der IP-Adresse vorgenommen, zumeist auf Bundeslandebene, im Falle einiger Großstädte auch auf Gemeindeebene. Aufgrund der zum Teil geringen Zellbesetzung wurden für die regionale Gewichtung die Bundesländer zu sieben Nielsen-Gebieten zusammengefasst. In sehr wenigen Fällen konnte keine Regionalinformation erfasst werden. Alle Befragten, denen keine Werte für die gewichtungsrelevanten Variablen zugeordnet werden konnten, erhielten im entsprechenden Gewichtungsschritt einen Faktor von 1,0.

Analysegrundlage

Für die Analysegrundlage der Welle eins bis acht wurden nur berufstätige Befragte berücksichtigt. Insgesamt befanden sich nach Selbstauskunft in der ersten Welle 1.579, in der zweiten 1.478 und in der dritten 1.564 Berufstätige in den bereinigten Datensätzen. In der vierten Welle waren trotz höherer Ausgangsbasis mit 1.559 ähnlich viele Berufstätige in der Stichprobe wie in den anderen Befragungswellen. Grund hierfür ist die bessere Abbildung älterer Bevölkerungsgruppen in der Stichprobe (s. o.), die zumeist nicht mehr erwerbstätig sind. In der fünften Welle bei niedrigerer Ausgangsbasis aber ähnlichen Stichprobeneffekten wie bei der vierten Welle befanden sich 1.126 Berufstätige in dem bereinigten Datensatz. In der sechsten Welle waren es mit 1.307 Berufstätigen wieder mehr, ebenso wie in der siebten Befragungswelle mit insgesamt 1.121 Berufstätigen. In der achten Befragungswelle hingegen wieder etwas weniger mit 970 Berufstätigen.