: Kariem Soliman
: Leitfaden Onlineumfragen Zielsetzung, Fragenauswahl, Auswertung und Dissemination der Ergebnisse
: UVK Verlagsgesellschaft mbH
: 9783381119639
: nuggets
: 1
: CHF 14.50
:
: Mathematik
: German
: 101
: Wasserzeichen
: PC/MAC/eReader/Tablet
: ePUB
Theoretische und praktische Tipps Ganz egal ob in Studium und Forschung, in Verwaltungen oder in Unternehmen - Onlineumfragen helfen dabei, wichtige Erkenntnisse zu gewinnen. Kariem Soliman geht in diesem Leitfaden auf die wesentlichen Aspekte einer Onlineumfrage ein. Von der Zielsetzung über die Fragenauswahl zeigt er den Zusammenhang zur Auswertung als zentralen Aspekt der Veröffentlichung der Ergebnisse auf. Das Buch richtet sich gleichermaßen an Studierende, Wissenschaftler:innen und Praktiker:innen, die im Rahmen ihrer Arbeit auf Onlineumfragen setzen.

M. Sc. Kariem Soliman ist Referent im Bereich Öffentliche Finanzen beim Thüringer Landesamt für Statistik. Nach dem Studium an der Universität Potsdam war er dort und an der Hochschule Ruhr West (VWL, Wirtschaftsstatistik mit R) Wissenschaftlicher Mitarbeiter.

5.1Normierung, Zentrierung und Indexbildung


5.1.1Normierung der Werte


Liegt eineverhältnisskalierte Variable vor, so lässt sich dieses so transformieren, dass alle Werte zwischen null und eins liegen. Dies kann z. B. sinnvoll sein, wenn man die Variable im Anschluss in Gruppen einteilen und anschließend grafisch anhand vonHeatmaps darstellen möchte, die Antworten selbst aber verhältnisskaliert und nicht etwa durch die Zuordnung zu Einkommensgruppen erheben möchte. Ein Beispiel könnte die räumliche Darstellung der Höhe der monatlichen Einkommen in einer Stadt aufgeschlüsselt nach Stadtteilen sein. Mittels einer einfachen Berechnungsvorschrift können die Werte auf einer einheitlichen Basis von null bis eins, bzw. durch anschließende Multiplikation mit 100 in Prozent angegeben werden:

X n o r m = X i - X m i n X m a x - X m i n

Beispiel | Um beim Beispiel mit den Haushaltseinkommen zu bleiben sei angenommen, dass in nachfolgender Tabelle, dass durchschnittliche Einkommen für die 10 Bezirke in Musterstadt abgebildet sind. Die Zahlen sind frei erfunden und dienen ausschließlich der Anschaulichkeit der Berechnungsweise normierter Werte.

Bezirk
1

Bezirk
2

Bezirk
3

Bezirk
4

Bezirk
5

Bezirk
6

Bezirk
7

Bezirk
8

Bezirk
9

Bezirk
10

18.975

18.915

19.067

18.954

18.981

19.066

18.890

19.067

18.896

19.073

Durchschnittliches Einkommen Musterstadt (in Euro) | Quelle: eigene Darstellung

Nun wird die Formel für die Werte aus → Tabelle 6 angewendet. Die neuen Werte können der → Tabelle 7 entnommen werden. Der Minimalwert ist auf null, der Maximalwert auf eins normiert und die resultierenden Werte als Prozente angegeben:

Bezirk
1

Bezirk
2

Bezirk
3

Bezirk
4

Bezirk
5

Bezirk
6

Bezirk
7

Bezirk
8

Bezirk
9

Bezirk
10

46%

14%

97%

35%

50%

96%

0%

97%

3%

100%

Normierte Werte | Quelle: eigene Darstellung und Berechnung

Anhand dieser Methode lässt sich leicht ablesen, dass es sich bei dem fiktiven Beispiel um eine gleichmäßige Verteilung mit leichter Rechtsschiefe bei den Einkommen handelt, da ca. die Hälfte der Werte kleiner und in etwa die andere Hälfte der Werte größer als 50 % sind. Am oberen Rand findet sich jedoch eine Häufung von Datenpunkten; so haben 25 % der Einkommen einen normierten Wert von 96 % oder größer. Für reale Datenfälle insbesondere in Bezug auf das Einkommen ist das plausibel.

5.1.2Zentrierung der Werte anhand der z-Transformation


Eine weitere Möglichkeit zur Transformation von verhältnisskalierten Daten besteht darin, dass von den Beobachtungen (Xi) zunächst das arithmetische Mittel (X¯) abgezogen und die Differenz durch die Standardabweichung (SX) geteilt wird.

Z = X - X ¯ S x

In der Folge entstehen standardisierte Werte, mit einem Erwartungswert (Mittelwert) in Höhe von null und einer Standardabweichung in Höhe von eins. Von den neu erzeugten Werten weist die Hälfte ein positives und die andere Hälfte ein negatives Vorzeichen auf. Die Einheit der neu gebildeten Variablen bildet jeweils die Standardabweichung der ursprünglichen Variablen.

Beispiel | Für die Bildung der standardisierten Werte wird in → Tabelle 8 zunächst für eine beliebige fiktive Kommune „A“ angenommen, dass es genau vier Einwohner mit Bargeldbeständen i.H.v. 100€, 200€, 250€ und 300€ gibt. Durch Anwendung der o. g. Formel wird in zwei Schritten der zugehörige Z-Wert (sprich: standardisierter Wert) gebildet. Die Idee der standardisierten Werte wird durch die Tatsache verdeutlicht, dass es sich um die standardisierten Abweichungen vom Mittelwert (rote, horizontale Linie) handelt, deren Summe für standardisierte Werte null beträgt (→ Abbildung 3).

Kommune A

Bargeld(X)

Xi-X¯

Z-Berechnung

Z-Wert

Person 1

100

100 – 212.5

= –112.5

-112.573.95

-1.52

Person 2

250

250 – 212.5

= 37.5

37.573.95

0.51

Person 3

300

300 – 212.5

= 87.5

87.573.95

1.18

Person 4

200

–12.5

-12.573.95

–0.17

arithmetisches Mittel

212.5

0

0

0

Standardabweichung

73.95

1

Bildung Standardisierter Werte | Quelle: eigene Darstellung und Berechnung | 

Anmerkung: Die Standardabweichung einer Variablen X berechnet sich als Wurzel aus der Varianz, gemäß der Formel: S x = 1 n ∑ ( X i − X ‾ ) 2 . Der zugehörige Befehl inExcel bzw.R lautet: WURZEL(VAR.P()), bzw. sqrt(var(x)).

5.1.3Umsetzung mit Software


5.1.3.1Umsetzung mit Excel

Normierung der Werte

Für die Umsetzung inExcel werden lediglich die BefehleMIN() undMAX() benötigt und Kenntnisse zur Anwendung der Punkt vor Strich- und Klammerrechnung. In einer zusätzlichen Spalte können die jeweiligen normierten Werte durch die Befehlseingabe(Zellenwert-MIN())/(MAX()-MIN()) ermittelt werden. Zur Überprüfung, ob die Transformation gelungen ist, kann dieMIN() undMAX() Funktion auf die normierten Werte angewendet werden, wobei die resultierenden Werte null bzw. eines lauten sollten.

Zentrierung der Werte

InExcel bietet es sich an, eine Tabelle anzulegen, welche in einem anschließenden Schritt auch zur Indexbildung weiter genutzt werden kann. Diese sollte neben den Ursprungsdaten eine weitere Spalte für die Ermittlung der zentrierten Werte (z-Werte) enthalten. Dieser Schritt stellt die Ausgangslage der verteilungsabhängigen Indexberechnung dar. In → Tabelle 14 findet sich eine beispielhafte Berechnung mitExcel, an dem die Umsetzung anhand der zweifachen Standardisierung im Rahmen der Indexbildung verdeutlicht wurde. Anstelle der manuellen Eingabe des Standardisierungsbefehls kann auch die implementierte FunktionSTANDARDISIERUNG() verwendet werden.

5.1.3.2Umsetzung mit...