Liegt eineverhältnisskalierte Variable vor, so lässt sich dieses so transformieren, dass alle Werte zwischen null und eins liegen. Dies kann z. B. sinnvoll sein, wenn man die Variable im Anschluss in Gruppen einteilen und anschließend grafisch anhand vonHeatmaps darstellen möchte, die Antworten selbst aber verhältnisskaliert und nicht etwa durch die Zuordnung zu Einkommensgruppen erheben möchte. Ein Beispiel könnte die räumliche Darstellung der Höhe der monatlichen Einkommen in einer Stadt aufgeschlüsselt nach Stadtteilen sein. Mittels einer einfachen Berechnungsvorschrift können die Werte auf einer einheitlichen Basis von null bis eins, bzw. durch anschließende Multiplikation mit 100 in Prozent angegeben werden:
Beispiel | Um beim Beispiel mit den Haushaltseinkommen zu bleiben sei angenommen, dass in nachfolgender Tabelle, dass durchschnittliche Einkommen für die 10 Bezirke in Musterstadt abgebildet sind. Die Zahlen sind frei erfunden und dienen ausschließlich der Anschaulichkeit der Berechnungsweise normierter Werte.
Bezirk 1
Bezirk 2
Bezirk 3
Bezirk 4
Bezirk 5
Bezirk 6
Bezirk 7
Bezirk 8
Bezirk 9
Bezirk 10
18.975
18.915
19.067
18.954
18.981
19.066
18.890
18.896
19.073
Durchschnittliches Einkommen Musterstadt (in Euro) | Quelle: eigene Darstellung
Nun wird die Formel für die Werte aus → Tabelle 6 angewendet. Die neuen Werte können der → Tabelle 7 entnommen werden. Der Minimalwert ist auf null, der Maximalwert auf eins normiert und die resultierenden Werte als Prozente angegeben:
46%
14%
97%
35%
50%
96%
0%
3%
100%
Normierte Werte | Quelle: eigene Darstellung und Berechnung
Anhand dieser Methode lässt sich leicht ablesen, dass es sich bei dem fiktiven Beispiel um eine gleichmäßige Verteilung mit leichter Rechtsschiefe bei den Einkommen handelt, da ca. die Hälfte der Werte kleiner und in etwa die andere Hälfte der Werte größer als 50 % sind. Am oberen Rand findet sich jedoch eine Häufung von Datenpunkten; so haben 25 % der Einkommen einen normierten Wert von 96 % oder größer. Für reale Datenfälle insbesondere in Bezug auf das Einkommen ist das plausibel.
Eine weitere Möglichkeit zur Transformation von verhältnisskalierten Daten besteht darin, dass von den Beobachtungen (Xi) zunächst das arithmetische Mittel (X¯) abgezogen und die Differenz durch die Standardabweichung (SX) geteilt wird.
In der Folge entstehen standardisierte Werte, mit einem Erwartungswert (Mittelwert) in Höhe von null und einer Standardabweichung in Höhe von eins. Von den neu erzeugten Werten weist die Hälfte ein positives und die andere Hälfte ein negatives Vorzeichen auf. Die Einheit der neu gebildeten Variablen bildet jeweils die Standardabweichung der ursprünglichen Variablen.
Beispiel | Für die Bildung der standardisierten Werte wird in → Tabelle 8 zunächst für eine beliebige fiktive Kommune „A“ angenommen, dass es genau vier Einwohner mit Bargeldbeständen i.H.v. 100€, 200€, 250€ und 300€ gibt. Durch Anwendung der o. g. Formel wird in zwei Schritten der zugehörige Z-Wert (sprich: standardisierter Wert) gebildet. Die Idee der standardisierten Werte wird durch die Tatsache verdeutlicht, dass es sich um die standardisierten Abweichungen vom Mittelwert (rote, horizontale Linie) handelt, deren Summe für standardisierte Werte null beträgt (→ Abbildung 3).
Kommune A
Bargeld(X)
Xi-X¯
Z-Berechnung
Z-Wert
Person 1
100
100 – 212.5
= –112.5
-112.573.95
-1.52
Person 2
250
250 – 212.5
= 37.5
37.573.95
0.51
Person 3
300
300 – 212.5
= 87.5
87.573.95
1.18
Person 4
200
–12.5
-12.573.95
–0.17
arithmetisches Mittel
212.5
0
Standardabweichung
73.95
–
1
Bildung Standardisierter Werte | Quelle: eigene Darstellung und Berechnung |
Anmerkung: Die Standardabweichung einer Variablen X berechnet sich als Wurzel aus der Varianz, gemäß der Formel: S x = 1 n ∑ ( X i − X ‾ ) 2 . Der zugehörige Befehl inExcel bzw.R lautet: WURZEL(VAR.P()), bzw. sqrt(var(x)).
Für die Umsetzung inExcel werden lediglich die BefehleMIN() undMAX() benötigt und Kenntnisse zur Anwendung der Punkt vor Strich- und Klammerrechnung. In einer zusätzlichen Spalte können die jeweiligen normierten Werte durch die Befehlseingabe(Zellenwert-MIN())/(MAX()-MIN()) ermittelt werden. Zur Überprüfung, ob die Transformation gelungen ist, kann dieMIN() undMAX() Funktion auf die normierten Werte angewendet werden, wobei die resultierenden Werte null bzw. eines lauten sollten.
InExcel bietet es sich an, eine Tabelle anzulegen, welche in einem anschließenden Schritt auch zur Indexbildung weiter genutzt werden kann. Diese sollte neben den Ursprungsdaten eine weitere Spalte für die Ermittlung der zentrierten Werte (z-Werte) enthalten. Dieser Schritt stellt die Ausgangslage der verteilungsabhängigen Indexberechnung dar. In → Tabelle 14 findet sich eine beispielhafte Berechnung mitExcel, an dem die Umsetzung anhand der zweifachen Standardisierung im Rahmen der Indexbildung verdeutlicht wurde. Anstelle der manuellen Eingabe des Standardisierungsbefehls kann auch die implementierte FunktionSTANDARDISIERUNG() verwendet werden.