Panel Analyse
Panel Analyse
Panel Analyse
ausgewählter Verfahren
1 Einleitung 3
verlauf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
und Veränderung? . . . . . . . . . . . . . . . . . . . . 10
teren Zeitpunkt . . . . . . . . . . . . . . . . . . . . . . 15
Random-Eects-Modelle . . . . . . . . . . . . . . . . . 44
3 Fazit 118
4 Appendix 119
4.1 Appendix A - Fiktiver Datensatz mit variierender x2 -Variable 119
daten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
1
4.3 Appendix C - Fiktive Datensätze für eine Regression mit Dif-
ferenzenvariablen . . . . . . . . . . . . . . . . . . . . . . . . . 121
Literaturverzeichnis 134
2
Kapitel 1
Einleitung
Diese Möglichkeiten werden oft unter dem Begri der Panelanalyse subsu-
miert. Ehe auf diesen Begri eingegangen wird, sollten aber zuerst elemen-
te, welche sich auf die Zeit-Dimension, die erhobenen Merkmale und auf die
denheit mit der Universität Duisburg vorgelegt und handelt es sich dabei
Zeitpunkt und eine geringe Fluktuation der Teilnehmer lässt es immer noch
1Weitere Arten, Längsschnittdaten zu erheben (und die daraus resultierenden Konsequenzen) werden weiter unten
anhand der Gegenüberstellung mit der Trendstudie kurz diskutiert, sonst werden sie in diesem Skript nicht thematisiert.
3
ferner eingebürgert, vom Panel schon dann zu sprechen, wenn dieselben Per-
sonen mehrmals befragt werden, auch wenn das Messinstrument von Welle
zu Welle völlig unterschiedlich ist. Dies ist nicht zuletzt auf die immer stär-
möglichst groÿen und heterogenen Pool von Teilnehmern, welche über Bonus-
Praxis muss allerdings von der klassischen Vorgehensweise bei der Realisie-
rung eines Paneldesign abgegrenzt werden. Sie wird im Skript nicht weiter
berücksichtigt.
An dieser Stelle seien auszugsweise ein paar Beispiele für deutsche Panel-
sind, aufgeführt:
Münster/Bielefeld)
Bezug auf die Qualität von Umfragedaten widmet (u.a. Uni Duisburg
/ Bremen)
Das Sozio-Ökonomisches Panel (kurz auch SOEP) ist der mit Abstand
startet 1984 mit einer Stichprobe von knapp 6000 Haushalten (ca. 12.000
Personen) und bis heute fortgeführt, bietet er eine groÿe Bandbreite an Va-
4
Die anderen aufgeführten Beispiele für Panelerhebungen (ausgenommen
Nun soll einführend auf das Hauptthema dieser Arbeit, die Panelanalyse,
eingegangen werden.
Dem ist nicht so. Deshalb ist dieser Begri etwas irreführend. Zunächst ein-
mal sei erwähnt, dass der Begri der Panelanalyse als ein weit reichender
Exklusivität in Frage gestellt werden, denn oft bedient sich die Panelanaly-
Analyse , welche auf die Besonderheiten von Paneldaten hin modiziert wer-
• Bleibe ich auf der Ebene der empirischen Variablen oder vermute ich,
dass einige meiner Variablen als Indikatoren zu sehen sind, hinter denen
2 Hier bezieht sich der Autor auf verschiedene Variablen, die zu einem Zeitpunkt gemessen werden - diese Problematik
wird natürlich bei der Panelanalyse um weitere Aspekte beträchtlich erweitert (mehr dazu im Verlauf des Texts).
5
komplexer, da nun Unterscheidungen in Hinblick auf den Inhalt der
sind
Der erste Punkt macht zugleich den Reiz der Panelanalyse als auch ihre
Komplexität aus. Denn Veränderung ist aus statischer Perspektive eine emer-
die sich aus dieser Perspektive (und so arbeitet der Statistiker, wenn er mit
Der zweite Punkt stellt die Vorteile des Paneldesigns gegenüber anderen
proben.
So können Aussagen über Wandel und Stabilität nur auf der Aggregatebene
politische Parteien, Partei A und Partei B. Alle Individuen aus der Grund-
gesamtheit gehören einer Partei an und können problemlos jederzeit die Zu-
gehörigkeit wechseln.
Zum ersten Messzeitpunkt gehören Partei A 70% und Partei B 30% der
wieder. Es wird daraus geschlossen, dass sich nichts verändert hat, dass also
3Die bekannte Datenmatrix mit m Objekten und n inhaltlich unterschiedlichen Variablen lässt sich so um eine dritte
Dimension t erweitern, welche für die Zeitpunkte steht; es resultieren insgesamt n·t Variablen und - bei einem vollständigen
Datensatz m · n · t Daten; betrachtet man nur die n · t-Matrix (t spaltenweise), dann erklärt sich auch die Herkunft des
Begris, da diese (bei wenigen Zeitpunkten und vielen Variablen) wie ein Paneel aussieht.
6
alles beim Alten ist. Dies mag zwar für die simple Betrachtung von An-
teilswerten stimmen. Wenn kein tieferes Verständnis für die Strukturen und
ausreichen.
spiel vorstellbar, dass in der Zwischenzeit innerhalb der Parteien eine hohe
der Partei B zum ersten Zeitpunkt zwischenzeitlich zur Partei A und ge-
sich in diesem Fall somit gegenseitig kompensiert ein Prozess, der anhand
Veränderungen die Rede ist, nicht etwa die Veränderung der Merkmale kon-
kreter Einzelfälle (z.B. die Gehaltsänderung von Herrn XY) im Fokus steht.
lerdings, wie oben erwähnt, aufgrund der fehlenden Verknüpfbarkeit der Da-
4
tensätze einer Trendstudie, nur anhand von Paneldaten ermittelt werden.
vom Nachteil sind. Diese beziehen sich vor allem auf die Datenerhebung. Es
Personen können nach einem oder mehreren Zeitpunkten ihre Teilnahme ver-
weigern oder sie fallen aus anderen Gründen weg (Panelmortalität). Das Dra-
matische daran ist, dass solche Ausfälle in Panelstudien eine gröÿere Tendenz
seits, im Falle einer Befragung (welche immer die Gefahr der Reaktivität
4 Natürlich lassen sich in Querschnitts- und Trendstudien Variablenwerte retrospektiv erfragen und mit aktuellen Va-
riablenwerten vergleichen (z.B. Parteiwahl bei der aktuellen und bei der vorherigen Landtagswahl). Allerdings sind solche
retrospektiven Messungen hinsichtlich ihrer Reliabilität und Validität ziemlich problematisch.
7
punkte anders reagieren, als dies im Falle einmaliger Befragung geschehen
In diesem Skript wird diese Problematik nicht weiter vertieft, es kann aber
Arminger (1990: Kap. 4), Hsiao (2005: Kap. 9), Engel (2004: Kap. 5).
Auch treten Probleme in der Datenanalyse auf. Dies betrit vor allem den
te ein und derselben Person zum inhaltlich gleichen Merkmal nicht mehr als
den können. Die Annahme der stochastischen Unabhängigkeit ist aber wichtig
Wie bereits erwähnt, stellt den Kern dieser Arbeit ein Auszug von Möglich-
den. Hinweise zu diesem Thema für Einsteiger sind im Anhang 4.7 zu nden.
Es wird ferner gezeigt, dass Paneldaten einerseits dazu genutzt werden, Ent-
8
Kapitel 2
Ausgewählte Analyseverfahren
für Paneldaten
(und so ist es auch in den Sozialwissenschaften) einen gewissen Reiz aus, denn
Ein trauriges Beispiel stellt hierbei die grausame Vernichtung und Zerstö-
steht aber vor dem Dilemma, dass die zeitliche Abfolge von Eekten oft nicht
kontrollierbar ist. Denn er arbeitet häug mit Merkmalen, die sich nicht ma-
9
Auch wenn in Panelstudien im Vergleich zu echten Experimenten keine
nipulieren und die Folgen zu studieren, so führt das Paneldesign durch wie-
verbessert.
Zuerst soll nun gefragt werden, wie eine Veränderung statistisch zu be-
sei auÿerdem erwähnt, dass dieser Begri von dem der Stabilität zu einem
Gegensatzpaar ergänzt wird. Je mehr sich also ein Merkmal über die Zeit
Aber zum Einstieg soll die einfachste Form des Einusses betrachtet wer-
den: Eine Variable beeinusst ihre Werte über die Zeit durch sich selbst.
Wenn z.B. das Einkommen von Personen zum Zeitpunkt t abgefragt wird,
dann kann man erwarten, dass dieses Einkommen zum Zeitpunkt t+1 kon-
stant bleibt. Wird diese Erwartungshaltung erfüllt, so liegt bzgl. des Einkom-
1
mens Stabilität vor, ist das Gegenteil der Fall, so hat sich etwas geändert.
Doch wie macht sich denn Veränderung statistisch bemerkbar? Ein intui-
gleichen Variablen zum Zeitpunkt t und dem Zeitpunkt t+1 zu bilden. Je hö-
her er ausfallen würde, umso eher hingen die zwei Variablen zusammen und
durch umso mehr Stabilität wären sie folglich gekennzeichnet. Doch dieser
Gedanke ist nur auf den ersten Blick plausibel. Denn eine hohe Korrelation
kann zeitliche Stabilität zum Ausdruck bringen, aber eben nicht nur, sondern
ebenso eine gleichmäÿige, proportionale Veränderung , egal wie stark
sie ist.
1 Wobei dann noch lange nicht davon auszugehen ist, dass das Einkommen zum früheren Zeitpunkt selber Ursache für
den Wandel ist es ist eher anzuzweifeln. Ein plausibleres Beispiel wäre das rich-get-richer-Phänomen, welches impliziert,
dass mit zunehmendem materiellen Reichtum Personen immer stärker dazu tendieren, über die Zeit diesen Reichtum weiter
auszubauen.
10
Dies sei am folgenden Beispiel illustriert: Es wird als Variable das Ein-
erhoben. Der Datensatz enthält Daten von dem Geringverdiener bis zum Ma-
Unternehmen ein Jahr später und es hat sich kaum etwas bzgl. der Gehäl-
20% zu erhöhen, dann würde durch diesen proportionalen Anstieg die Korre-
lation ebenfalls nahe bei 1 liegen, obwohl sich sehr wohl Einiges geändert hat.
gung der Korrelation einer Variablen x zum Zeitpunkt 1 (x1 ) mit derselben
Da sich die bivariate Korrelation zweier Merkmale aus der Kovarianz dieser
Variablen) errechnen lässt, wird hier zuerst die Zerlegung der Kovarianz der
die Dierenz zwischen x1 und x2 und somit die Veränderung der x-Werte
eines Individuums zwischen den beiden Zeitpunkten zum Ausdruck bringt
(∆x = x2 − x1 ). Die Zerlegung gestaltet sich wie folgt (Vgl. Kessler 1981:
9):
Nachweis:
Pn
[(x −x )(x −x )]
Da ∆xi = x2i −x1i und die Kovarianz von x1 und x2 = i=1 1i n 1 2i 2
(wobei i = Laundex der einzelnen Werte von x1 und x2 , n = der
bzw. x2 ):
11
n
X
Covx1 x2 = [(x1i − x1 )(x2i − x2 )]
i=1
n
X
= [(x1i − x1 )((x1i + ∆xi ) − (x1 + ∆x))]
i=1
Xn
= [(x1i − x1 )((x1i + ∆xi ) − (x1 + ∆x))]
i=1
Xn
= [(x1i − x1 )(x1i + ∆xi − x1 − ∆x)]
i=1
Xn
= [x21i + x1i ∆xi − x1i x1 + x1i ∆x − x1i x1 − x1 ∆xi + x1 2 + x1 ∆x]
i=1
n
X
= [x21i − 2(x1i x1 ) + x1 2 + x1i ∆xi + x1i ∆x − x1 ∆xi + x1 ∆x]
i=1
n
X
= [(x1i − x1 )2 + (x1i − x1 )(∆xi − ∆x)]
i=1
n
X n
X
= (x1i − x1 )2 + [(x1i − x1 )(∆xi − ∆x)]
i=1 i=1
= V arx1 + Covx1 ∆x
(2.2)
blendet.
Hierbei ist der erste Summand V arx1 als der Teil der Kovarianz zu ver-
stehen, welcher die zeitliche Stabilität in den Werten der Variablen X zum
Ausdruck bringt. Das ist logisch, wenn man bedenkt, was passieren würde,
wenn der zweite Summand auf Null gesetzt wird. Dann ist nämlich die ge-
kann somit als der Teil angesehen werden, welcher die Veränderung zum Aus-
druck bringt. So kann die Veränderung einer Variablen über zwei Zeitpunkte
12
in Hinblick darauf beurteilt werden, welchen Anteil die beiden Summanden
Die Korrelation lässt sich nun auf der Basis der eingeführten Kovarianzzer-
V arx1 +Covx1 ∆x
rx 1 x 2 = sx1 ·sx2 (2.3)
Anhand des folgenden Beispiels mit ktiven Daten soll gezeigt werden, wie
ten aufweisen, sich aber in der Zusammensetzung ihrer Kovarianz (also in der
4.1 abgelegt).
13
Abbildung 2.2: Kovarianzmatrix
Es wurden hierzu eine X1-Variable und drei mögliche Partner, also drei
gen. Dies manifestiert sich in den jeweiligen sehr hohen bivariaten Korrela-
Nun können die Kovarianzen in Abb. 2.2 (in der Zeile Kovarianz) zwi-
werden. Diese sind schlieÿlich nach Gl. 2.3 Bestandteil der Korrelations- bzw.
X1 (V arX1 = 35), ist für alle drei Fälle konstant. Was variiert, ist hingegen
14
X1 gepaart wird. Es ist zu sehen, dass mit immer gröÿerer Diskrepanz diese
Mit der Zunahme der Kovarianz zwischen X1 und ∆ nimmt auch die Do-
minanz dieses Summanden an der Summe im Zähler von Gl. 2.3 zu. V arX1
bleibt schlieÿlich, wie bereits erwähnt, immer gleich.
Wenn also die Kovarianz zwischen zwei Variablen von der Kovarianz ei-
ner der beiden Variablen mit der Dierenzvariablen dominiert wird, dann ist
dieser Befund ein Indikator dafür, dass trotz eines möglicherweise hohen Kor-
hat.
sich nur auf relativ hohe Korrelationen beziehen und somit lediglich unter-
Die Frage nach Veränderung an sich wurde hier nicht behandelt, es ist aber
eine gerichtete Beziehung zu benennen und zwar mit x1 als der unabhängigen
und x2 als der abhängigen Variablen. Die Regressionsgleichung lässt sich wie
folgt formalisieren (auf den Index für einzelne Werte wurde aus Veranschau-
lichungsgründen verzichtet):
x 2 = a + b1 x 1 + e
15
mit:
a =Regressionskonstante
b1 =unstandardisierter Regressionskoezient der unabhängigen Variablen
e =Fehlerterm
nur durch die Varianz der unabhängigen Variablen geteilt wird). Im Falle
Covx1 x2
bx 1 =
V arx1
Nach der in Kapitel 2.1.1 eingeführten Aufteilung lässt sich die Kovarianz
genden bezeichnet mit b̂x1 . So kann man für die ursprüngliche Gleichung
schreiben:
x2 = a + (1 + b̂x1 )x1 + e
x2 = a + x1 + b̂x1 x1 + e
x2 − x1 = a + b̂x1 x1 + e
∆x = a + b̂x1 x1 + e (2.4)
Die letzte Gleichung stellt die Regressionsgleichung mit x1 als der unab-
zum ersten Zeitpunkt, erklärt werden kann. Da Folgendes gilt: bx1 = 1 + b̂x1 ,
16
Die gerade besprochenen Regressionskoezienten sind unstandardisiert,
dass man vor dem ursprünglichen Problem zu Beginn des Kapitels 2.1.1 stün-
de.
Allerdings kann man etwas über perfekte Stabilität sagen: Ist bx1 = 1, so
ergibt sich für b̂x1 = 0. Geht man von einer fehlerfreien Regression aus, bei
Betrachtet man dann wieder die ursprüngliche Regression mit x2 als abhän-
gige Variable, so erscheint dies logisch, denn bei einer Regressionskonstanten
term würden sich die x2 -Werte direkt aus den x1 -Werten ergeben.
de liegen. Bezogen auf das obige Beispiel in Kap.2.1.1 ergeben sich folgende
Regressionsgleichungen:
diglich dann, wenn die Abweichung der x2 -Werte von den x1 -Werten gleich-
mäÿig, also proportional zunimmt. Ist dies nicht der Fall, kovariieren die
Werte nicht gleichmäÿig, so kann die Kovarianz und in der Folge der Re-
Spätestens dann muss die univariate Ebene verlassen werden, denn es muss
17
3
weitere Variablen geben, welche die Veränderung in X beeinussen. Solchen
nimmt das Modell an Komplexität zu. Nun lassen sich aber darüber hinaus
noch komplexere Modelle denken. Solche Modelle können von der Pfadana-
Punkte:
der anderen Variablen als abhängige, und in Bezug auf einen zweiten
lassen
verbunden
3 Und wie schon an anderer Stelle angemerkt: Selbst bei hoher Stabilität kann die Variable X zum Zeitpunkt t1 nicht
unreektiert als eine kausale Wirkung auf sich selbst zum Zeitpunkt t2 angenommen werden.
18
• Bei einer gerichteten Beziehung zeigt der Pfeil auf die abhängige Va-
riable, im Falle der Ungerichtetheit zeigt der Pfeil auf beide Variablen
• Variablen, auf die kein einseitig gerichteter Pfeil zeigt, nennt man exo-
gene Variablen, alle anderen bezeichnet man als endogene Varia-
blen
riablen, wobei die abhängige Variable als erstes gelistet wird (pyx würde
dungen der Variablen (durch Pfeile) a priori gemacht, also bevor konkrete
priori festgelegt (das kann z.B. die Annahme der Unkorreliertheit zwischen
Ein Beispiel für ein Pfaddiagramm mit acht Variablen (sechs gemesse-
gen. Das Diagramm stellt ein Modell von Felson and Bohrnstedt (1979) dar,
und welche Bedeutung sie haben. Zuerst muss man wissen, dass Pfadmodelle
zu denken sind.
Variablen ist, dass sie einen Zusammenhang ausdrückt, in welchem die Ein-
19
1
GPA academic error1
height
1
weight attract error2
rating
aus den Pfadkoezienten herausgehalten werden; wobei das nur für Varia-
Deswegen ist die schwierigste Aufgabe, überhaupt erst ein geeignetes Mo-
uns nun an einem einfachen Beispiel widmen. Es wird folgendes Modell be-
4 Fragen nach der Modellanpassung werden an dieser Stelle erst mal ausgeklammert.
20
x
y z
ey ez
An dieser Stelle schätzt man nicht die einzelnen Parameter wie in der
durch Umformung und Verschmelzung der Gl. 2.5 und 2.6 zu ermitteln. Hier-
21
zx = pzx x2 + pzy yx + pzez ez x (2.8)
Es entstehen drei Gleichungen, da Gl. 2.5 eine und Gl. 2.6 zwei unabhängige
Variablen enthält.
Trotzdem gilt für jede Variable, dass sie Platzhalter für die Werte einzelner
Fälle ist. Im Gegensatz dazu sind die Pfadkoezienten für alle Fälle N kon-
also alle einen Mittelwert von Null und eine Standardabweichung von Eins
Bezeichnet man die Korrelation der Variablen i und j als rij und bedenkt
man, dass eine Korrelation einer Variablen mit sich selbst Eins ergibt, dann
22
Setzt man weiterhin die Annahme, dass die Residuen nicht mit den unab-
Der Pfadkoezient pyx entspricht der Korrelation ryx . Dies sollte nicht wei-
ter verwundern, denn in diesem hier betrachteten einfachen Modell wird die
Variable y nur von x beeinusst. Die zwei weiteren Korrelationen setzen sich
dagegen aus mehreren Summanden zusammen. Um die Pfadkoezienten zu
bestimmen, muss substituiert werden. Dies ist die Stelle, an der die Ver-
Man löst Gl. 2.17 nach pzx auf und ersetzt pzx in Gl. 2.18 mit dem Ausdruck
rzx − pzy ryx . Nun lässt sich die neue Gleichung nach pzy auösen. Es ergibt
sich:
Pfadkoezienten drei Ausdrücke ergeben, welche sich aus den bivariaten Kor-
Generell lässt sich sagen, dass sich die Pfadkoezienten, wie auch Kor-
23
−1 ≤ p ≤ +1 bewegen.
2.20 und 2.21 sieht man, dass die jeweiligen Pfadkoezienten die entspre-
Betrachtet man z.B. für Gl. 2.20 nur den Zähler, dann sieht man, dass von
der Korrelation rzy das Produkt der anderen Korrelationen, nämlich rzx rxy
subtrahiert wird. Somit sieht man schon hier, dass je dominanter die eigent-
den weiteren Korrelationen ist, umso gröÿer (bei Konstanthaltung des Nen-
5
ners) der Wert des Pfadkoezienten wird.
Geteilt wird in Gl. 2.20 durch den Anteil der nicht erklärten Varianz,
wenn man eine einfache Regression mit den Variablen xy (also die, welche
6
hier auf z wirken) durchführen würde. Daraus lässt sich schlieÿen: Je höher
die quadrierte Korrelation zwischen den auf z wirkenden Variablen ist (bei
hoch ist, ist sie in erster Linie dafür verantwortlich, wenn der Pfadkoezient
Betrachten wir den bereinigten Einuss von y auf z (was ja bei pzy der Fall
ist), so wird er höher ausfallen, wenn der Einuss von x auf z möglichst
nach hat [y ] keine Wirkung auf [z ], die unabhängig von dem Einuss von
24
genden ktive Beispiele aufgeführt:
Die Tabelle 2.1 zeigt vier Beispiele für unterschiedliche Werte der drei Kor-
mit 0, 8 konstant gehalten, um zu zeigen, wie sich trotz der Invarianz dieser
gen erst mal die allgemeine Tendenz, dass pzy steigt, wenn die anderen zwei
Korrelationen fallen.
Dann wird die Betrachtung weiter dierenziert. Die Werte von rxy und rxz
werden in Zeile 3 und 4 variiert, allerdings so, dass der Zähler immer gleich
bleibt und dem in Zeile 2 entspricht. So hängt pzy nur noch vom Nenner, bzw.
2 2
der Höhe von ryx ab. ryx hängt wiederum im Falle eines konstanten Zählers
von rxz ab, so dass sichtbar wird: Bei steigenden Werten von rxz , unter
Kontrolle weiterer Einüsse, wird der reine Einuss von y auf z
(pzy ) geringer.
An dieser Stelle bleibt noch zu sagen, dass die eben festgestellten Zu-
wird. Deswegen wurde hier ein recht einfaches Modell gewählt, in dem die
Wege ermittelt. Die Berechnung wird im Falle von mehr als drei Variablen
licher, da die Anzahl der Gleichungen, welche denen im Beispiel 2.7 - 2.9
25
Es gibt eine Formel, das sog. Grundtheorem der Pfadanalyse, welche allge-
mein gehalten ist und einiges an Rechenarbeit erspart (vgl. Opp 1976: 166
f ). Sie lautet:
X
rij = piq rqj (2.22)
q
Mit dieser Formel lässt sich jede Korrelation zweier beliebiger Variablen
jede Variable, welche auf xi einen Einuss ausübt. Es gibt also so viele q-
Übertragen auf das obige Beispiel lässt sich z.B. rzx wie folgt ausdrücken
Gemäÿ der Tatsache rxx = 1 und der Annahme rez x = 0 verkürzt sich der
rechte Ausdruck der Gleichung 2.23 zu pzx + pzy ryx und entspricht dem obi-
gen Ausdruck in Gleichung 2.17. Analog dazu verfährt man mit den anderen
Zum Schluss sei noch erwähnt, dass die Pfadkoezienten immer Ausdruck
eines sog. direkten Eekts sind. Denn auch wenn sie in die Berechnung
die Korrelationen benachbarter Variablen einbeziehen, so stehen sie dennoch
unmittelbar auf dem kürzesten Wege, der zwei Variablen verbindet, nämlich
Es gibt darüber hinaus noch einen sog. indirekten Eekt. Das ist ein
Eekt, welcher über mehrere dazwischenliegende Variablen verläuft.
Im obigen Beispiel (s. Abb. 2.4) hat die Variable x einen direkten Eekt
auf z, da sie durch einen Pfeil unmittelbar verbunden sind. Die Variable x
hat aber auch einen indirekten Eekt, welcher über y, also über zwei Pfade
welche auf dem Weg liegen multipliziert werden. Da es sich bei diesen Koef-
zienten um Werte < |1| handelt, wird bei zunehmender Anzahl an Schritten,
26
welche zwischen zwei Variablen liegen, das Produkt immer kleiner (da immer
mehr Faktoren, welche < |1| sind, miteinander multipliziert werden). Dies ist
logisch, denn je weiter weg zwei Variablen voneinander sind, umso weni-
ger können sie indirekt Einuss aufeinander ausstrahlen. Der Eekt verput
Es sei dann noch der Begri des totalen Eekts eingeführt. Der totale
Eekt erfasst sowohl den direkten als auch den indirekten Eekt. Er lässt
aufgelockert werden. Die Basis stellen manifeste Variablen aus einem Panel-
8
datensatz dar. Der Datensatz ist ktiv .
tiv, dass der Gesundheitszustand eine kausale Wirkung auf die Lebenszufrie-
denheit haben kann. Aber die umgekehrte Richtung ist ebenfalls denkbar.
Schlieÿlich hört man immer wieder von Theorien, in denen behauptet wird,
dass eine gute psychische Verfassung (und dazu gehört schlieÿlich eine ge-
lyse einbezogen:
27
• Residuum der Variablen y2 : ey2
Weiterhin soll angenommen werden, dass die Variablen auf einer 7-stugen
auf hingewiesen, dass der Datensatz vom Autor frei erfunden ist und die
Korrelationen sicherlich stark überschätzt sind. Aber gönnen wir uns mal
Korr. x1 y1 x2 y2
x1 0, 74 0, 87 0, 75
y1 0, 635 0, 816
x2 0, 63
y2
Hier lässt sich die oben eingeführte allgemeine Formel 2.22 anwenden,
sind):
28
rx2 x1 = px2 x1 + px2 y1 rx1 y1 (2.26)
chungen umgeformt und substituiert werden. Es ergibt sich zuerst für die
Stabilitätskoezienten :
Die Ergebnisse für das Beispiel sind in der folgenden Tabelle 2.3 aufgelistet:
Ohne sich zu weit aus dem Fenster zu lehnen, möchte der Autor eine kleine
29
Deutung der Befunde vornehmen:
Dann ist festzustellen, dass beide Variablen über die verstrichene Zeit rela-
tiv stabil in ihren Werten sind, wobei dies in einem stärkeren Maÿe auf p x2 x1 ,
also auf die Variable Lebenszufriedenheit zutrit. Während die Werte der
Korrelationen rx2 x1 und ry2 y1 recht nah beieinander liegen, macht sich die
ten Eekte. Das liegt in der Natur der Sache, dass gewisse Variablen in einem
bestimmten Zeitraum nicht so stark variieren. Dennoch lässt sich ein nach
Augenmaÿ signikanter Eekt von x1 nach y2 ausmachen. Der Wert ist höher
als der praktisch nicht vorhandene Eekt px2 y1 . Auch hier ist die Diskrepanz
koezienten.
Das würde die These stützen, dass die Lebenszufriedenheit durchaus einen
Eekt auf den Gesundheitszustand haben kann. Aber auch hier sei nochmals
sind. Eine echte Kausalität ist damit noch längst nicht nachgewiesen. Erstens
ist das zeitliche Vorangehen der wirkenden Variablen durch ein Paneldesign
Variablen vorliegt), zweitens ist nicht geprüft worden, ob das Modell kor-
worden sind.
Trotz aller Bescheidenheit wären solche Ergebnisse, wenn sie denn einem
echten Datensatz zugrunde lägen, für den Statistiker ein kleines Erfolgser-
lebnis.
Auÿerdem lieÿ sich zeigen, dass bereinigte Koezienten in der Lage sind,
vorzuheben, als das bei z.B. bivariaten Korrelationskoezienten der Fall sein
kann.
30
2.4 Das Ein-Indikatoren-Modell als Ansatz zur
Unterscheidung zwischen Veränderung und
mangelnder Reliabilität
In diesem Abschnitt betrachten wir wieder nur eine inhaltliche Variable
Merkmalen u.U. latente Gröÿen verbergen, welche auf die Messung einen
kausalen Einuss haben. So kann man hinter der Zustimmung eines Befrag-
länderfeindlichkeit vermuten.
Stellt man solch eine Verbindung zu latenten Gröÿen her, so werden in die-
lichkeit messen soll, normalerweise eine Reihe ähnlicher Items (sog. multiple
Indikatoren) vorgelegt, und nicht nur, wie im obigen Beispiel, lediglich eins.
Dies hat zum Vorteil, dass einerseits durch Techniken wie die der Itemana-
können und dass andererseits durch mehrere gute Indikatoren, welche als
Denn genau das ist ein groÿes Problem: Jede Messung ist mit einem Feh-
ler behaftet. Dies lässt sich nicht verhindern. Es muss allerdings angestrebt
werden, den Fehler möglichst gering zu halten und dafür zu sorgen, dass
möglich aufhebt. Das Konzept der latenten Variablen versucht, gerade solche
fehler sind Ausdruck fehlender Präzision bei der Messung. Je präziser ein
den hier angesprochenen Sachverhalt als die Frage nach der Reliabilität einer
31
Messung / eines Messinstruments.
Wenn nun eine gemessene Variable als einziger Indikator für eine latente
Variable betrachtet wird, dann wird hier der einfachste Fall modelliert: Das
true score variable. Geht man von einer Messung im Querschnittdesign aus,
so hat dieses Konzept keine Bedeutung, da sich aus einer einmalig gemesse-
nen Variablen nichts anderes als sie selbst konstruieren lässt. Aussagen über
Messfehler sind nicht möglich. Latente Variable und Indikator wären somit
redundant.
werden. Denn nun stehen, bei z.B. zwei Zeitpunkten, zwei gemessene Va-
riablen (und zwei latente) der Analyse zur Verfügung. Die zweite Messung
kann hierbei als eine Wiederholung der ersten Messung angesehen werden
Ohne sehr weit abzuschweifen, soll nun kurz auf die Grundlagen der klas-
plausibel darzustellen.
Jeder gemessene Wert x wird als Summe eines wahren Wertes und eines
Messfehlers begrien:
x=τ + (2.34)
Unter der Annahme, dass wahrer Wert und Messfehler in einer Messreihe
unkorreliert sind (vgl. Engel 1994: 32), lässt sich die Varianz von x [V arx ]
folgendermaÿen darstellen:
Je gröÿer der Anteil der Varianz von τ (wahre Varianz) an der Gesamtvari-
anz ist, umso geringer ist die Varianz von (Fehlervarianz). Des Weiteren: Je
präziser (also: reliabler) eine Messung über mehrere Objekte ist, umso klei-
ner ist die Fehlervarianz. Somit lässt sich Reliabilität (p) formal denieren
32
als Anteil der wahren Varianz an der Gesamtvarianz:
V arτ
px = . (2.36)
V arx
Das Problem hierbei ist: Die wahren Werte sind meist unbekannt. Ständen
sie zur Verfügung, dann wäre das Problem gelöst und man könnte mit ih-
nen statt mit den gemessenen Werten weiterrechnen. Ebenso ist die wahre
Varianz unbekannt.
teils darauf basieren, dass mehrere Messungen als Wiederholungen ein und
Ein einfaches und intuitives Verfahren ist die Test-Retest-Methode: Ein und
geführt. Die Korrelation dieser zwei Messungen gilt als Schätzung für Relia-
Das zentrale Problem dieser Methode, welches oben als Vorteil des Pa-
neldesigns diskutiert wurde, ist die Zeit, welche zwischen zwei Messungen
verstreicht. Nur wenn man annimmt, dass sich die wahren Werte einer Mes-
sung zwischen zwei Zeitpunkten nicht verändert haben, gilt die Korrelation
(vgl. Engel 1994: 32 ). Liegt eine Messung zu zwei Zeitpunkten vor, so lassen
10
sich die Beziehungen im folgenden Pfaddiagramm veranschaulichen :
10
Standard mit dem Graphikprogramm nicht zu verwirklichen war; Unterstrich steht für
wurde ausgeschrieben und mit error bezeichnet.
Index des Pfadkoezienten
Die Bezeichnung der Pfadkoezienten in der Graphik weicht etwas ab von dem bisher gewählten Standard, weil dieser
, τ
33
Error Tau2
p_tau1tau2
Tau1 Tau2
p_tau1x1 p_tau2x2
Error 1 Error 2
x1 x2
34
rx1 x2 = px1 τ1 px2 τ2 pτ2 τ1 (2.40)
dass die Reliabilität eines Messinstruments über die Zeit stabil bleibt, dann
Aber auch in diesem Falle hat die Gleichung zu viele, nämlich zwei Unbe-
neue Möglichkeiten. Unter der Annahme, dass τ1 keinen direkten Einuss auf
τ3 besitzt (vgl. Engel 1994: 36), gesellen sich zu der Test-Retest-Korrelation
rx1 x2 rx2 x3
p2xτ = rx1 x3
r
pτ2 τ1 = rxx1 xx3 (2.44)
2 3
r
pτ3 τ2 = rxx1 xx3
1 2
35
Dies ist einleuchtend, denn wenn die Werte des ersten und des zweiten Zeit-
aber plötzlich wieder viel stärker mit den ersten Werten zusammenhängen,
dann liegt dies die Vermutung nahe, dass etwas mit dem Messinstrument
nicht stimmt.
Hier ist also stillschweigend die Annahme implementiert, dass sich Verän-
Ein Prozess, bei dem sich vom ersten zum zweiten Zeitpunkt vieles wan-
delt (z.B. Veränderung der Institution Familie), dieser Wandel aber Orientie-
rungslosigkeit nach sich zieht und sich in Folge dessen zum dritten Zeitpunkt
eine Rückentwicklung zur Struktur des ersten Zeitpunkts vollzieht (z.B. die
Rückbesinnung auf alte Werte), würde von diesem Modell nicht identiziert,
vor allem die Höhe der Korrelation zwischen den entfernten Zeitpunkten t1
und t3 (im Zähler stehend) ausschlaggebend für die Beurteilung der Stabili-
Auf ein grundlegendes Problem sei an dieser Stelle noch hingewiesen: Man
darf nicht vergessen, dass eine solch saubere arithmetische Lösung wie die
obige nur unter den getroenen Annahmen möglich ist. Würde man nicht
unterstellen, dass
• die Residuen unkorreliert sind (gerade bei Paneldaten ist dies fragwür-
dig),
dann müsste man diese Sachverhalte ebenfalls modellieren, so dass sich mehr
Unbekannte als Gleichungen ergäben und in Folge eine rein rechnerische Lö-
36
Ab drei Messzeitpunkten ist es möglich, mit Panel-
daten rechnerisch zwischen wahrer Veränderung und
mangelnder Reliabilität zu unterscheiden!
auf Korrelationen), auÿerdem lässt sich das Modell zu einem multiplen Indi-
katorenmodell erweitern. Für Interessierte sei hier auf die Ausführungen von
zugeschnitten sind.
Gemeint sind hier vor allem lineare Modelle für manifeste Variablen. Im
also wieder verlassen. Stattdessen liegt der Fokus darauf, sich mit der Ein-
True-Score-Variable.
12dies geschah zwar bereits in dem Beispiel zur Pfadanalyse, allerdings wurde das Verfahren konventionell angewendet,
ohne speziell auf das Paneldesign hin modiziert zu werden.
37
Wenn auch dieses Kapitel speziell Regressionsmodellen gewidmet ist, so
schärfen die hier vorgestellten Kriterien, nach denen Modelle für Paneldaten
unterschieden werden, den Blick für die sich erönenden Möglichkeiten, aber
gehen.
Zunächst einmal muss, wie auch schon an früheren Stellen des Skripts deut-
lich wurde, eine einheitliche und präzise Darstellung der Individual- und der
Zeitebene gesichert sein. Nur auf diesem Wege können die unterschiedlichen
Regel mithilfe einer Index-Notation, wie sie auch schon aus der Querschnitts-
regression bekannt ist. Hier wird allerdings neben der Unterscheidung nach
Individuen auch ein Index für die Unterscheidung nach Zeitpunkten einge-
führt.
kann. x2,4 wäre folglich der x-Wert der 2. Person zum 4. Zeitpunkt einer
Untersuchung.
Nun lassen sich neben den Variablen auch die Koezienten eines Regres-
sionsmodells mit diesen Indizes versehen. Somit wäre im Falle der einfachen
13
Regression theoretisch das folgende Maximal-Modell denkbar:
mit
yit = Wert der abhängigen Variablen für die i-te Person zum Zeitpunkt t
ait = Regressionskonstante für die i-te Person zum Zeitpunkt t
bit = Regressionskoezient für die i-te Person zum Zeitpunkt t
xit = Wert der unabhängigen Variablen für die i-te Person zum Zeitpunkt
t
it = Residuum für die i-te Person zum Zeitpunkt t
Der Rückgri auf die Indizes verkürzt die Darstellung, da die Modellglei-
chung 2.45 im Grunde für jedes i und t als separate Gleichung ausgeschrieben
13
einfach bezieht sich hier auf den Sachverhalt, dass das Modell inhaltlich gesehen eine einzige unabhängige Variable
berücksichtigt dies lässt sich jedoch bedenkenlos auf eine multiple Regressionskonstruktion übertragen; dies gilt auch
für weitere Formulierungen von Regressionsgleichungen in diesem Abschnitt.
38
werden könnte:
viduelle Koezienten, die auch noch von Welle zu Welle variieren, würden
kennen.
schätzen, da die Anzahl der Freiheitsgrade negativ ist. Denn es stehen viel
zur Verfügung.
kant unterscheidet.
39
Zur Veranschaulichung dieses Gedankens sei ein Beispiel aufgeführt: Mal
von Mitarbeitern einer bestimmten Firma vor. Es wird ein einfaches Regressi-
chung wird im folgenden als globales Modell bezeichnet. Nun sei angenom-
Würden allerdings die Koezienten a und b nicht mehr als konstant für ein-
zelne Individuen betrachtet, so müsste das globale Modell reformuliert wer-
den müssen: yit = ai + bi xit + it (im folgenden: reformuliertes Modell). Nun
tiert (vor allem dann, wenn die Anzahl N der Individuen der Anzahl T der
Somit ist in diesem Beispiel zu vermuten, dass der auf globaler Ebene nicht
gleich zwischen den Personen zurückgeht. Dies könnte bspw. damit erklärt
generell eine hohe Fluktuation in dem Betrieb. Oder es nutzen einige produk-
produktive Mitarbeiter an einem Aufstieg kein Interesse haben und auf der-
einer fehlenden Systematik zwischen x und y. Diese sind aber derart mäch-
40
ne im globalen Modell nicht zum Vorschein kommt. Das intra-individuelle
werden. Es ist aber auch eine rein statistische Überprüfung mithilfe von F-
Tests möglich (vgl. Hsiao 2005: 14. wird hier nicht weiter behandelt).
lich plausibel. An dieser Stelle seien daher nur die gängigsten Modellformu-
lierungen genannt:
duen aber nicht über die Zeit variieren können. Gleichung 2.45 vereinfacht
sich zu:
i und t konstant sind. Dies würde zu dem sog. pooled model, also einem
41
einfachen Regressionsmodell führen, in dem die Panelstruktur ignoriert wird
Die Koezienten des in 2.50 formulierten Modells lassen sich mit der Me-
thode der kleinsten Quadrate (KQ) auf gewöhnlichem Wege schätzen. Die
Parameter der Modelle 2.47 und 2.48 bedürfen hingegen eines verfeinerten
Sachverhalte, und zwar 1.) die Frage, welche Quelle der Varianz (Variation
der Werte über Individuen vs. über Zeitpunkte) der im Regressionsmodell in-
volvierten Variablen berücksichtigt wird und 2.) die Frage, ob die Annahme
daten vorliegen.
Merkmale, deren Ausprägungen über die Zeit relativ konstant bleiben (z.B.
das Geschlecht) und welche, die sich relativ häug ändern können (z.B. die
male geben, die für Individuen relativ konstant sind, welche aber über die
Zeit variieren (z.B. die Inationsrate eines Landes). I.d.R. ist die Deklaration
Variablen liegen nun mal vor und ändern sich nicht, je nachdem, ob sie mit ei-
42
nicht -berücksichtigte unabhängige Variablen getroen werden. In diesem Fal-
le ist eine Unterscheidung sinnvoll, da sich mithilfe von sog. Dierenzenglei-
abhängiger Variablen eliminieren lassen nämlich derer, die über die Zeit
traler Stellenwert zukommt. Zum Schluss des Kapitels 2.5.2 werden die Vor-
Diese Modelle berücksichtigen den Einuss, den die abhängige Variable zeit-
versetzt auf sich selbst ausübt. Somit fungiert die inhaltlich gleiche Variable
als unabhängige Variable, gemessen vor der Messung der eigentlichen abhän-
gigen Variablen z.B. in der Form: yit = a + bxit + cyi,t−1 + it , wobei c
den zur zeitverzögerten Variablen yi,t−1 zugehörigen Regressionskoezienten
darstellt.
14 hier werden nur Kriterien aufgeführt, welche erst durch die Möglichkeiten, die Paneldaten erönen, bestehen. Natürlich
lassen sich Regressionsmodelle für Paneldaten ferner auch nach gängigen Unterscheidungskriterien dierenzieren, wie z.B.
nach Skalenniveau der involvierten Variablen.
43
• Modelle mit endogener Dynamik (also die Frage, ob unter den un-
Es sei noch gesagt, dass sich diese Kriterien bei der Formulierung eines
nen,
wird). Denn ehe die konkrete mathematische Umsetzung der Modelle bespro-
chen wird, sollen die sich dahinter verbergenden grundlegenden Ideen nach-
setzt werden. Im Abschnitt 4.7 des Anhangs werden einige Anregungen und
44
2.5.1.1 Die Dekomposition der Varianz einer Variablen bei vor-
liegenden Paneldaten
nen,
Optisch lässt sich dieser Sachverhalt vorstellen, indem z.B. die übliche 2-
hineinragende Dimension erweitert wird (also die Form eines Quaders an-
nimmt).
Wird nur eine Variable betrachtet, so ergeben die Daten wiederum eine
(O=Objekte, Z=Zeitpunkte):
O↓ Z → t1 t2 t3 t4
1 1,3 1,4 1,4 1,2
2 3 3,1 3,3 3,4
3 8,8 8,4 8,5 8,6
4 5,5 9 3 2,4
5 5,4 8,9 2,8 2,1
6 5,7 9,1 2,6 2,1
7 3 9,9 8 5
8 8 4 2,6 11
9 6,5 2,1 0 8,6
lysiert, so lässt sich nur eine Quelle der Variation feststellen: Werte einer
45
• Between Variation Variation zwischen den Objekten
Betrachtet man in der Tabelle 2.5 die Daten für die Fälle 1 bis 3 (zeilenweise),
so kann man eine Dominanz der between variation gegenüber der within va-
riation feststellen. Die Werte der Objekte bleiben über die Zeitpunkte relativ
konstant, während sich die Werte zwischen den Objekten relativ stark un-
welche bzgl. einer Einstellung jeweils eine eher gefestigte Meinung haben.
Die Fälle 4 bis 6 weisen genau das Gegenteil auf: Die Werte der Objek-
aber sind sie relativ ähnlich. Within variation dominiert hier. Dies könnte ei-
ne Gruppe von Personen sein, welche sich z.B. bzgl. eines Verhaltensmusters
relativ ähnlich sind. Da sich aber zwischen den Messungen starker Wandel
Schlieÿlich weisen die Fälle 7 bis 9 beide Arten der Streuung im ähnlichen
Ausmaÿ auf.
Nun stellen sich die Fragen, wie diese Varianz-Dekomposition mit der Idee
diese Fragen zu beantworten, muss der Umweg über die Idee der Varianz-
mehr ist diese Möglichkeit immer gegeben, wenn sich die Fälle eines Da-
nämlich die Werte einer beliebigen Variablen x in der in Tab. 2.5 vorgeführten
zweidimensionalen Form auühren. In der formalen Darstellung der Werte
der Laundizes umsetzbar. Der erste Index gibt die Gruppe an, derer ein
46
Objekt zugehört, der zweite Index erlaubt die Identizierung des Objektes
innerhalb der Gruppe. Ein Beispiel für diese Formalisierung könnte die Er-
gänzung einer Variablen x um die Indizes j mit j = 1, 2, ..., nk und k mit
gen Gruppe mit K = Anzahl der Gruppen. j steht für den Laundex der
der zur Gruppe k gehörenden Objekte. Wird bspw. als eine Variable x die
son und einem Zeitpunkt nichts anderes als einen Spezialfall der Einteilung
von Objekten in Gruppen dar: Die Gruppen sind die einzelnen Personen
(k = i)16 und die Mitglieder einer Gruppe k sind die Werte einer Person k
im Zeitverlauf (j = t). Auch die umgekehrte Gruppenzuweisung mit k =t
und j = i ist möglich. Es wird in den folgenden Ausführungen geklärt, warum
es sinnvoll ist, eine Person als eine Gruppe aufzufassen.
analytisch gesehen ist eine solche Gruppierung dann sinnvoll, wenn vermu-
tet wird, dass die Gruppenzugehörigkeit einen Einuss auf eine Variable y
hat. Genau dies entspricht der Grundidee einer (im einfachsten Falle ein-
17
faktoriellen univariaten) Varianzanalyse: Über die Zerlegung der Varianz
geprüft, inwieweit die Gruppierung einen Einuss auf die gesamte Streuung
der Variablen y hat. Dieser Einuss ist umso stärker, je homogener die Grup-
Zwischengruppenvarianz).
Ein Beispiel für einen mittleren Einuss der Gruppierung zwischen bspw.
15Die Setzung des Kommas zwischen den beiden Indexwerten beugt lediglich der potentiellen Gefahr vor, die beiden
Werte fälschlich als einen Zahlenwert 54 zu lesen.
16entsprechend der bisherigen Notationen: einerseits s. Beginn von 2.5 (Dierenzierung der zwei Panelebenen), und
andererseits s. vorheriges Beispiel zur allgemeinen Notation im Falle gruppierter Objekte.
17An dieser Stelle kann keine erschöpfende Abhandlung über die Varianzanalyse erfolgen; es sei auf Backhaus (2006)
und auf das uni-interne Skript zu multivariaten Analyseverfahren (Stein, Pavetic, Noack) verwiesen.
47
de ktive Konstellation zurückgehen: Unter den ledigen Personen (k = 1)
weisen die meisten einen ähnlich niedrigen Zufriedenheitswert auf, sind also
mittelwert y2. Nur die Gruppe der Geschiedenen (k = 3) folgt nicht dem
ten, dass die Werte einer abhängigen Variablen y im Falle k = i für jedes
Individuum über die Zeit konstant bleiben, sich aber zwischen den Individu-
en unterscheiden. Bevor diese Feststellung weiter vertieft wird, soll erst kurz
Die unabhängige Variable, welche die Gruppierung deniert, kann ein be-
blen, welche nicht als quasi-metrisch behandelt werden können. Für (quasi-
48
der Schätzung von Regressionskoezienten der volle mathematische Gehalt
dieser Variablen ausgenutzt wird. So werden z.B. bei der metrischen Varia-
tet. Es wird aber nicht, wie in der Regressionsanalyse, die Information der
Abstandes zwischen 157 und 163 verarbeitet. Ferner führt bei metrischen
Variablen mit vielen Ausprägungen eine zu feine Gruppierung dazu, dass die
meisten Gruppen nur sehr schwach besetzt sind. Die aus einer Stichprobe
Varianz darstellen.
Aber im Prinzip folgen sowohl die Regressions- als auch die univariate Va-
gen in Hinblick auf unabhängige Variablen. Es liegt daher nahe, beide An-
der linearen Regression würde dies über die Aufnahme nominalskalierter Va-
22
riablen in Form von Dummy-Variablen (pro Gruppe ein Dummy) funk-
lassen sich metrische unabhängige Variablen in Form von sog. Kovariaten be-
ble und eine abhängige Variable betrachtet, dann beziehen sich die über die
Anhand dieser Verbindung wird deutlich, dass im Endeekt ein und diesel-
22 Technisches Detail: Um die OLS-Schätzung mathematisch zu ermöglichen, muss ein Dummy in der Formulierung der
Regressionsgleichung weggelassen werden; die entsprechende Gruppe wird dann durch die Regressionskonstante repräsen-
tiert.
23 Auch diese Aussage muss technisch präzisiert werden. Denn der Gruppenmittelwert der in der Gleichung weggelassenen
49
Fall einer Gruppierungsvariablen und einer abhängigen Variablen y , entspre-
chend obiger Notation folgende Gleichung aufstellen:
K nk nk
1 XX 1 X
ak = y k = y − ∆k = yjk − (y − yjk ) (2.52)
n k=1 j=1 nk j=1
Der Gruppenmittelwert lässt sich somit trivial als die Dierenz des Ge-
1
Pnk
samtmittelwertes von ∆k schreiben, wobei formal gilt ∆k =
nk j=1 (y −yjk ).
Inhaltlich steht ∆k eben für den Eekt der Gruppe k, entspricht also dem
Variable x gilt:
rung benannt und auf die Paneldaten-Situation übertragen werden: Aus vari-
Einuss der Gruppierung auf y unter Kontrolle eben dieser Kovariate abge-
schätzt werden. Wird zu dem obigen Beispiel als Kovariate x das persönliche
Nettoeinkommen der Probanden hinzugenommen, so lieÿe sich der Einuss
50
friedenheit quantizieren. Beispielsweise würde der Eekt eliminiert, der ent-
steht, wenn Personen durch eine Heirat automatisch aufgrund des Wechsels
25
der Steuerklasse einen höheren Nettoverdienst haben. Der vom Familien-
stand ausgehende Einuss bezieht sich also soz. auf die Lebenszufriedenheit,
werden. Und genau diese Perspektive ist für die Betrachtung von Paneldaten
nun bei vorliegenden Paneldaten ein Individuum eine Gruppe darstellt, dann
lassen sich mit Gl. 2.53 entsprechend die individuellen zeitkonstanten Eek-
den, muss man sich die Grundidee der der Varianzanalyse nochmals
Mittelwert dar. Dieser lässt sich begreifen als eine Art zeitkonstan-
25 wobei sich hier natürlich die kritische Frage stellt, ob nicht dieser Eekt in Hinblick auf die Lebenszufriedenheit durch
ein oft damit einhergehendes gleichzeitiges Abfallen des Nettoäquivalenzeinkommens sogar überkompensiert wird.
51
lauf diskutiert. Angewendet auf Gl. 2.53 und den damit verbundenen rech-
einussen. Der in Gl. 2.53 geschätzte Koezient b würde dann den Eekt
und Weise lassen sich also relativ zeitkonstante Eekte, die eigentlich un-
bekannt sind, explizit mitmodellieren und führen unter der Annahme, dass
26
diese zeitkonstanten Variablen in ihrer Summe einen signikanten Eekt
dellspezikation.
richtig ist nun klären, was den Unterschied zwischen xed- und random-
eects-Modellen ausmacht.
Die Frage nach dem Unterschied zwischen xen und zufälligen variablen Re-
26
Es muss bei einzelner Betrachtung dieser Variablen noch nichtmals eine
Somit muss das Kriterium nicht erfüllt sein, dass alle zeitkonstanten Variablen einzeln einen signikanten Eekt haben.
Variable einen signikanten Eekt haben.
52
die inferenzstatistische Grundidee deutlich werden, dass Eigenschaften von
Bevor also überhaupt eine Stichprobe gezogen wird, Daten erhoben werden
y = a + bx + (2.54)
mit
a = Regressionskonstante
b = Regressionsparameter zur Variablen x
= Residuum.
Nun wird aus G eine Zufallsstichprobe mit n Elementen gezogen und die
experimentellen Design kann nämlich der Reiz, also die Ausprägung der x-
Variablen kontrolliert gesetzt werden. Auch wenn unabhängige Variablen ei-
ner linearen Regression als metrisch angenommen werden, so wird hier (auch
53
wie Merkmalskombinationen der x-Variablen existieren.
In diesem Verständnis entspricht die zufällige Auswahl einer Person für ein
Prozess der Ziehung einer Person aus der Subpopulation der Personen, die
im Falle x = 0 zu verstehen. Nun wird eine aus der Population x=1 gezo-
gene Person einem Reiz ausgesetzt und reagiert auf diesen Reiz, produziert
also scheinbar einen y -Wert. Doch diese Auassung muss korrigiert werden,
wenn angenommen wird, dass in G bereits vor dieser Untersuchung ein fes-
uns bekannt).
turen selten realistisch anzunehmen, dass y immer perfekt durch den Term
a + bx erzeugt wird. Daher ist in der Gleichung ein Störterm enthalten, wel-
cher zufällige Abweichungen von der perfekten, aber unrealistischen linearen
y charakterisiert wird, fängt die Messung von y letztlich die Abweichung von
diesem idealen linearen Zusammenhang ein. Es wird demnach, gegeben dem
sen, welche neben der festen Wirkung von x einen Einuss auf die Messung
von y haben. Da oben angenommen wird, dass der Einuss von x auf y durch
ist und folglich korrekt speziziert ist, weist das Residuum keine Systematik
delt, ist folglich auch y als eine Zufallsvariable aufzufassen (von Auer
54
2007: 68f.). Damit ist eine klare analytische Unterscheidung zwischen der un-
b0 = (b1 , ..., bK ) erweitert werden. Folglich lässt sich die einfache Re-
y =a+ b0 x +
der Residuen als Zufallsvariablen lassen sich einige Annahmen über Regres-
ist bedeutend für die Einschätzung, ob ein Modell oder Teile des Modells
korrekt speziziert sind. Die Annahmen über das Residuum als Zufallsva-
x0 , erlaubt den Nachweis, dass es sich bei den Schätzern nach dem Kleinste-
27
Quadrate-Prinzip (KQ-Prinzip) um BLUE-Schätzer handelt (vgl. von Au-
er 2007: 83, 430). Ohne ins Detail zu gehen sei kurz erwähnt, dass dieser
0
Nachweis deshalb gelingt, weil die Eigenschaft der Nicht-Zufälligkeit von x
wie z.B. einer Befragung. Da in einer Befragung die x-Werte nicht als Reize
manipuliert werden können, müssen sie streng genommen ebenfalls als sto-
27 BLUE steht für den besten (=ezientesten) Schätzer aus der Gruppe der unverzerrten linearen Schätzer (vgl. allgemein
zu den Voraussetzungen der BLUE-Eigenschaft von Auer 2007: 74).
28 Denn es gilt für eine nicht zufällige, xe Gröÿe x, dass ihr Erwartungswert E(x) = x. Diese Vereinfachung gegenüber
den Erwartungswerten von Zufallsvariablen ist für die angesprochene mathematische Beweisführung entscheidend.
55
kam. Es lässt sich aber mathematisch nachweisen, dass mit zunehmendem
gigen Variablen nicht in sich zusammenbricht, gleichzeitig aber gerade auf der
stehen. Die mit dieser Unterscheidung einhergehende Frage stellt sich in Be-
zug auf die Behandlung der variablen Konstante ai :29 Soll ai als eine xe
(F-Fall) oder als eine Zufallsvariable (Z-Fall) aufgefasst werden? Auf Basis
zen die Unterscheidung zwischen dem F- und dem Z-Fall für die Interpreta-
2.53 und 2.48 und der obigen Erweiterung auf den Fall multipler Re-
29 i stellt entsprechend obiger Notationen, z.B. Gl. 2.48, den Laundex für die einzelnen Objekte in der Querschnittsbe-
trachtung dar.
56
mit
tung
y= Abhängige Variable
parametern
Variablen
a= Regressionskonstante
liegt.
nur die within-variation als Variations- und somit Informationsquelle für die
0
Berechnung des Einusses von x it auf yit genutzt. Ein Regressionskoezient
0
in einem xed-eects-Modell sagt demnach aus, wie sich yit gegeben x it im
57
gehalten werden. Dies stellt eine einseitige Fokussierung der zeitlichen Ent-
0
wicklung zwischen x it und yit in den Vordergrund. Die explizite Modellierung
von unabhängigen Variablen, die zeitkonstant sind und die a priori einen Ef-
fekt auf yit haben, ist nicht möglich allein schon mathematisch nicht (s.u.).
für die Analyse von Bedeutung sind, berechnet werden, da sie sich vorher
schon durch die explizite Modellierung von ai als xe Variable implizit her-
ausgerechnet haben.
ums aufgefasst und gehört somit zu den Zufallsvariablen. Sie stellt, gegeben
Folglich gilt nicht mehr die Annahme, dass die Kovarianz von Residuen zweier
Diese Erkenntnis ist nicht nur mathematisch, sondern auch intuitiv nach-
men ein und derselben Person zu zwei verschiedenen Zeitpunkten nicht als
58
(vgl. Hsiao 2005: 35; von Auer 2007: 74 ). Folglich muss das Vorgehen bei
Ohne dieses Prinzip mathematisch zu erläutern sei gesagt, dass auf diesem
schen xit und yit wird auf diesem Wege korrekter berechnet, da im Gegen-
satz zum z.B. pooled-Modell (s. Gl. 2.50) der panelspezischen Struktur der
Nun stellt sich die Frage nach der Interpretation der GLS-Schätzer im
random-eects Modell: Es lässt sich mathematisch zeigen, dass auf dem Weg
der abhängigen Variablen verarbeitet wird (vgl. Hsiao 2005: 37f.): Der GLS-
davon abhängig, wie groÿ die der Anteil der Varianz der Fehlerkomponente ai
an der Gesamtvarianz der Residuen ist. Das random-eects-Modell ist somit
schen dem xed-eects-Modell (es wird nur die within-Variation der y -Werte
im Zeitverlauf unter der Kontrolle inter-individueller Unterschiede berück-
sichtigt) und dem pooled-Modell (s. Gl. 2.50; die Unterscheidung zwischen
rechnen und daher nur die within-variation der abhängigen Variablen yit
30 Das 0
between-eects-Modell ignoriert die within-variation völlig: Zunächst wird pro involvierte Variable x und y für
PT
jede Personi ihr eigenes arithmetisches Mittel entlang der Messzeitpunkte errechnet; z.B. für y : y i = 1
t t=1 yit (mit
T = letzter Zeitpunkt). Schlieÿlich wird mit diesen neuen Mittelwertsvariablen eine normale Regression nach der
KQ-Methode durchgeführt.
59
berücksichtigt wird.
auch bei der Regression des pooled-Modells, sowohl die within- als auch
ziert. Diese Dierenzierung wird erreicht, indem mit der Extraktion von ai
als eine zeitinvariante Residualkomponente des Gesamtresiduums einer der
wird: Der Korreliertheit von zeitversetzten Residuen ein und derselben Per-
son.
Nachdem nun die Unterschiede zwischen dem xed- und dem random-
eects-Modell geklärt sind, stellt sich die Frage, nach welchen Kriterien in
soll. Um diese Frage zu beantworten wird zunächst pro Verfahren die konkre-
Der nächste Abschnitt diskutiert die Vor- und Nachteile der FEM- und
60
die für Individuen i konstante Regressionskonstante a erweitert wird. a ist
Eigentlich stellt auch schon Gl. 2.58 eine multiple Regression dar, da neben
y vorstellen.
Die Gröÿe ai ergibt dann in Addition mit der Regressionskonstante a die
Stelle, an der die Regressionsgerade der i-ten Person die y-Achse schneidet
Ferner ist zu bedenken, dass b für alle Personen i konstant ist. Daher stel-
der liegende Geraden dar. Der ai -Wert gibt an, um wieviel y -Einheiten die
Schnittpunkt mit der y -Achse ergibt sich aus a + ai .32 Die relative Höhe der
gen erwähnt, dass eine Möglichkeit zur Bestimmung von ai darauf basiert, für
jedes Individuum eine Dummy-Variable zu bilden und sie zu den unabhängi-
und der x-Variablen können dann mit der gewöhnlichen KQ-Methode ge-
schätzt werden.
32 Wird in vielen Regressionsmodellen a durch Zentrierung der Variablen weggelassen, so bedeutet dies nichts anderes,
können
Variablen zu arbeiten, da durch die Einführung von Dummy-Variablen, welche per Denition
, im endgültigen Modell sowieso eine Regressionskonstante a 6= 0 auftaucht.
nicht zentriert werden
als a = 0. Die eben erwähnten Zusammenhänge gelten allerdings genauso; in diesem Modell ist es sinnlos, mit zentrierten
33 Referenzkategorie
Von n wird 1 abgezogen, da der letzte bzw. irgendein Fall (in anderen Kontexten wird dieser Fall als
bezeichnet) sich automatisch dadurch ergibt, dass alle Dummy-Variablen die Ausprägung Null aufweisen; der n-te Dummy
wäre somit redundant.
61
k+n−1 unabhängige Variablen. Die Anzahl der zu schätzenden Pa-
vorhandene Anzahl n der Fälle. Daher wären, wenn Daten nur zu ei-
nem Zeitpunkt vorliegen würden (T = 1), die Parameter von 2.58 nicht
schätzbar, da nicht genügend Informationen vorhanden wären.
Somit kann ein individueller Eekt nur dann errechnet werden, wenn
rechtigung (s.o.).
Es ist oensichtlich, dass mit einem hohen n auch die Anzahl der zu schät-
zenden ai -Koezienten steigt. So kann die Berechnung eines FEM-Modells
notwendig.
Die ai -Werte lassen sich zudem relativ leicht ermitteln. Wie oben im Kon-
wert yi. Konkret ergibt die KQ-Schätzung für Gl. 2.58 (vgl. Hsiao 2005: 33):
ai = y i − a − bxi
b (2.59)
mit
ai = Geschätzter ai -Wert
b (hier nach der KQ-Methode)
34 Dies würde sich rechnerisch darin bemerkbar machen, dass im Falle von Querschnittsdaten alleine die lineare Ver-
knüpfung von Individual-Dummy-Variablen die abhängige Variable vollständig erklären würde unabhängige Variablen
wären überüssig (und deren Koezienten könnten wg. k + n − 1 > n gar nicht erst berechnet werden), das Modell würde
allerdings auch nichts aussagen.
62
Es wird also von dem individuellen Mittelwert yi der Term (a + bxi ) abge-
zogen. Die individuelle Konstante ai ist somit der individuelle y -Mittelwert,
Durch einen rechnerischen Trick (vgl. Hsiao 2005: 32) lässt sich b schät-
zen, ohne dass die einzelnen ai -Werte vorher bestimmt sein müssen. Somit
men. I.d.R. werden die ai -Werte auch nicht zur Interpretation gebraucht.
Man interessiert sich hauptsächlich für den Einuss von x auf y , wenn die in-
dividuellen zeitinvarianten Merkmale herausgerechnet sind. Eine aufwendige
z.B. wenn Daten aus einer sehr kleinen Grundgesamtheit vorliegen und ihre
Elemente so spezisch sind, dass ihre ai -Werte einzeln analysiert werden sol-
35
len. Bei wenigen Fällen ist aber wiederum die Anzahl k +n−1 relativ klein.
ger Ausführungen, z.B.: 2.55, 2.56 und 2.57 deniert. Ferner stehen n und T
respektive für den letzten Wert von i bzw. t).
Kontext: Kontext:
Variable x Variable y
Variable variiert über i (Objekte) und t (Zeitpunkte): xit yit
Arithmetisches Mittel des Objektes i xi yi
Globales arithmetisches Mittel (über alle i und t) x y
Unter Verwendung von 2.59 bzw. des oben erwähnten rechnerischen Tricks
kann nun nach der KQ-Methode b aus Gl. 2.58 geschätzt werden (warum die
Formel in blauer Farbe erscheint, wird an späterer Stelle geklärt):
35z.B. wenn die Elemente der Grundgesamtheit zusammengenommen die Menge aller Bundesländer Deutschlands bilden
und die Ausgangsniveaus der einzelnen Bundesländer miteinander verglichen werden sollen.
63
n X
X T
(xit − xi )(yit − y i )
bbf = i=1 t=1
(2.60)
Xn XT
(xit − xi )2
i=1 t=1
mit
bbf = Schätzer von b aus Gl. 2.58 nach der KQ-Methode. Das f symbolisiert
das f ixed-eects-Modell.
abgezogen werden. Dies ergibt sich rechnerisch eben aus der Tatsache, dass
gen der Werte einer Person von ihrem eigenen arithmetischen Mittel, welche
Die Schätzung bbf ist also zu interpretieren als der Betrag, um den der
geschätzte y -Wert steigt, wenn x um eine Einheit steigt und (!) alle Unter-
64
stellt innerhalb der Matrix einen Spaltenvektor dar. Wichtig ist, dass
Schätzung im REM:
Wie oben gezeigt, berücksichtigt das FEM nur die in Paneldaten enthaltene
within-variation. Das andere Extrem, in dem nur die Informationen der
Modell (BEM). Warum dieses Modell im Kontext des REM vorgestellt wird,
wird im weiteren Verlaufe deutlich.
Wie oben in einer Fuÿnote erwähnt, ignoriert das BEM die within-variation
völlig: Zunächst wird pro involvierte Variable x und y für jede Person i ihr
Sinnvoll ist diese Anwendung, wenn das Ausmaÿ der within-variation in-
haltlich uninteressant ist und statistisch gesehen gering ausfällt. Die Zusam-
nen. Ist hingegen eine klare Systematik in der zeitlichen Entwicklung der
y i = a + bxi + i (2.61)
Die Schätzung bbb (das kleine b steht für between) des Koezienten im
BEM lautet dann (die Wahl der Farbe rot wird weiter unten erläutert):
n
X
(xi − x)(y i − y)
bbb = i=1
n (2.62)
X
2
(xi − x)
i=1
Nun zurück zum REM: Wie oben erläutert wurde, wird im REM ai nicht
65
mehr als xe Gröÿe sondern als Zufallsvariable aufgefasst, die eine Kompo-
nente des Residuums darstellt. Dies schlägt sich auch in der Ausgangsglei-
chung des REM nieder. Angelehnt an die Gleichungen 2.55, 2.56 und 2.57
lautet sie:
Wenn also ai zum Residuum gehört, dann lassen sich die zwei Komponenten
ai + it zusammenfassen zu uit . Eingesetzt in 2.63 ergibt sich:
Oben wurde bereits erläutert, dass die Residuen uit im REM nicht als
verletzt, auf der die KQ-Schätzung basiert. Die Korreliertheit von uit lässt
sich exemplarisch für die Kovarianz von zwei Residualvariablen ui1 und ui2
(mit t=1 und t = 2) zeigen:
X
Cov(ui1 ui2 ) = (ui1 ui2 )
X
= [(ai + i1 )(ai + i2 )]
X
= [a2i + ai i2 + i1 ai + i1 i2 ] (2.65)
X X X X
= a2i + ai i2 + i1 ai + i1 i2
X
= a2i
P
• Die Fehler it sind untereinander unkorreliert, daraus resultiert i1 i2 =
0
66
Mit der letzten Zeile von 2.65 wird also die oben getroene Annahme, dass
zen für i und t konstant. Folglich vereinfacht sich Gl. 2.66 zu:
Gleichungen 2.65 und 2.67 konstituieren die Ausgangslage des REM, dessen
Koezienten nun mit einem alternativen Schätzverfahren bestimmt werden
müssen. Dann die KQ-Methode setzt die Unkorreliertheit von uit voraus.
leitung der GLS-Schätzung zeigt Hsiao (2005: 35.). Hier liegt der Fokus
auf dem Verständnis der resultierenden Formel des GLS-Schätzers: Bei der
n X
X T n
X
1
T
(xit − xi )(yit − y i ) + G · (xi − x)(y i − y)
bbr = i=1 t=1 i=1
(2.68)
n X
X T n
X
1
T
(xit − xi )2 + G · (xi − x)2
i=1 t=1 i=1
mit:
V ()
G= V ()+T ·V (a)
Die Gröÿe G stellt in Gl. 2.68 den Faktor dar, mit dem die Komponenten
67
der BEM-Schätzung (rote Farbe) gegenüber den Komponenten der FEM-
Schätzung (blaue Farbe) gewichtet werden. Somit kann der Schätzer des
REM-Modells bbr als ein gewichteter Durchschnitt aus dem Schätzer des
FEM- und dem des BEM-Modells gesehen werden. Die Gewichtung hängt
von G und somit von dem Anteil der Varianz des nicht-zeitkonstanten Resi-
über die Zeit und die Individuen variieren. Die Anteile des FEM-Schätzers
und des BEM-Schätzers am REM-Schätzer sind dann gleichgewichtig, so
dass man eigentlich nicht weiter zwischen i und t zu dierenzieren braucht. Es
würde die einfache KQ-Methode des pooled-Modells (s.o.) ausreichen. Somit
würde der Schätzer bbr gegen den Schätzer des pooled-Modells, bbp konvergie-
ren, mit:
n X
X T
(xit − x)(yit − y)
bbp = i=1 t=1
(2.69)
Xn XT
(xit − x)2
i=1 t=1
Vorteile des REM sind u.a. darin zu sehen, dass beide Quellen der Variati-
bietet das REM eine mittlere Lösung zwischen FEM und BEM einerseits
und FEM und dem pooled-Modell andererseits. Wenn V (a) signikant von
Null verschieden ist, dann ist das REM auch korrekter speziziert als das
pooled-Modell nach der KQ-Methode.
In welchem Falle eine Entscheidung zugunsten des REM oder FEM fal-
len sollte, ist auch an den Entstehungsmechanismus der Daten geknüpft.
68
falls stichprobe dar, dann unterliegen die durch ai charakterisierten Ausgangs-
lagen der Objekte selbst einer zufälligen Auswahl. In diesem Falle wäre ei-
modellieren.
Entlang dieser Logik eignet sich FEM mehr für spezische Objekte einer
Grundgesamtheit, deren Auswahl keinem Zufallsprozess unterliegt. Dies ist
vorliegen z.B. wenn über alle Mitglieder des Bundestages Daten zu ihren
abhängen kann, ist es sinnvoller, die Ausgangslagen dieser Mitglieder als xe
teil des REM: Aus der Unterscheidung zwischen xen und zufälligen Gröÿen
ergibt sich nämlich generell eine für Regressionsmodelle logische Annahme:
ist es nicht unplausibel anzunehmen, dass diese Einzelgröÿen auch mit den
In diesem Falle kann doch das FEM die bessere Alternative sein auch wenn
die Objekte einer Zufallsstichprobe entstammen. Dann steht nämlich ai nicht
mehr für eine zufällig gezogene Person, derer Ausgangslage sich aus vielen
Vielmehr repräsentiert der ai -Wert dann eine oder wenige bedeutsame Einzel-
variablen, die auf diesem Wege zurecht als xe Gröÿen berücksichtigt werden
können.
Wie so oft in der Statistik verbleibt die Entscheidung FEM vs. REM in der
Angemessenheit des Anwenders. Dabei sollten vor allem inhaltlich plausible
69
2.5.1.7 FEM vs. REM ein Beispiel
Die konkrete Anwendung von FEM und REM soll nun anhand eines einfachen
Beispiels vollzogen werden: Es wurde ein sehr kleiner ktiver Datensatz vom
37
Autor konstruiert. Dieser Datensatz weist folgende Eckdaten auf:
• eine unabhängige Variable xit : Fettgehalt des Essens, welche eine Per-
son i zum Zeitpunkt t täglich durchschnittlich zu sich nimmt
das Ausmaÿ des Essens von fetthaltigen Gerichten das Gewicht positiv be-
einusst.
dann lieÿe sich mit den Daten eine einfache pooled-Regression, entsprechend
Schon nach Augenmaÿ lässt sich ein leichter positiver Zusammenhang zwi-
mit r2 = 0, 66
mit 66% der erklärten Varianz von y relativ hoch. Dies stützt die Hypothese
Im nächsten Schritt soll nun das FEM nach Gl. 2.58 berechnet werden.
Aus Veranschaulichungsgründen wird mit der Dummy-Variante gearbeitet.
70
In diesem Fall werden drei Dummy-Variablen (n − 1 = 4 − 1 = 3) eingeführt,
so dass Gl. 2.58 ausgedrückt wird als:
4.2 abgelegt. Es ist zu sehen, dass auch die letzte Person des Datensatzes,
alle Dummy-Variablen nehmen den Wert Null an. Ihr an ergibt sich somit
yit = 142 − 45, 4d1 − 32, 31d2 − 10, 67d3 − 0, 702xit + it (2.73)
mit r2 = 0, 9969
I.d.R. sind die Koezienten einzelner Individuen nicht von Interesse. Hin-
2
gegen sehr von Belang sind der Koezient b und r . Es stellt sich die Frage,
Man sieht, dass das Bestimmtheitsmaÿ drastisch gestiegen ist (um mehr
Nun ist zu fragen, wie b im Kontext des Beispiels zu interpretieren ist und
38 Fragen nach der Signikanz von Koezienten sollen hier ausgeklammert werden, da schlieÿlich ein erfundener und
kleiner Datensatz vorliegt
71
Wie oben mehrfach erwähnt, ist ein Regressionskoezient einer unabhän-
Wie an Gl. 2.60 deutlich wird, werden sowohl im Zähler als auch im Nenner
des Schätzers nur Abweichungen der x- und y -Werte von den individuellen
n X
X T
(xit − xi )(yit − y i )
bbf = 1 · i=1 t=1
(2.74)
n C
Die Übereinstimmung in der x-Varianz ist im Beispiel für die ersten beiden
Personen A und B gegeben:
Zuerst wird für diese Personen eine Regression mit jeweils drei Wertepaaren
(xt |yt ) errechnet sozusagen als Analyse des Zusammenhangs der Werte
Wird nun ein FEM nur für diese beiden Personen gerechnet, dann er-
Stelle wird nochmals deutlich, dass sich das FEM nur der within variation
bedient.
72
39
negative Richtung auf, während das Gesamtsystem einen positiven Trend
verzeichnet.
Es gilt zuerst tendenziell: Je fettiger das Essen, umso mehr Gewicht. Für
eine einzelne Person gilt aber entlang der Zeitachse: Je fettiger das Essen,
der Individualebene umkehrt. Gehen wir nun davon aus, dass x die abhängi-
ge Variable ist. So lautete die Hypothese auf der Individualebene: Je mehr
Es könnte hier also ein rekursiver Prozess derart stattnden, dass wenn
die Zunahme mit der Reduktion von fettigem Essen reagieren. Umgekehrt,
abzunehmen, dann werden sie nachlässig bei der bewussten Ernährung, und
essen wieder fettiger. Beide Fälle sind Formulierungen eines negativen Zu-
Auch wenn diese Erklärung sicherlich nicht ganz der Realität entspricht,
sehr vereinfachend ist und, wenn überhaupt, dann nur auf bestimmte Perso-
entlang der Zeitachse, im Schnitt über alle Individuen, eine ganz andere
Im Kontext dieses Beispiels wird nochmals die Reduziertheit des FEM deut-
lich: Wird die Analyse auf die Variation innerhalb einzelner Individuen re-
duziert, dann sagt das Modell prinzipiell nichts darüber aus, wodurch die
eine Person mehr als eine andere (bei kontrollierter Körpergröÿe)? Das fetti-
39dies lässt sich am Datensatz bereits mit dem Auge erkennen, wenn nur die Wertepaare eines Individuums betrachtet
werden
73
ge Essen als erklärende Variable reicht bei Leibe nicht aus, denn ausgehend
von dem einfachen Modell in Gl. 2.70 bleibt noch ein groÿer Prozentsatz
Ein sehr hoher Wert von r2 im FEM darf nicht darüber hinweg täuschen,
müssen aber noch selbst erklärt werden. Es wäre also zu überlegen, ob die
delt.
Berechnung eines FEM mit z.B. STATA einfach realisierbar ist. Dort ist
Format gebracht werden und es muss deniert werden, welche Variable die
Ist dies getätigt, dann reicht ein Befehl aus, um das FEM zu berechnen:
xtreg y x, fe
wird. Daraufhin können beliebig viele unabhängige Variablen (aber nicht (!!!)
Entsprechend der Gl.2.64 lautet auch für das hier behandelte Beispiel die
74
yit = bxit + uit (2.75)
Die GLS-schätzung nach Gl. 2.65 ergibt einen Koezient von b = −0, 578.
Es zeigt sich, dass auch in einem Verfahren, in dem sowohl die within- als
auch die between-variation in die Analyse einieÿen, der Koezient auf einen
deutet. Dies ist eine Tendenz, welche erst unter Beachtung der Panelstruktur
zum Vorschein gekommen ist, da, wie bereits in Gl. 2.70 gezeigt wurde, eine
Rechnerisch ergibt sich der negative Koezient aus der Tatsache, dass das
Gewicht G aus der Schätzformel 2.68 mit 0,00349 sehr klein ausfällt. Folglich
wird die Between-Variation von y bzw. die Between-Kovariation von x und
Der kleine Gewichtungswert von G ist wiederum, wie unterhalb der For-
mel 2.68 zu sehen ist, auf einen in Relation zu V () hohen Schätzwert der
deutlich gröÿer sind, als die Unterschiede innerhalb der Personen (relativ
niedrige Within-Varianz). Dies gilt sowohl in Hinblick auf die Varianzen von
x und y als auch für die Kovarianz zwischen den beiden Variablen. Da mit
G heruntergewichtet.
Zunächst sind unabhängig von der Modellwahl immer drei Arten von Deter-
75
)Variation von x und y berücksichtigt wird. R-sq: overall ist der Anteil
der gesamten Varianz von y , welche durch x erklärt wird. Sie entspricht dem
Determinationskoezienten in der pooled Regression, in der zwischen der
Die dazugehörigen Formeln in der unteren Auistung zeigen, dass die ver-
spricht der Quadrierung des Zählers und des Nenners des Korrelationskoef-
drierung).
Wichtig ist, dass sich R-sq: overall nicht additiv aus den beiden ande-
ren Gröÿen zusammensetzt. In dem Beispiel ist er sogar niedriger, als das
Between-Ebene ein positiver und auf der Within-Ebene ein negativer Zusam-
overall niedriger ausfällt. Auch daran wird deutlich, dass es sinnvoll sein
kann, bei Paneldaten die Zeiten- und die Objektebene gesondert zu betrach-
ten.
Für die Koezienten lassen sich Standardfehler berechnen und ein Signi-
deckungsgleich mit der einer gewöhnlichen Regression. Dies gilt auch für die
F-Teststatistik (oberer der beiden F-Werte) im FEM und die Wald chi2-
Statistik im REM. Beide testen die Nullhypothese, inwieweit alle Koezien-
ten des Modells aus einer Population kommen, in der alle korrespondierenden
ten werden, dann wäre die Einführung von ai in die Regression unnötig. Die
76
Personen (Between-Variation).
Die Gröÿe corr(u_i, Xb) entspricht der Korrelation zwischen den indi-
viduellen Regressionskonstanten einerseits und der mithilfe von x geschätzten
y -Werte andererseits. Letztere sind, wie in einer gewöhnlichen Regression,
gegeben über die lineare Kombination aus unabhängigen Variablen und Re-
Beispiel gibt sie also an, wie stark das Ausmaÿ fetthaltigen Essens mit den
mit -0,8934 recht stark, was auch durch den hohen R-sq: between unter-
strichen wird. Schlieÿlich werden für die Berechnung von R-sq: between
einusst das fetthaltige Essen signikant das Gewichtsniveau, auf dem sich
Personen benden.
Ein hoher corr(u_i, Xb)-Wert spricht gegen die Anwendung des REM.
Denn im REM werden die individuellen Ausgangslagen zu der als Zufallsva-
riable aufgefassten Fehlerkomponente gezählt, welche bei gegebenem x-Wert
einen Erwartungswert von 0 hat. Der Fehler wird als zufällig um die perfekte
wenn sich im FEM, also bei der Behandlung von ai als xe Gröÿe, doch ei-
ne relativ hohe Korrelation corr(u_i, Xb) zeigt. Für eine Diskussion dieser
V (a); sigma_e entspricht der Schätzung für die Wurzel aus V (). Um de-
ren Bedeutung zu verstehen, wird der Sachverhalt zuerst auf eine einfache
41 Die Multiplikation mit bf kann lediglich das Vorzeichen der Korrelation von x und ai ändern, aber nicht die Stärke
b
77
KQ-Methode existiert bekanntlich nur ein Fehlerterm. Für diesen Fehlerterm
wird eine über alle Beobachtungen gegeben der x-Werte konstante Stan-
dardabweichung angenommen. Diese Gröÿe wird als σ bezeichnet. Es lässt
42
sich zeigen, dass auch y als abhängige (Zufalls-)Variable dieselbe, über al-
der Gleichung yi = a + bxi + betrachtet werden. Nun könnte man sich die
Verteilung des Gewichtes y gedanklich vorstellen, wenn man nur aus einer
wicht bestimmt. σ entspricht dann der Streuung des Gewichtes eben in dieser
Subpopulation x = 165 (Erwartungswert ist a + b · 165). Genau das ist ge-
meint, wenn von gegeben x die Rede ist. Ferner wird σ unter der Annahme
von Homoskedastizität als gleich für alle Werte deklariert, die x annehmen
kann. Bspw. beträgt die Streuung von y gegeben x = 203, 32cm ebenfalls σ .
σ 2 ist entsprechend die Varianz, und zwar sowohl des Residuums als auch
2
der Variablen y . Im REM entspricht σ der Gröÿe V (uit ) aus Gl. 2.66. Die-
selbe Gleichung zeigt auch die Aufteilung von V (uit ) in die Varianzen der
Diese Varianzen sind in der Regel unbekannt, können aber aus den Da-
ten geschätzt werden (s. untere Auistung). Die von STATA errechneten
der Fehler sigma_u bzw. sigma_e. Die Gröÿe ρ setzt nun die Varianz
der individuellen, über die Zeit konstanten Fehler V (ai ) in Relation zur Va-
Schätzungen handelt, ist auch die Angabe rho selbst eine Schätzung mit
der Formel:
78
Der letzte Term zeigt, dass es sich bei ρ um den geschätzten Anteil der
von y erklärt werden kann. Auch diese Aussage gilt wieder unter Kontrolle
von x.
In dem Beispiel ist ρb mit 0,9896 sehr hoch, was besagt, dass fast die voll-
ständige Streuung der y -Werte auf die Unterschiede zwischen den Individuen
(Between-Variation) zurückgeht. Auch hier zeigt sich also, wie oben im Zu-
sammenhang mit der Gröÿe G erläutert, dass die absoluten Unterschiede zwi-
schen den Personen (relativ hohe Between-Varianz) deutlich gröÿer sind, als
die Unterschiede innerhalb der Personen (relativ niedrige Within-Varianz).
Rabe-Heskath et al. (2008: 58) zeigen ferner, dass ρ gleichzeitig auch die
wahrscheinlich ist, dass das Gewicht einer Person i bei einer zweiten Messung
ähnlich (in Relation zu den Unterschieden zwischen Personen) dem Gewicht
gehört, sondern eine xe Gröÿe darstellt. Daher wird V (ai ) nicht aus den
In den folgenden Tabellen sind die Formeln einiger hier besprochener Grö-
ÿen aufgeführt. Zwei Einschränkungen sind zu machen: Sie gelten 1. nur für
den einfachen Fall mit lediglich einer unabhängigen Variablen x. 2. sind sie
zwei Bedingungen nicht gegeben, dann verkomplizieren sich zwar die For-
Die im Kap. 2.5 eingeführte Gröÿen und Symbole werden als bekannt vor-
ausgesetzt.
79
Determinationskoezienten und Korrelationen
STATA-Bez. Formel Erläuterung
n X
X T
[ (xit − xi )(yit − y i )]2
i=1 t=1
R-sq: within
n X
T n X
T
Anteil der Within-Varianz von y, die durch x erklärt wird
X X
(xit − xi )2 (yit − y i )2
i=1 t=1 i=1 t=1
n
X
[ (xi − x)(y i − y)]2
i=1
R-sq: between n n Anteil der Between-Varianz von y, die durch x erklärt wird
X X
2 2
(xi − x) (y i − y)
80
i=1 i=1
Xn X T
[ (xit − x)(yit − y)]2
i=1 t=1
R-sq: overall
n X
T n X
T
Anteil der gesamten Varianz von y, die durch x erklärt wird
X X
2
(xit − x) (yit − y)2
i=1 t=1 i=1 t=1
Xn X
T
(ai − a)(e
yit − ye)
i=1 t=1
corr(u_i, Xb) v Korrelation zwischen den individuellen Regressionskonstan-
u n n X T
v u
y -Werten, x.
uX
ten und den geschätzten gegeben Die Formel
X
(ai − a)2 u − ye)2
F R
u u
u
t t (e
yit
bezieht sich nur auf das EM! Im EM wird der Korrelati-
i=1 i=1 t=1
onswert 0 per Annahme festgelegt.
Fehlervarianzen im FEM
v
u n X
T
uX
q
u
t 2
i=1 t=1
sigma_e Vb () = n(T −1)−1
Schätzformel für die Standardabweichung des Residu-
v
u n
uX
u
u (ai − a)2
81
p t i=1
sigma_u V (ai ) = Standardabweichung der individuellen Regressionskon-
n−1
stanten. Da diese als xe Werte betrachtet werden,
Berechnung!
V (ai )
rho ρb = Geschätzter Anteil der Between-Varianz von y an der
V (ai ) + Vb () gesamten Varianz von y (gegeben x) / Geschätzte Korre-
lation zwischen zwei y -Werten ein und der selben Person
(gegeben x)
Fehlervarianzen im REM
v
u n X
T
uX
q
u
t 2
i=1 t=1
sigma_e Vb () = n(T −1)−1
Schätzformel für die Standardabwei-
v
u X n
82
i=1 Fehlerkomponente ai
Vb (a)
rho ρb = Geschätzter Anteil der Between-
Vb (a) + Vb () Varianz von y an der gesamten Varianz
einer abhängigen Variablen (und somit ein komplexer Sachverhalt) nur unzu-
Dies wäre weniger tragisch, wenn dadurch nicht ein groÿes Problem auf-
träte: Für den Fall, dass solche unberücksichtigten Gröÿen mit modellierten
83
• bt xit Unabhängige Variablen, deren Werte und Eekte auf die ab-
hängige Variable mit den Zeitpunkten variieren [Fall A]
• bxi Unabhängige Variablen, deren Werte und Eekte auf die abhän-
gige Variable über die Zeit konstant sind [Fall B]
variieren [Fall C]
Die Zuordnung einer Variablen zu einem dieser Fälle geschieht nach theo-
retischer Erwägung. Zwar kann man aus der Betrachtung von Datensätzen
Indizien für die Zuordnung bestimmter Variablen gewinnen, aber alleine auf-
grund dessen keine klare Entscheidung treen. Schlieÿlich haben wir es bei
tion des Falls B. Diese Konstellation könnte bspw. für Variablen zutreen, die
bereits im Zuge der FEM-Modelle diskutiert wurden wie genetische Disposi-
solche Veränderungen sind aber für eher kurze Zeiträume sehr unwahrschein-
Das Problem ist, dass solche Variablen zwar einen Eekt auf andere Va-
riablen haben können, aber nicht immer erhebbar sind. Während z.B. das
Wirkt eine solche Variable auf eine abhängige Variable in einem Regressi-
onsmodell und wird sie nicht modelliert, so können die Koezienten weiterer
84
yt = bt xt + cz + et (2.78)
mit
Im Appendix 4.3 unter Abb. 4.2 ist ein ktiver Datensatz abgelegt mit den
Variablen x und y zum Zeitpunkt t=1 und t=2 und der nicht über die
mit r2 = 0, 625.
In dem Falle, dass die Variable z nicht zur Verfügung stünde, würde sich
sich:
y1 = 0, 724x1 + e (2.80)
mit r2 = 0, 525.
85
schlieÿlich nicht unkorreliert (rx1 z = 0, 69), so dass z auch einen Einuss auf
die Schätzung von b1 ausübt. Folglich muss b1 aus Gl. 2.80 als konsistenter
Es wurde hier also gezeigt, dass das Modell unter Einbeziehung von z voll-
ständiger ist, als das Modell in Gl. 2.80, somit die Konsistenz der Schätzung
von b1 verbessert wird. Hat man allerdings nur Querschnittsdaten zur Ver-
fügung und die Variable z nicht erhoben, dann besteht keine Möglichkeit, b1
konsistenter zu schätzen, als in Gl. 2.80.
Dies ändert sich, wenn die Variablen im Paneldesign zu einem zweiten Zeit-
Nun hat man nämlich zwei Querschnittsgleichungen und somit ein Glei-
y1 = b1 x1 + cz + e1 (2.81)
y2 = b2 x2 + cz + e2 (2.82)
Über Subtraktion der beiden Gleichungen wird der Eekt von z eliminiert:
y2 − y1 = b2 x2 − b1 x1 + e2−1 (2.83)
bzw.
∆y = b2 x2 − b1 x1 + e2−1 (2.84)
mit e2−1 = e2 − e1
Auf das Beispiel von oben angewendet, gesellt sich zu der Querschnittsre-
43 der Schätzer aus Gl. 2.79 allerdings auch, da die Variation von y1 mit r 2 = 0, 625 noch lange nicht vollständig erklärt
ist - nur an irgendeiner Stelle sind die Grenzen des Machbaren erreicht
86
mit r2 = 0, 694.
Bildet man hier die Dierenz, entsprechend Gl. 2.84, erhält man:
Es sei also festzuhalten, dass man mithilfe der Verschmelzung von Re-
Weiterhin sei gesagt, dass die Bildung von Dierenzgleichungen auf meh-
Wäre die Variable x in Gl. 2.84 eine des Falls D, dann würde sich eine noch
einmal vertreten, würde also die Gleichung für einen Querschnitt so aussehen:
yt = bt xt + cz + dt v + f wt + et (2.88)
mit
dann würde sich die Gleichung, gebildet aus den Dierenzen der Quer-
87
∆y = b2 x2 − b1 x1 + (d2 − d1 )v + f (w2 − w1 ) + e2−1 (2.89)
Auch an dieser Stelle ist zu sehen, dass bei der Bildung von Dierenz-
gleichungen nur die Variable z entfällt, bzw. entfallen kann. Somit müssen
weitere Variablen, wie x, v und w bekannt sein. Sind sie es nicht, dann kann
behoben werden.
ferenzen sehr klein sind, also nur geringfügige Veränderungen in den Varia-
44
blenwerten über die Zeit stattgefunden haben.
enten soll nun exemplarisch für das Modell aus Gl. 2.84 angesprochen wer-
man alle Werte von x mit (−1) multipliziert. So lässt sich Gl. 2.84 ebenfalls
schreiben als:
Durch die Bildung von (−x1 ) ist die additive Verknüpfung der Regressions-
koezienten hergestellt und nun können diese Koezienten konventionell,
Eine andere Möglichkeit besteht darin, mit Gl. 2.83 zu arbeiten. Nach Ad-
dition beider Seiten der Gleichung mit y1 und unter Gebrauch der oben ein-
geführten (−x1 )-Variablen, lässt sich diese Gleichung wie folgt schreiben:
Das Modell in dieser Form lässt sich z.B. im Programm Lisrel implemen-
tieren. Hierbei werden die Indikatoren x und y als identisch mit den latenten
auftauchen, LISREL aber die Spezikation von ξ und η verlangt). Des Wei-
44 Zur Kritik und zu Problemen bei der Bildung von Dierenzenvariablen s. Engel (1994: 19); Arminger (1990: 70f)
88
teren wird die Variable y1 zu den unabhängigen Variablen gezählt, weil sie
auf der rechten Seite der Gl. 2.91 steht. Da sie aber keine echte unabhängi-
zur Schätzung freigesetzt, sondern auf den Wert Eins xiert. In Matrizen-
schreibweise und entsprechend der LISREL-Symbolik sieht die Gl. 2.91 nun
ξ
1
η1 = 1 b2 b1 ξ2 + ζ (2.92)
ξ3
mit y 2 = η1 ,
y1 = ξ1 ,
x2 = ξ2 ,
(−x1 ) = ξ3 und
e2−1 = ζ
aber viel Raum für Variation. So können in LISREL die unterschiedlichsten li-
völlig freigesetzt werden und solche Optionsvielfalt erlaubt eben auch die
An dieser Stelle soll der Gebrauch von LISREL nicht weiter vertieft werden.
Dies geschieht in Kap. 2.7. Des Weiteren kann hier auf zahlreiche Statistik-
Literatur verwiesen werden so z.B. auf das Buch von Arminger (1990: 72 ),
in welchem ein ähnliches Beispiel, wie das obige, und weitere Beispiele zur
Variablen z, welche die Eigenschaften vereinigt, sowohl auf y2 als auch auf
y1 den gleichen Eekt auszuüben, ist nicht einfach vor allem dann nicht,
wenn sich die beiden Variablen x2 und x1 in ihren Werten unterscheiden und
die Einüsse imperfekt sind. Dieses Ziel wurde daher nur annähernd erreicht
(dies sieht man daran, dass der Koezient c in Gl. 2.79 nicht mit dem in Gl.
2.85 identisch ist). Deshalb erbringt eine Schätzung der Koezienten allein
anhand von Gl. 2.84 nicht exakt dieselben Werte, wie sie unter Gl. 2.86 aus
89
Für den Datensatz sprechen allerdings die realistischen Bedingungen. Ge-
meint ist, dass hier Daten konstruiert worden sind, die ein Regressionsmodell
erzeugen, in dem die Varianz der abhängigen Variablen nicht vollständig er-
klärt wird und in dem die Werte der Regressionskoezienten nicht Null oder
Eins entsprechen.
Für den Leser, der den Sachverhalt mit Daten nachrechnen will, welche
zwar unrealistisch sind, dafür den Vorteil aufweisen, dass die Rechnung voll
aufgeht, ist ein weiterer Datensatz unter Appendix 4.3 (in Abb. 4.3) abge-
legt. Das Dierenzenmodell auf Basis dieses Datensatzes wird in Kap. 2.7
Zum Schluss soll noch kurz erläutert werden, warum das Dierenzenmo-
lich, obwohl im Modell nicht explizit benannt, wie im FEM zu den xen
unabhängigen Variablen.
Allerdings stellt sich die Frage, ob z ein bestimmtes Merkmal zum Ausdruck
bringt, oder lediglich der Platzhalter für einen Bündel von einzeln betrachtet
insignikant wirkenden Merkmalen ist, in der gleichen Schärfe wie bei der
das Rechnen mit Dierenzenvariablen, also mit Variablen, welche eine Än-
zenvariablen also Werte nahe Null annehmen, dann sinkt die Reliabilität der
Es muss im Einzelfall bei der Entscheidung für oder gegen eines der beiden
sind.
90
2.5.3 Modelle mit endogener Dynamik
Bislang wurden, bis auf die einführenden Beispiele in Kap. 2.1, Modelle be-
eine Variable zu einem Zeitpunkt t1 einen Einuss auf sich selbst zum Zeit-
punkt t2 ausübt.
Wird des Weiteren lediglich die endogene Dynamik einer Variablen zwischen
Es seien nun y1 und y2 betrachtet. y2 wird hierbei als eine abhängige Va-
Nehmen wir also an, wir hätten eine unabhängige Variable x2 , dann könnte
ein einfaches dynamisches Regressionsmodell wie folgt aussehen (mit c und
Es steht der einfachen Schätzung eines solchen Modells (und einer Erwei-
rität liegt dann vor, wenn unabhängige Variablen eines linearen Regressions-
91
partieller Korrelationen. Perfekte Multikollinearität würde die Berechnung
man von einer relativ hohen Multikollinearität sprechen kann. Diese verhin-
dert zwar nicht die Berechnung einer Regression, kann aber die Ezienz von
Weniger mathematisch ausgedrückt lässt sich sagen, dass es bei sehr hoher
Wenn man nun ein Regressionsmodell bestimmt, dann geht man i.d.R. von
der Annahme aus, dass die unabhängigen Variablen einen Einuss auf die zu
zu zwei Zeitpunkten t=1 und t=2 betrachtet, dann ergeben sich folgende
Gleichungen:
y1 = a1 + bx1 + e1 (2.94)
y2 = a2 + bx2 + e2 . (2.95)
Wir gehen davon aus, dass in Gl. 2.95 die Variable x2 mit y2 korreliert ist.
Wird nun ein dynamisches Modell, wie in Gl. 2.93, gebildet, dann kommt die
Annahme hinzu, dass y1 mit y2 korreliert ist und zwar auf eine solche Art
und Weise, dass damit auch eine signikante Korrelation von x2 mit y1 sehr
wahrscheinlich wird.
namischen Modell, wie in Gl. 2.93, gesteigert (weil hier x2 und y1 zu den
45 Sie würde z.B. auftauchen, wenn in einer Regression mit Dummy-Variablen die Referenzkategorie auch in Form einer
Variablen in die Berechnung einieÿen würde; denn die Referenzkategorie ist von den restlichen Dummies exakt linear
abhängig
46 Völlige Abwesenheit von Multikollinearität würde man mit Hilfe von orthogonalen Faktoren im Zuge der Berechnung
einer explorativen Faktorenanalyse erzeugen
92
Multikollinearität an. Es betrit das REM. Wie bereits in Kap. 2.5.1.6 dis-
kutiert wurde, ist ein REM nur unter der Annahme berechenbar, dass die
liert ist.
konstante Wirkung auf die abhängige Variable haben, aber nicht erhoben
wurden.
onsgleichungen 2.94 und 2.95 implementiert , dann ergibt sich (hier muss zur
mit
i1 und i2 = die auch über t variierenden Fehlerkomponenten, welche zusam-
men mit ai den Gesamtfehler ei1 bzw. ei2 aus Gl. 2.94 und 2.95 ergeben (nur
Wird ferner in dem dynamischen Modell aus Gl. 2.93 y1 durch den Aus-
druck auf der rechten Seite von Gl. 2.96 ersetzt und die Fehleraufteilung
bzw.:
93
Die Variable ai taucht hier sowohl als unabhängige Variable in der Form c · ai
als auch als Fehlerkomponente ei2 = ai + i2 auf. Logischerweise ist ai aus
c · ai einerseits und aus ei2 = ai + i2 andererseits mit sich selbst korreliert, so
dass die Prämisse verletzt wird, ai dürfe nicht mit unabhängigen Variablen
Somit ist die Berechnung eines REM mit endogener Dynamik nicht möglich.
vieren, indem ein Dierenzenmodell, vergleichbar mit dem aus Kap. 2.5.2,
Betrachtet wird wieder das Beispiel des Abschnitts 2.5.1.7, dessen Daten-
satz im App. unter Tab. 4.1 zu nden ist. Es werden nun die Variablen
verschachtelt werden:
94
• Das Gewicht zum zweiten Zeitpunkt gilt als abhängig von dem Gewicht
• Das Gewicht zum dritten Zeitpunkt gilt als abhängig von dem Gewicht
ξ1 1 0 0 y1
η1 1 0 y2 ξ2 = 0 1 0 x1
=
η2 0 1 y3
ξ3 0 0 1 x2
95
Somit gilt:
η1 = y 2
η2 = y 3
ξ1 = y1
ξ2 = x2
ξ3 = x3
Man beachte, dass aufgrund der Tatsache, dass auf y1 keine weitere Variable
im Modell einwirkt, sie zu den exogenen (also unabhängigen) ξ -Variablen
hinzugezählt wird.
Die Variable y2 gesellt sich hingegen zu den endogenen Variablen. Sie wirkt
zwar auf y3 , empfängt auf der anderen Seite aber auch einen Einuss von y1 .
Diese unterschiedlichen Modell-Platzierungen von y1 und y2 haben zur Fol-
ge, dass der endogene Eekt a sowohl in der Parameter-Matrix B als auch
ξ1
η1 0 0 η1 a b 0 ζ1
= + ξ2 + (2.102)
η2 a 0 η2 0 0 b ζ2
ξ3
In der Modell-Spezikation mit LISREL muss vor allem beachtet werden,
dass die Parameter a und b doppelt vertreten sind und somit bei der Schät-
zung gleichgesetzt werden müssen. An dieser Stelle soll die LISREL-Zeile der
Da hier mit ktiven Daten gearbeitet wird, lässt sich die Stichprobengröÿe
beliebig manipulieren. Dies sollte an dieser Stelle auch getan werden, denn
durch die Aufspaltung der Variablen nach Zeitpunkten stehen pro Variable
zienten adäquat zu schätzen. Der Autor hat sich entschieden, den Datensatz
96
Aus diesem Grunde werden inferenzstatistische Maÿzahlen nicht betrach-
a = 1.19
(2.103)
b = −0.41
Hier zeigt sich das gleiche Phänomen, wie bei dem FEM und REM. Im Ver-
Der Einuss des Gewichtes aus einem früheren Zeitpunkt hat hingegen, wie
intuitiv zu erwarten ist, einen positiven Eekt auf das eigene Gewicht zu ei-
perfekt.
Solch hohe Werte dürfen aber in der Euphorie nicht unkritisch betrachtet
werden. Denn es stellt sich nun die Frage, inwieweit ein endogener Einuss
einer Variablen auf sich selbst zum späteren Zeitpunkt kausal interpretiert
werden kann.
Vielmehr ist zu vermuten, dass sich hinter dem endogenen Einuss wei-
modelliert wurden.
Weist z.B. eine Person in einer langen Zeitperiode ein relativ hohes Gewicht
korreliert das Gewicht sicherlich stark mit sich selbst zwischen verschiedenen
Zeitabschnitten damit ist aber nicht (ursächlich) erklärt, warum eine Per-
97
immer in statistischen Zusammenhangsanalysen. Allerdings sollte sich der
Analyst im Kontext der Analyse endogener Dynamik in Panelmodellen die-
Für weitere Ansätze zur Analyse von dynamischen Panelmodellen sei auf
Es ist durchaus von Vorteil, die Anwendung von LISREL bereits an früheren
Stellen des Skripts eingeführt zu haben, da hiermit für den Leser das Denken
Der Unterschied besteht nun darin, dass wir es nicht mehr mit einfachen
98
Veranschaulicht könnte ein Strukturgleichungsmodell nun wie folgt ausse-
hen:
Auf die Inhalte dieses Modells soll an dieser Stelle nicht eingegangen wer-
Kap. 2.2 vorgestellten Methode der Visualisierung von Modellen über Pf-
In diesem Beispiel gibt es auf der Ebene latenter Variablen nur eine ξ-
Variable (Kreis ganz links: Kulturation), da nur auf diese Variable keine
kation).
Jede latente Variable wird indirekt gemessen bzw. erzeugt durch zwei bis
Aufgrund der Komplexität solcher Modelle muss der Analyst oft bei der
99
Aufstellen eines tauglichen Modells ist somit meistens ein iterativer Prozess
Auch auf der Ebene von Strukturgleichungen lässt sich z.B. eine Fehlerva-
fung sei vor allem auf das Buch von Reinecke (2005), aber auch auf frühere
Stellen dieses Skripts (z.B. auf die Ausführungen zur Pfadanalyse, zum Ein-
Das nun aufgegriene Beispiel bezieht sich auf einen kleinen Ausschnitt aus
Prozess gehören u.a. vier Stufen der sozialen Integration, welche aufeinander
aufbauen. Diese vier Stufen lassen sich als latente Variablen auassen, wie in
gen auf eine inhaltliche Fragestellung angewendet werden. Das Beispiel dient
Eine erste Stufe des Integrationsprozesses ist nach Esser die sog. Kultura-
tion. Sie umfasst vor allem die Sprachkompetenz. Letztere lässt sich auch als
latente Variable verstehen. Diese übt einen Einuss auf die sog. Identikation
aus ebenfalls eine latente Gröÿe, welche die emotionale Verbundenheit des
100
(endogene Variable) haben . Beide Konstrukte sollen nun über Indikatoren
bar gemacht, während die Identikation aus Gründen der Vereinfachung le-
Alle drei Variablen sind ordinalskaliert mit fünf Ausprägungen und wer-
ausländischer Personen.
Nun wird noch zwischen zwei Zeitpunkten dierenziert: 2001 und 2003. Da-
durch ergeben sich vier latente Variablen und sechs Indikatoren, wie folgende
Graphik illustriert:
Grundgerüst
SP - 2001 SP - 2003
101
Der Vorteil des SOEP-Paneldatensatzes liegt darin, dass er eine überpropor-
schritten konnte vom Autor die Korrelations- und die Kovarianzmatrix der
sechs Indikatoren, welche als Basis für weitere Berechnungen zur Verfügung
steht, ermittelt werden. In ihr sind 391 gültige Fälle erfasst. Alle bivaria-
ten Korrelationen sind auf dem 5%-Niveau signikant von Null verschieden.
Die beiden Matrizen benden sich im Anhang 4.5, wobei die Korrelati-
onsmatrix in der Graphik 4.4 und die Kovarianzmatrix in der Graphik 4.5
aufgelistet ist.
Nun sollen einige Varianten vorgestellt werden, welche die Identikation als
Das oben vorgestellte Grundgerüst soll somit mit Leben gefüllt werden. Es
wird in jedem Modell dem Vorteil, dass Paneldaten vorliegen, Rechnung ge-
tragen. Die Varianten stellen allerdings nur einen Auszug möglicher Modelle
dar.
Bei den ersten Modellen wird in der visuellen Darstellung auf die Fehler-
sowohl die Residuen aus den Messmodellen als auch aus dem Strukturmodell
ziert:
102
Statisches Modell mit kreuzverzögertem Effekt
SP - 2001 SP - 2003
p1
103
Die Strukturgleichung lautet:
IDT2003 = p1 SP2001 + ζ1
Schr2001 λ1 δ
+ 1 = s.a.d.f.2003
= SP2001 IDT2003
Spre2001 λ2 δ2
betrachtet:
SP - 2001 SP - 2003
p3 p4
IDT2001 p3 0 SP2001 ζ
= + 1
IDT2003 0 p4 SP2003 ζ2
104
mit den Messmodellen:
Schr2001 λ1 0 δ1
Spre2001 λ2 0 SP2001 δ2 s.a.d.f.2001 1 0 IDT2001
Schr2003 = 0 + =
λ3 SP2003 δ3 s.a.d.f.2003 0 1 IDT2003
Spre2003 0 λ4 δ4
Hierbei ist zu beachten, dass die Panelstruktur in diesem Modell dann Ein-
gang ndet, wenn angenommen wird, dass der Eekt der Sprachkompetenz
auf die Identikation zu beiden Zeitpunkten gleich ist. Formal geschieht dies
heiÿt, dass neben dem Einuss der Sprachkompetenz auch eine Eigenwirkung
der latenten Variablen Identikation auf sich selbst (von 2001 auf 2003) zu-
SP - 2001 SP - 2003
p1
p2
s.a.D.f. 2001 IDT - 2001 IDT - 2003 s.a.D.f. 2003
SP2001
IDT2003 = p1 p2 + ζ1
IDT2001
105
mit den Messmodellen:
Schr2001 λ1 0 δ1
Spre2001 = λ2 SP2001
0 + δ2
s.a.D.f.2001 0 1
IDT2001
δ3 IDT2003 = s.a.d.f.2003
Man beachte, dass somit die latente Variable Identikation 2001 zu den
cken. Dies ist zwar an sich nicht verwerich, muss aber keine Verbesserung
Ein gutes Modell ist u.a. dadurch gekennzeichnet, dass es aus der komple-
vereinfacht darstellt. Ein vollgepacktes Modell kann sich zwar mit einer
Folgendes Beispiel soll nun betrachtet werden (wobei dieses Modell nur
Praxis gekennzeichnet):
106
„Vollgepacktes“ Modell
SP - 2001 SP - 2003
p1
p3 p4
p2
s.a.D.f. 2001 IDT - 2001 IDT - 2003 s.a.D.f. 2003
IDT2001 0 0 IDT2001 p3 0 SP2001 ζ
= + + 1
IDT2003 p2 0 IDT2003 p1 p4 SP2003 ζ2
Schr2001 λ1 0 δ1
Spre2001
= λ2 0 SP2001 + δ2 s.a.d.f.2001 1 0 IDT2001
Schr2003 =
0 λ3 SP2003 δ3 s.a.d.f.2003 0 1 IDT2003
Spre2003 0 λ4 δ4
linearen Modell sich ähneln, als die Residuen zweier Personen, welche zu-
fällig in einem Datensatz nebeneinander liegen (und als die Residuen einer
107
Person, welche sich aus verschiedenen linearen Submodellen eines überge-
tet, da die y -Variablen in der Matrix Λy durch die Gleichsetzung mit den
nen:
V24
SP - 2001 SP - 2003
p1
p3 p4
p2
s.a.D.f. 2001 IDT - 2001 IDT - 2003 s.a.D.f. 2003
Der Buchstabe d steht hierbei für den Fehler δ, so dass z.B. d3 δ3
entspricht. Der Buchstabe V steht für υ , das ein Element der Varianz-
Kovarianzmatrix der Messfehler von x, also Θδ , repräsentiert. So sei deniert:
υ11
0 υ22
Θδ =
υ13 0 υ33
0 υ24 0 υ44
Alle Modelle wurden in LISREL implementiert und gerechnet. Im Anhang
108
4.6 benden sich die Zeilen der jeweiligen Modellspezikationen.
Modellvarianten p1 p2 p3 p4 λ1 λ2 λ3 λ4 r2 χ2
Mod. A 0, 44 − − − 1, 05 0, 84 − − ID03 : 0, 19 0
Mod. B − − 0, 5 0, 5 1, 08 0, 82 1, 09 0, 86 ID01 : 0, 21 214, 2
ID03 : 0, 22
Mod. C 0, 17 0, 52 − − 1, 01 0, 88 − − ID03 : 0, 44 2, 65
Mod. D −0, 27 0, 56 0, 48 0, 48 1, 09 0, 82 1, 09 0, 86 ID01 : 0, 2 68, 58
ID03 : 0, 46
Mod. E −0, 28 0, 54 0, 49 0, 49 0, 99 0, 83 1, 02 0, 91 ID01 : 0, 21 5, 03
ID03 : 0, 46
auf dem 5%-Niveau signikant von Null verschieden. Diese Koezienten sind
unstandardisiert, aber dadurch, dass die Maÿeinheiten für alle Variablen und
Zunächst einmal lässt sich feststellen, dass die sich im Messmodell der
dene Modellvarianten und über die beiden Zeitpunkte hin erwiesen haben.
tion der Messfehler was nicht weiter verwunderlich sein dürfte, da dieser
109
An dieser Stelle sei kurz auf die Maÿzahl χ2 eingegangen. In jedem Struk-
eher ist das Modell in der Lage, sich der in der Empirie gewonnene Daten-
beide Matrizen und somit umso besser ist das Modell geeignet, die Realität
zu beschreiben.
dings nicht daran, dass das Modell perfekt im Sinne der Erklärungskraft ist,
Modelle relevant.
Aber auch nachträgliche Berechnungen des Autors, in denen von der Gleich-
nichts. Generell hat dieses Modell eher schlecht abgeschnitten auch von der
Erklärungskraft her.
ler (Mod. D) und dem des vollgepackten Modells mit Autokorrelation der
2 2
Fehler (Mod. E): χ = 68, 58 vs. χ = 5, 03. Auch wenn sonstige Koezienten
sich nicht wesentlich verändert haben, so ist die Einführung der korrelativen
110
Beziehung zwischen Fehlern zu verschiedenen Zeitpunkten in der Lage, das
Auallend ist, dass der kreuzverzögerte Eekt durch die Einführung der
endogenen Dynamik deutlich kleiner geworden ist ein Hinweis für Fehlspe-
In dem vollgepackten Modell (Mod. D und E) kehrt sich sogar die Rich-
Frage stellt oder eher auf ein zu vollgepacktes Modell hinweist, indem die
werden.
Dieses Kapitel sollte einen kleinen Auszug darstellen, wie man sich an die
herantasten kann.
rer Modelle möglich. Es sei z.B. auf die Möglichkeit der Implementierung ei-
nes REM (s. Kap. 2.5.1) oder eines Dierenzenmodells (s. Kap. 2.5.2) auf der
111
Zum ersten Mal in diesem Skript tauchte eine Anwendung in Kap. 2.5.2, al-
Dies soll nicht den Eindruck erwecken, als sei LISREL nur in der Lage,
komplexe Strukturgleichungsmodelle zu berechnen. Ebenso lassen sich mit
delle. Eine lineare Regression lässt sich mit STATA oder SPSS ohne viel
wird immer auf der Ebene von Strukturgleichungen modelliert und sol-
deniert und mit sich selbst als Indikatoren gleichgesetzt werden. Dies er-
Matrizenrechnung (welche nicht zwingend gegeben sind, wenn man sich mit
sich.
solchen Fällen ist es sicherlich nicht begründbar, eine eindeutige Lösung gegen
bestimmt wird (auch wenn sich hierbei die Schätzungen der beiden Methoden
kann somit für das Vorankommen beim Erlernen von LISREL förderlich sein,
112
Ein Nachweis für die Anwendbarkeit von LISREL auf einfache Modelle soll
an dieser Stelle geliefert werden. Hierzu wird das Pfadmodell aus Kap. 2.3
betrachtet.
x2 = η1
y 2 = η2
x1 = ξ1
y1 = ξ2
Die Messmodelle müssen so konstruiert sein, dass die Indikatoren den la-
tenten Variablen entsprechen. Diese Forderung ist erfüllt, wenn die Ladungs-
formuliert werden:
η1 1 0 x2
= (2.104)
η2 0 1 y2
Das Äquivalent für die exogenen Variablen sieht wie folgt aus:
ξ1 1 0 x1
= (2.105)
ξ2 0 1 y1
Nun lässt sich das Strukturgleichungsmodell in Matrizenschreibweise de-
nieren:
η1 0 0 η1 px2 x1 px2 y1 ξ1 ζ
= + + 1 (2.106)
η2 0 0 η2 p y2 x1 p y2 y1 ξ2 ζ2
zögerten Eekte ist hierbei mit der aus Kap. 2.3 identisch. Die Matrix, welche
nur Nullen enthält (i.d.R. symbolisiert mit B ), hat die Funktion, gerichtete
113
Da solche Beziehungen hier nicht modelliert werden, entspricht B einer Null-
matrix, so dass dieser Block wegfällt und keine η -Variablen auf der rechten
η1 px2 x1 px2 y1 ξ1 ζ
= + 1 (2.107)
η2 py2 x1 py2 y1 ξ2 ζ2
werden. Hier wird nur die Zeile der Modellspezikation wiedergegeben. Zu-
ST 1 LY(1,1) LY(2,2)
und das Messmodell aus Gl. 2.104 wird speziziert. Diese Angaben sind nicht
tomatisch annimmt.
Solange die Anzahl der endogenen latenten Variablen der Anzahl ihrer In-
dikatoren entspricht wie in diesem Falle , ist der Ausdruck NE=2 redun-
dant. Solange ferner die Ladungsmatrix aus Gl. 2.104 eine Einheitsmatrix ist,
braucht sie nicht in LISREL speziziert zu werden (wie hier durch: LY=FU;
ST 1 LY(1,1) LY(2,2)). Man beachte allerdings: Wenn die Anzahl NE an-
gegeben wird, dann muss auch LY deniert werden.
ergibt:
114
Stabilitätskoezienten px2 x1 = 0, 88
py2 y1 = 0, 68
Kreuzverzögerte Eekte px2 y1 = −0, 03
py2 x1 = 0, 28
wurde.
der eindeutigen arithmetischen Lösungen aus Kap. 2.3 sehr ähnlich sind. Die
gröÿte Diskrepanz taucht bei py2 y1 auf. Die Dierenz beider Koezienten
liegt bei |0, 09|. Sonst sind die LISREL-Schätzungen viel näher an der arith-
metischen Lösung. Insgesamt lässt sich somit dieses Vorgehen als akzeptabel
einstufen.
Ein weiterer Vorteil beim Arbeiten mit LISREL liegt darin, dass der simple
Befehl PD ein Pfaddiagramm ausgibt, und zwar inkl. der mit Koezienten-
werten beschrifteten Pfeile. Dieser Befehl sollte einmalig zwischen zwei der
3. der Modellspezikation,
115
Abbildung 2.13: Pfaddiagramm zum Beispiel
Ferner soll kurz gezeigt werden, wie sich das Dierenzenmodell aus Kap.
Hierzu soll der Datensatz aus Appendix 4.3 (s. Abb. 4.3.2) der Analyse
dellen mit Dierenzenvariablen gesagt worden ist, hat dieser ktive Daten-
satz einen ziemlich unrealistischen Charakter. Dies äuÿert sich darin, dass
2
die Varianz der abhängigen Variablen zu 100% erklärt wird (r = 1) und
y 2 = y 1 + x 2 − x1 (2.108)
ST 1.0 GA(1,1)
FR GA(1,2) GA(1,3)
Mit ST 1.0 GA(1,1) wird der Schätzer der unechten abhängigen Va-
riablen y1 auf Eins xiert (s. Gl. 2.92 und 2.91 und ferner Erläuterungen im
116
Text an dieser Stelle).
von LISREL verschaen. Durch die Option, viele Schätzer in komplexen Mo-
dellen auf bestimmte Werte zu xieren, freizugeben oder mit anderen Schät-
zern gleichzusetzen, hat der Forscher einen weiten Spielraum, seine Modelle
Daten zu verbessern.
Zum Schluss des Kapitels noch ein paar Verweise auf Quellen im Internet,
http://www.ssicentral.com/lisrel/student.html
http://user.uni-frankfurt.de/~cswerner/sem/free_fix.pdf
http://www.soziologie.uni-halle.de/langer/lisrel/skripten/lisrel83.pdf
http://www.ssicentral.com/lisrel/techdocs/SIMPLISSyntax.pdf
117
Kapitel 3
Fazit
Dieses Skript zeigte einen kleinen Ausschnitt aus einem riesigen Statistik-
Subuniversum: dem der linearen Analyse von Paneldaten. Gewiss ist das
gen. Vor allem nicht, wenn diese Daten für voraussetzungsvolle statistisch-
Aber aus eigener Erfahrung lässt sich sagen, dass man sich Schritt für
ist.
Somit sei gehot, dass dieses Skript einen leichten, aber dennoch fundier-
ten Einstieg in diese Thematik erlaubt und die Idee der Wichtigkeit solcher
Analysen ein Stück weit fördert trotz hohen Aufwands auf der Ebene der
Datenerhebung und relativ hoher Komplexität auf der Ebene der Datenana-
lyse.
118
Kapitel 4
Appendix
119
4.2 Appendix B - Fiktiver Datensatz zur Pfa-
danalyse mit Paneldaten
x1y1x2y2
1 4 2 4
2 2 2 2
3 3 3 3
4 2 4 1
5 5 5 5
6 4 6 6
7 7 7 7
1 1 1 2
2 2 2 2
3 3 3 3
4 4 3 4
5 5 5 4
5 6 5 4
7 4 7 7
1 1 1 1
2 4 2 5
3 3 3 3
4 4 4 4
5 5 5 5
6 3 7 2
7 7 7 7
1 1 1 1
2 2 7 2
1 3 3 3
4 4 4 5
5 5 5 5
6 5 6 4
7 4 7 7
120
4.3 Appendix C - Fiktive Datensätze für eine
Regression mit Dierenzenvariablen
4.3.1 Datensatz mit einer eher realistischen Struktur
y1 y2 x1 x2 z
121
4.3.2 Datensatz mit einer eher unrealistischen Struktur
y1 x1 z y2 x2
1,00 1,00 ,00 3,00 3,00
2,00 1,00 1,00 6,00 5,00
3,00 4,00 -1,00 9,00 10,00
4,00 4,00 ,00 12,00 12,00
5,00 3,00 2,00 15,00 13,00
6,00 5,00 1,00 18,00 17,00
7,00 10,00 -3,00 21,00 24,00
8,00 11,00 -3,00 24,00 27,00
9,00 8,00 1,00 27,00 26,00
10,00 7,00 3,00 30,00 27,00
11,00 6,00 5,00 33,00 28,00
12,00 7,00 5,00 36,00 31,00
13,00 8,00 5,00 39,00 34,00
14,00 8,00 6,00 42,00 36,00
15,00 9,00 6,00 45,00 39,00
16,00 11,00 5,00 48,00 43,00
17,00 10,00 7,00 51,00 44,00
18,00 10,00 8,00 54,00 46,00
19,00 9,00 10,00 57,00 47,00
20,00 17,00 3,00 60,00 57,00
122
4.4 Appendix D - Datensatz zur Berechnung
eines FEM
4.4.1 Ursprungsdatensatz
auf einer vom Autor erfundenen metrischen Skala von 0=Tagesration des
Essens enthielt kein Fett bis 100=Tagesration des Essens bestand nur aus
Fett.
123
4.4.2 Datensatz mit Dummy-Variablen
P Z Y X D1 D2 D3
A 1 60 53 1 0 0
A 2 61 51 1 0 0
A 3 62 50 1 0 0
B 1 71 55 0 1 0
B 2 73 54 0 1 0
B 3 70 57 0 1 0
C 1 86 64 0 0 1
C 2 84 69 0 0 1
C 3 83 70 0 0 1
D 1 95 66 0 0 0
D 2 97 64 0 0 0
D 3 100 63 0 0 0
mit
P=Person
Z=Zeitpunkt
124
4.5 Appendix E - Korrelations- und Kovarianz-
matrix der Indikatoren für ein Struktur-
gleichungsmodell
KORRELATIONSMATRIX
schr2001 spre2001 schr2003 spre2003 s.a.D.f.2001 s.a.D.f.2003
schr2001 1
spre2001 0.771 1
KOVARIANZMATRIX
schr2001 spre2001 schr2003 spre2003 s.a.D.f.2001 s.a.D.f.2003
schr2001 1.436
125
4.6 Appendix F - Modellzeilen in LISREL für
verschiedene Varianten von Strukturgleichungs-
modellen
Die Reihenfolge der manifesten Variablen in LISREL wurde wie folgt festge-
legt:
Modellvariante A
SE
6 1 2/
MO NY=1 NX=2 NE=1 NK=1 BE=FU,FI GA=FU,FR LX=FU,FR
LY=FU,FR TE=FU,FI TD=DI
ST 1.0 LY(1,1)
Modellvariante B
SE
5 6 1 2 3 4/
MO NY=2 NX=4 NE=2 NK=2 BE=FU,FI GA=FU,FI LX=FU,FI
LY=FU,FI TE=FU,FI TD=DI
ST 1.0 LY(1,1) LY(2,2)
FR LX(1,1) LX(2,1) LX(3,2) LX(4,2)
FR GA(1,1)
EQ GA(1,1) GA(2,2)
Modellvariante C
SE
6 1 2 5/
MO NY=1 NX=3 NE=1 NK=2 BE=FU,FI GA=FU,FR LX=FU,FI
LY=FU,FR TE=FU,FI TD=DI
ST 1.0 LY(1,1)
126
FR LX(1,1) LX(2,1)
ST 1.0 LX(3,2)
Modellvariante D
SE
5 6 1 2 3 4/
MO NY=2 NX=4 NE=2 NK=2 BE=FU,FI GA=FU,FI LX=FU,FI
LY=FU,FI TE=FU,FI TD=DI
ST 1.0 LY(1,1) LY(2,2)
FR LX(1,1) LX(2,1) LX(3,2) LX(4,2)
FR GA(1,1) GA(2,1)
EQ GA(1,1) GA(2,2)
FR BE(2,1)
Modellvariante E
SE
5 6 1 2 3 4/
MO NY=2 NX=4 NE=2 NK=2 BE=FU,FI GA=FU,FI LX=FU,FI
LY=FU,FI TE=FU,FI TD=FU,FI
ST 1.0 LY(1,1) LY(2,2)
FR LX(1,1) LX(2,1) LX(3,2) LX(4,2)
FR GA(1,1) GA(2,1)
EQ GA(1,1) GA(2,2)
FR BE(2,1)
FR TD(1,1) TD(2,2) TD(3,3) TD(4,4) TD(3,1) TD(4,2)
FR TE(1,1) TE(2,2) TD(1,2)
127
4.7 Kurzer Verweis auf Grundlagen der linea-
ren (Regressions-)Analyse
In einführenden Statistik-Veranstaltungen wird im Kontext der Einführung
linearen Modellen. Allerdings sollte man nicht nach diesem Schritt stehen
bleiben.
ware augenblicklich. Dies ist komfortabel. Aber die eigentlich wesentliche Ar-
beit des Forschers beginnt erst an dieser Stelle. Es muss nämlich geprüft
werden, inwieweit das Modell gelungen ist.
Hierzu wird sowohl das Modell als Ganzes, als auch einzelne Koezienten,
denn nur ihre Kenntnis erlaubt dem Forscher die Überprüfung, ob diese für
J
X
yi = a + bj xji + ei (4.1)
j=1
mit
128
Folgende Annahmen müssen u.a. erfüllt werden:
zwischen den Variablen hingegen lassen sich oft durch geeignete Trans-
formationen linearisieren
niken vorausgesetzt
riablen korrelieren
129
Diese Auistung erhebt nicht den Anspruch, erschöpfend zu sein und in die
Für eine Vertiefung in diese Thematik sowohl bezogen auf die Theorie
als auch auf Techniken zur Aufdeckung und Behebung von Voraussetzungs-
Einem Leser, welcher noch vor dem ersten Schritt steht, also keine Vor-
130
Abbildungsverzeichnis
2.1 Korrelationsmatrix . . . . . . . . . . . . . . . . . . . . . . . . 13
2.2 Kovarianzmatrix . . . . . . . . . . . . . . . . . . . . . . . . . 14
131
Tabellenverzeichnis
punkten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
132
Literaturverzeichnis
133
[12] Kohler, U. ; Kreuter, F. : Datenanalyse mit STATA. Allgemeine
Konzepte der Datenanalyse und ihre praktische Anwendung. Oldenbourg
Verlag, 2008
333
134