Panel Analyse

Analyse von Paneldaten - Ein Abriss
ausgewählter Verfahren
Petra Stein, Dawid Bekalarczyk
22. Juli 2010

Inhaltsverzeichnis
1 Einleitung 3
2 Ausgewählte Analyseverfahren für Paneldaten 9

2.1 Elementare Veränderung der Werte einer Variablen im Zeit-
verlauf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.1.1 Der Korrelationskoezient als Indikator für Stabilität
und Veränderung? . . . . . . . . . . . . . . . . . . . . 10
2.1.2 Die einfache Regression einer zeitlich vorangestellten
inhaltlich gleichen Variablen auf die Variable zum spä-
teren Zeitpunkt . . . . . . . . . . . . . . . . . . . . . . 15
2.2 Eine kurze Einführung in die Pfadanalyse . . . . . . . . . . . . 18
2.3 Eine einfache Pfadanalyse mit Paneldaten . . . . . . . . . . . 27
2.4 Das Ein-Indikatoren-Modell als Ansatz zur Unterscheidung
zwischen Veränderung und mangelnder Reliabilität . . . . . . 31
2.5 Regressionsmodelle für Paneldaten . . . . . . . . . . . . . . . 37
2.5.1 Modelle mit variablen Regressionskostanten: Fixed- und
Random-Eects-Modelle . . . . . . . . . . . . . . . . . 44
2.5.2 Regressionsmodelle mit Dierenzenvariablen . . . . . . 83
2.5.3 Modelle mit endogener Dynamik . . . . . . . . . . . . 91
2.6 Lineare Panelmodelle mit latenten Variablen . . . . . . . . . . 98
2.7 Anwendung von LISREL auf Paneldaten . . . . . . . . . . . . 111
3 Fazit 118
4 Appendix 119
4.1 Appendix A - Fiktiver Datensatz mit variierender x2 -Variable 119
4.2 Appendix B - Fiktiver Datensatz zur Pfadanalyse mit Panel-
daten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
1
4.3 Appendix C - Fiktive Datensätze für eine Regression mit Dif-
ferenzenvariablen . . . . . . . . . . . . . . . . . . . . . . . . . 121
4.3.1 Datensatz mit einer eher realistischen Struktur . . . . . 121
4.3.2 Datensatz mit einer eher unrealistischen Struktur . . . 122
4.4 Appendix D - Datensatz zur Berechnung eines FEM . . . . . . 123
4.4.1 Ursprungsdatensatz . . . . . . . . . . . . . . . . . . . . 123
4.4.2 Datensatz mit Dummy-Variablen . . . . . . . . . . . . 124
4.5 Appendix E - Korrelations- und Kovarianzmatrix der Indika-
toren für ein Strukturgleichungsmodell . . . . . . . . . . . . . 125
4.6 Appendix F - Modellzeilen in LISREL für verschiedene Vari-
anten von Strukturgleichungsmodellen . . . . . . . . . . . . . 126
4.7 Kurzer Verweis auf Grundlagen der linearen (Regressions-)Analyse128
Literaturverzeichnis 134
2
Kapitel 1
Einleitung
Dieses Skript umreiÿt einige Möglichkeiten, sog. Paneldaten zu analysieren.
Diese Möglichkeiten werden oft unter dem Begri der Panelanalyse subsu-
miert. Ehe auf diesen Begri eingegangen wird, sollten aber zuerst elemen-
tarere Begrie geklärt werden:
Man redet von Paneldaten, als Spezialfall von Längsschnittdaten, wenn

sie über sog. Panelstudien erhoben werden, denen das Paneldesign unter-
1
liegt. Solche Studien haben gemeinsam, dass sie zu mehreren Zeitpunkten
dieselben Messungen an den gleichen Objekten vornehmen. Diese drei Aspek-
te, welche sich auf die Zeit-Dimension, die erhobenen Merkmale und auf die
Untersuchungseinheiten beziehen, charakterisieren Panelstudien. Die Mess-
zeitpunkte werden üblicherweise als sog. Wellen bezeichnet. Eine Panelstudie
mit z.B. 4 Wellen würde bedeuten, dass zu vier Zeitpunkten Messungen an
denselben Objekten vorgenommen worden sind. Hat eine Panelstudie m Wel-

len (W ) und k Variablen (V ), lässt sie sich bezeichnen als mW kV -Panel.
Wird z.B. Soziologie-Studenten der Universität Duisburg über mehrere Se-
mester immer zu Semesterbeginn derselbe Fragebogen zum Thema Zufrie-
denheit mit der Universität Duisburg vorgelegt und handelt es sich dabei
immer um dieselben Personen, dann spricht man von einer Panelstudie.
Streng genommen sind die oben eingeführten Kriterien zu hart formuliert,
denn kleine Abweichungen z.B. der Items im Fragebogen von Zeitpunkt zu
Zeitpunkt und eine geringe Fluktuation der Teilnehmer lässt es immer noch
zu, den Begri Panelstudie zu verwenden. In der Umfragepraxis hat es sich
1Weitere Arten, Längsschnittdaten zu erheben (und die daraus resultierenden Konsequenzen) werden weiter unten
anhand der Gegenüberstellung mit der Trendstudie kurz diskutiert, sonst werden sie in diesem Skript nicht thematisiert.
3
ferner eingebürgert, vom Panel schon dann zu sprechen, wenn dieselben Per-
sonen mehrmals befragt werden, auch wenn das Messinstrument von Welle
zu Welle völlig unterschiedlich ist. Dies ist nicht zuletzt auf die immer stär-
kere Verbreitung von sog. (Online-)Access-Panels, meist in der Marktfor-
schung, zurückzuführen. Der Betreiber eines Access-Panels rekrutiert einen
möglichst groÿen und heterogenen Pool von Teilnehmern, welche über Bonus-
und Incentive-Systeme zu zukünftigen Teilnahmen an diversen Befragungen
motiviert werden. Verschiedene Auftraggeber können nun an den Betreiber
herantreten, um Befragungen mit einer (meist nach Merkmalen gezielt ausge-
wählten) Teilmenge der Probanden des Access-Panels durchzuführen. Diese
Praxis muss allerdings von der klassischen Vorgehensweise bei der Realisie-
rung eines Paneldesign abgegrenzt werden. Sie wird im Skript nicht weiter
berücksichtigt.
An dieser Stelle seien auszugsweise ein paar Beispiele für deutsche Panel-
studien, welche nicht gerade zahlreich in der Forschungslandschaft vertreten
sind, aufgeführt:
• Sozio-Ökonomisches Panel (DIW Berlin)
• Migrationsentscheidungen im Lebensverlauf und die Relevanz lokaler
Bedingungen (Uni Bremen)
• Kriminalität in der modernen Stadt Jugenddelinquenz und -devianz
im Wandel von urbanen Sozialmilieus, Lebens-, Freizeit- und Konsum-
stilen, ethnisch-kulturellen Orientierungen und sozialer Kontrolle (Uni
Münster/Bielefeld)
• Panelstudien innerhalb des DFG-Projektes Survey Methodology
Kooperation mehrerer Universitäten, die sich methodischen Fragen in
Bezug auf die Qualität von Umfragedaten widmet (u.a. Uni Duisburg
/ Bremen)
Das Sozio-Ökonomisches Panel (kurz auch SOEP) ist der mit Abstand
gröÿte Paneldatensatz, welcher in Deutschland erhoben wurde und wird. Ge-
startet 1984 mit einer Stichprobe von knapp 6000 Haushalten (ca. 12.000
Personen) und bis heute fortgeführt, bietet er eine groÿe Bandbreite an Va-
riablen zu sozialen, ökonomischen und demographischen Themengebieten.
4
Die anderen aufgeführten Beispiele für Panelerhebungen (ausgenommen
Survey Methodology) stellen eher verhältnismäÿig kleine Erhebungen dar,
die auf eine bestimmte spezielle Fragestellung ausgerichtet sind (Jugenddeli-
quenz bzw. Städte-Migration).
Nun soll einführend auf das Hauptthema dieser Arbeit, die Panelanalyse,
eingegangen werden.
Der Begri Panelanalyse impliziert, dass es eine einheitliche Form der

Analyse von Paneldaten gibt, die exklusiv nur für solche Daten existiert.
Dem ist nicht so. Deshalb ist dieser Begri etwas irreführend. Zunächst ein-
mal sei erwähnt, dass der Begri der Panelanalyse als ein weit reichender
Sammelbegri zu verstehen ist. Darüber hinaus muss die eben angesprochene
Exklusivität in Frage gestellt werden, denn oft bedient sich die Panelanaly-
se gängiger statistischer Techniken z.B. aus dem Bereich der multivariaten
Analyse , welche auf die Besonderheiten von Paneldaten hin modiziert wer-
den. So nden im Zuge der Analyse bekannte Analyseformen und -modelle
wie Regressions- und Pfadanalyse, Strukturgleichungsmodelle, Analyse
latenter Klassen etc. ihren Platz.
Es müssen im Vorfeld also die gängigen Vorüberlegungen stattnden, welche
denen im Falle einmalig erhobener Daten gleichen:
• Welches Skalenniveau weisen meine Variablen auf und welche Verfahren
sind auf die vorhandenen Skalenniveaus abgestimmt?
• Bleibe ich auf der Ebene der empirischen Variablen oder vermute ich,
dass einige meiner Variablen als Indikatoren zu sehen sind, hinter denen
sich latente Gröÿen verbergen?
• Habe ich fundierte Annahmen darüber, ob es gerichtete Zusammen-
hänge zwischen Variablen gibt, welche es mir erlauben, asymmetrische

2
Analyseverfahren zu verwenden?
Zu diesen gängigen Vorüberlegungen gesellen sich weitere Aspekte hinzu, die
sich speziell auf Paneldaten beziehen. Dazu gehören:
• Die Möglichkeit, Entwicklungen zu analysieren, da Daten zu mehreren
Zeitpunkten vorliegen; die Unterscheidbarkeit von Variablen wird somit
2 Hier bezieht sich der Autor auf verschiedene Variablen, die zu einem Zeitpunkt gemessen werden - diese Problematik
wird natürlich bei der Panelanalyse um weitere Aspekte beträchtlich erweitert (mehr dazu im Verlauf des Texts).
5
komplexer, da nun Unterscheidungen in Hinblick auf den Inhalt der
Variablen und in Hinblick auf den Messzeitpunkt der Variablen möglich

3
sind .
• Die Möglichkeit, intraindividuelle Prozesse zu analysieren, da Daten zu
mehreren Zeitpunkten an ein und denselben Personen gemessen worden
sind
Der erste Punkt macht zugleich den Reiz der Panelanalyse als auch ihre
Komplexität aus. Denn Veränderung ist aus statischer Perspektive eine emer-
gente Erscheinung, welche neuer Herangehensweisen bei der Analyse bedarf,
die sich aus dieser Perspektive (und so arbeitet der Statistiker, wenn er mit
den gängigen Methoden Querschnittsdaten analysiert) selbst nicht ergeben.
Deswegen, auch wenn die Panelanalyse z.T. auf gewohnte Analyseverfahren
zurückgreift, können diese Verfahren durch die Implementierung der Analyse
von Prozessen beträchtlich verkompliziert werden.
Der zweite Punkt stellt die Vorteile des Paneldesigns gegenüber anderen
Längsschnitterhebungen dar. Bei einer Trendstudie z.B. werden ebenfalls zu
mehreren Zeitpunkten die gleichen Merkmale aus der gleichen Grundgesamt-
heit erhoben, allerdings mit von Zeitpunkt zu Zeitpunkt variierenden Stich-
proben.
So können Aussagen über Wandel und Stabilität nur auf der Aggregatebene
getätigt werden. Datensätze aus Trendstudien können nur getrennt analysiert
werden, da eine Verknüpfung der Elemente zwischen den Datensätzen auf-
grund der unterschiedlichen Stichprobenzusammensetzung nicht möglich ist.
Intraindividuelle Veränderungen sind somit nicht identizierbar. Dies kann
zu einem beträchtlichen Informationsverlust führen.
Man denke an folgendes Beispiel: Es gibt in der Grundgesamtheit zwei
politische Parteien, Partei A und Partei B. Alle Individuen aus der Grund-
gesamtheit gehören einer Partei an und können problemlos jederzeit die Zu-
gehörigkeit wechseln.
Zum ersten Messzeitpunkt gehören Partei A 70% und Partei B 30% der
Grundgesamtheit an. Zum zweiten Zeitpunkt ndet man dasselbe Verhältnis
wieder. Es wird daraus geschlossen, dass sich nichts verändert hat, dass also
3Die bekannte Datenmatrix mit m Objekten und n inhaltlich unterschiedlichen Variablen lässt sich so um eine dritte
Dimension t erweitern, welche für die Zeitpunkte steht; es resultieren insgesamt n·t Variablen und - bei einem vollständigen
Datensatz m · n · t Daten; betrachtet man nur die n · t-Matrix (t spaltenweise), dann erklärt sich auch die Herkunft des
Begris, da diese (bei wenigen Zeitpunkten und vielen Variablen) wie ein Paneel aussieht.
6
alles beim Alten ist. Dies mag zwar für die simple Betrachtung von An-
teilswerten stimmen. Wenn kein tieferes Verständnis für die Strukturen und
Dynamiken innerhalb des Aggregats beansprucht wird, mag dieser Befund
ausreichen.
Wird hingegen ein tieferes Verständnis angestrebt, dann müssen Abläufe
auf intra-individueller Ebene betrachtet werden. Denn es ist im obigen Bei-
spiel vorstellbar, dass in der Zwischenzeit innerhalb der Parteien eine hohe
Mitglieder-Fluktuation vorherrschte. Im Extremfall könnten alle Mitglieder
der Partei B zum ersten Zeitpunkt zwischenzeitlich zur Partei A und ge-
nug Partei-A-Mitglieder zu Partei B gewechselt sein, so dass dieses 70/30-
Verhältnis aufrechterhalten wurde. Die wechselseitigen Wanderungen hätten
sich in diesem Fall somit gegenseitig kompensiert ein Prozess, der anhand
des Vergleichs der Anteilswerte nicht sichtbar wird.
An diesem Beispiel wird auch deutlich, dass wenn von intra-individuellen
Veränderungen die Rede ist, nicht etwa die Veränderung der Merkmale kon-
kreter Einzelfälle (z.B. die Gehaltsänderung von Herrn XY) im Fokus steht.
Vielmehr sind auch hier statistische Kenngröÿen auf Aggregatebene relevant
- z.B. der Anteil der Wechselwähler im Kontext zweier Bundestagswahlen.
Solche Erkenntnisse über Bewegungen innerhalb eines Aggregat können al-
lerdings, wie oben erwähnt, aufgrund der fehlenden Verknüpfbarkeit der Da-
4
tensätze einer Trendstudie, nur anhand von Paneldaten ermittelt werden.
Neben diesen erweiternden Möglichkeiten der Panelanalyse, welche von
groÿem theoretischen Reiz sein können, gibt es Besonderheiten, welche eher
vom Nachteil sind. Diese beziehen sich vor allem auf die Datenerhebung. Es
ist einleuchtend, dass eine Erhebung, welche zu mehreren Zeitpunkten durch-
geführt wird, aufwändiger, kostenintensiver und fehleranfälliger ist. Vor allem
macht sich diese Problematik durch die Eigenheit bemerkbar, an denselben
Personen (Objekten) zu mehreren Zeitpunkten Messungen durchzuführen.
Personen können nach einem oder mehreren Zeitpunkten ihre Teilnahme ver-
weigern oder sie fallen aus anderen Gründen weg (Panelmortalität). Das Dra-
matische daran ist, dass solche Ausfälle in Panelstudien eine gröÿere Tendenz
als bei Querschnittserhebungen dazu haben, systematisch zu sein. Anderer-
seits, im Falle einer Befragung (welche immer die Gefahr der Reaktivität
in sich birgt), könnten Befragte auf die Befragungssituation späterer Zeit-
4 Natürlich lassen sich in Querschnitts- und Trendstudien Variablenwerte retrospektiv erfragen und mit aktuellen Va-
riablenwerten vergleichen (z.B. Parteiwahl bei der aktuellen und bei der vorherigen Landtagswahl). Allerdings sind solche
retrospektiven Messungen hinsichtlich ihrer Reliabilität und Validität ziemlich problematisch.
7
punkte anders reagieren, als dies im Falle einmaliger Befragung geschehen
wäre (Paneleekte). Daraus könnten verzerrte, invalide Messungen resultie-
ren. Diese Besonderheiten führen zu weiteren Maÿnahmen, die Phase der
Datenerhebung zu optimieren und an Datensätze mit fehlenden Werten bei
der Analyse adäquat heranzugehen.
In diesem Skript wird diese Problematik nicht weiter vertieft, es kann aber
auf weiterführende Literatur verwiesen werden: Schnell (2005: Kap. 5.3.2.2.),
Arminger (1990: Kap. 4), Hsiao (2005: Kap. 9), Engel (2004: Kap. 5).
Auch treten Probleme in der Datenanalyse auf. Dies betrit vor allem den
Sachverhalt, dass die in zwei verschiedenen Wellen erhobenen Variablenwer-
te ein und derselben Person zum inhaltlich gleichen Merkmal nicht mehr als
zwei unabhängige Realisierungen eines Zufallsexperimentes verstanden wer-
den können. Die Annahme der stochastischen Unabhängigkeit ist aber wichtig
im Kontext verschiedener statistischer Verfahren. Diese Problematik wird im
Zuge einiger Anwendungen im Skript vertieft.
Zum weiteren Verlauf des Skripts:
Wie bereits erwähnt, stellt den Kern dieser Arbeit ein Auszug von Möglich-
keiten dar, Paneldaten unter der Berücksichtigung ihrer Besonderheiten zu
analysieren. Hierbei wird hauptsächlich auf lineare Modelle eingegangen.
Einige Grundlagen, der Regressionsanalyse z.B., müssen vorausgesetzt wer-
den. Hinweise zu diesem Thema für Einsteiger sind im Anhang 4.7 zu nden.
Grundlagen der Pfadanalyse, welche an die Regression anknüpft, werden kurz
im Kapitel 2.2 abgehandelt.
Es wird ferner gezeigt, dass Paneldaten einerseits dazu genutzt werden, Ent-
wicklungen zu analysieren, und andererseits neue Möglichkeiten für statistisch-

theoretische Überprüfungen von Modellen, z.B. auf Fehlspezikationen hin,
bieten.
Abgerundet wird diese Arbeit mit einem kurzen zusammenfassenden Über-
blick (Kapitel 3).
8
Kapitel 2
Ausgewählte Analyseverfahren
für Paneldaten
2.1 Elementare Veränderung der Werte einer

Variablen im Zeitverlauf
Veränderung, Wandel, Entwicklung, Prozess alles Begrie, die sich auf die
zeitliche Abfolge von Zuständen, Beschaenheiten, Strukturen und Konstel-
lationen beziehen. Gerade diese zeitliche Abfolge übt in vielen Wissenschaften
(und so ist es auch in den Sozialwissenschaften) einen gewissen Reiz aus, denn
viele Phänomene sind von ihrer Geschichte entkoppelt nicht zu verstehen.
Ein trauriges Beispiel stellt hierbei die grausame Vernichtung und Zerstö-
rung von Menschenleben und Materiellem im 2. Weltkrieg dar. Ohne die
vorangehende geschichtliche Entwicklung zu studieren, ist das Ausmaÿ die-
ser Katastrophe nicht zu begreifen (danach sicherlich auch nicht im Sinne
von Legitimierung , aber man versteht einige Zusammenhänge besser).
Des Weiteren sind Wissenschaftler stets bemüht, festgestellte Zusammen-
hänge als Kausalitäten zu interpretieren und eines der wichtigsten Kau-
salkriterien ist bekanntermaÿen das zeitliche Vorangehen einer Ursache, so
dass auch hier die Zeitdimension Eingang ndet. Der Sozialwissenschaftler
steht aber vor dem Dilemma, dass die zeitliche Abfolge von Eekten oft nicht
kontrollierbar ist. Denn er arbeitet häug mit Merkmalen, die sich nicht ma-
nipulieren lassen, wie z.B. Geschlecht, Intelligenz, Schichtzugehörigkeit etc.,
so dass bei der Erforschung von vielen sozialwissenschaftlichen Fragestellun-
gen nicht auf experimentelle Designs zurückgegrien werden kann.
9
Auch wenn in Panelstudien im Vergleich zu echten Experimenten keine
Möglichkeit besteht, den Stimulus (also die unabhängige Variable) zu ma-
nipulieren und die Folgen zu studieren, so führt das Paneldesign durch wie-
derholte Messungen den zeitlichen Aspekt ein, welcher die Aussagekraft in
Hinblick auf Veränderungen deutlich gegenüber der in Querschnittsanalysen
verbessert.
Zuerst soll nun gefragt werden, wie eine Veränderung statistisch zu be-
greifen bzw. zu analysieren ist. Ohne diesen Begri explizit zu denieren
sei auÿerdem erwähnt, dass dieser Begri von dem der Stabilität zu einem
Gegensatzpaar ergänzt wird. Je mehr sich also ein Merkmal über die Zeit
verändert, umso weniger Stabilität weist es auf und umgekehrt.
2.1.1 Der Korrelationskoezient als Indikator für Sta-

bilität und Veränderung?
Wenn sich die Werte einer Variablen x über die Zeit verändern, dann kann
das verschiedene Uraschen haben. Regressionsanalytisch ausgedrückt können
hier verschiedene unabhängige Variablen signikanten Einuss auf x haben.
Aber zum Einstieg soll die einfachste Form des Einusses betrachtet wer-
den: Eine Variable beeinusst ihre Werte über die Zeit durch sich selbst.
Wenn z.B. das Einkommen von Personen zum Zeitpunkt t abgefragt wird,
dann kann man erwarten, dass dieses Einkommen zum Zeitpunkt t+1 kon-
stant bleibt. Wird diese Erwartungshaltung erfüllt, so liegt bzgl. des Einkom-
1
mens Stabilität vor, ist das Gegenteil der Fall, so hat sich etwas geändert.
Doch wie macht sich denn Veränderung statistisch bemerkbar? Ein intui-
tiver Gedanke wäre, den Korrelationskoezienten zwischen einer inhaltlich
gleichen Variablen zum Zeitpunkt t und dem Zeitpunkt t+1 zu bilden. Je hö-
her er ausfallen würde, umso eher hingen die zwei Variablen zusammen und
durch umso mehr Stabilität wären sie folglich gekennzeichnet. Doch dieser
Gedanke ist nur auf den ersten Blick plausibel. Denn eine hohe Korrelation
kann zeitliche Stabilität zum Ausdruck bringen, aber eben nicht nur, sondern
ebenso eine gleichmäÿige, proportionale Veränderung , egal wie stark
sie ist.
1 Wobei dann noch lange nicht davon auszugehen ist, dass das Einkommen zum früheren Zeitpunkt selber Ursache für
den Wandel ist es ist eher anzuzweifeln. Ein plausibleres Beispiel wäre das rich-get-richer-Phänomen, welches impliziert,
dass mit zunehmendem materiellen Reichtum Personen immer stärker dazu tendieren, über die Zeit diesen Reichtum weiter
auszubauen.
10
Dies sei am folgenden Beispiel illustriert: Es wird als Variable das Ein-
kommen der Mitarbeiter verschiedener Abteilungen eines Groÿunternehmens
erhoben. Der Datensatz enthält Daten von dem Geringverdiener bis zum Ma-
nager mit einem Spitzengehalt. Wiederholt man diese Erhebung im gleichen
Unternehmen ein Jahr später und es hat sich kaum etwas bzgl. der Gehäl-
ter geändert, so würde der Korrelationskoezient nahe bei 1 liegen. Hätte
allerdings in der Zwischenzeit das Unternehmen beschlossen, alle Löhne um
20% zu erhöhen, dann würde durch diesen proportionalen Anstieg die Korre-
lation ebenfalls nahe bei 1 liegen, obwohl sich sehr wohl Einiges geändert hat.
Um diese beiden Sachverhalte voneinander zu trennen, soll nun die Zerle-
gung der Korrelation einer Variablen x zum Zeitpunkt 1 (x1 ) mit derselben
Variablen x zum Zeitpunkt 2 (x2 ) betrachtet werden.
Da sich die bivariate Korrelation zweier Merkmale aus der Kovarianz dieser
Merkmale (geteilt durch das Produkt der Standardabweichung der einzelnen
Variablen) errechnen lässt, wird hier zuerst die Zerlegung der Kovarianz der
Merkmale betrachtet. Dabei wird eine neue Variable ∆x eingeführt, welche
die Dierenz zwischen x1 und x2 und somit die Veränderung der x-Werte
eines Individuums zwischen den beiden Zeitpunkten zum Ausdruck bringt
(∆x = x2 − x1 ). Die Zerlegung gestaltet sich wie folgt (Vgl. Kessler 1981:
9):
Covx1 x2 = V arx1 + Covx1 ∆x (2.1)
Cov steht für Kovarianz und Var für Varianz.
Nachweis:
Pn
[(x −x )(x −x )]
Da ∆xi = x2i −x1i und die Kovarianz von x1 und x2 = i=1 1i n 1 2i 2
(wobei i = Laundex der einzelnen Werte von x1 und x2 , n = der
höchste Wert von i. x1 bzw. x2 sind die arithmetischen Mittel von x1
bzw. x2 ):
11
n
X
Covx1 x2 = [(x1i − x1 )(x2i − x2 )]
i=1
n
X
= [(x1i − x1 )((x1i + ∆xi ) − (x1 + ∆x))]
i=1
Xn
= [(x1i − x1 )((x1i + ∆xi ) − (x1 + ∆x))]
i=1
Xn
= [(x1i − x1 )(x1i + ∆xi − x1 − ∆x)]
i=1
Xn
= [x21i + x1i ∆xi − x1i x1 + x1i ∆x − x1i x1 − x1 ∆xi + x1 2 + x1 ∆x]
i=1
n
X
= [x21i − 2(x1i x1 ) + x1 2 + x1i ∆xi + x1i ∆x − x1 ∆xi + x1 ∆x]
i=1
n
X
= [(x1i − x1 )2 + (x1i − x1 )(∆xi − ∆x)]
i=1
n
X n
X
= (x1i − x1 )2 + [(x1i − x1 )(∆xi − ∆x)]
i=1 i=1
= V arx1 + Covx1 ∆x
(2.2)
Da an jeder Stelle der Gleichung durch ein konstantes n dividiert wird,

wurde aus Gründen der Übersichtlichkeit die Division durch n ausge-
blendet.
Hierbei ist der erste Summand V arx1 als der Teil der Kovarianz zu ver-
stehen, welcher die zeitliche Stabilität in den Werten der Variablen X zum
Ausdruck bringt. Das ist logisch, wenn man bedenkt, was passieren würde,
wenn der zweite Summand auf Null gesetzt wird. Dann ist nämlich die ge-
samte Kovarianz von x1 x2 auf die Varianz von x1 zurückzuführen. Es hätte
sich demnach nichts geändert.
Der zweite Summand Covx1 ∆x schlieÿlich drückt das gemeinsame Variieren
der Variablen X zum ersten Zeitpunkt mit der Dierenzvariablen aus. Er
kann somit als der Teil angesehen werden, welcher die Veränderung zum Aus-
druck bringt. So kann die Veränderung einer Variablen über zwei Zeitpunkte
12
in Hinblick darauf beurteilt werden, welchen Anteil die beiden Summanden
an der Kovarianz Covx1 x2 haben.
Die Korrelation lässt sich nun auf der Basis der eingeführten Kovarianzzer-
legung wie folgt darstellen ( r steht für den Korrelationskoezienten und
s für die Standardabweichung einer Variablen):
V arx1 +Covx1 ∆x
rx 1 x 2 = sx1 ·sx2 (2.3)
Anhand des folgenden Beispiels mit ktiven Daten soll gezeigt werden, wie
drei Variablenpaare jedes Mal einen hohen bivariaten Korrelationskoezien-
ten aufweisen, sich aber in der Zusammensetzung ihrer Kovarianz (also in der
Stabilität ihrer Werte) stark unterscheiden (Der Datensatz ist im Appendix
4.1 abgelegt).
Abbildung 2.1: Korrelationsmatrix
13
Abbildung 2.2: Kovarianzmatrix
Es wurden hierzu eine X1-Variable und drei mögliche Partner, also drei
potentielle X2-Variablen gebildet. Wie im Datensatz (s. 4.1) zu sehen ist,

weicht die Variable X2-WENIG kaum von den Werten von X1 ab, während
die Variable X2-MITTEL stärkere und X2-VIEL sehr starke Diskrepan-

2
zen aufweist. .
Allerdings handelt es sich hierbei um annähernd proportionale Abweichun-
gen. Dies manifestiert sich in den jeweiligen sehr hohen bivariaten Korrela-
tionen, wie in Abb. 2.1 zu sehen ist.
Nun können die Kovarianzen in Abb. 2.2 (in der Zeile Kovarianz) zwi-
schen der X1-Variablen und der jeweiligen Dierenzvariaben ∆ betrachtet
werden. Diese sind schlieÿlich nach Gl. 2.3 Bestandteil der Korrelations- bzw.
Kovarianzzerlegung zwischen X1 und der jeweiligen X2-Variablen.

Der erste Summand des Zählers in der Gl. 2.3, nämlich die Varianz von
X1 (V arX1 = 35), ist für alle drei Fälle konstant. Was variiert, ist hingegen
der zweite Summand, nämlich Covx1 ∆x , je nachdem, welche X2-Variable mit

2 Die drei weiteren Variablen sind als die Dierenzvariablen (∆) von X1 und der jeweiligen X2-Variablen deniert.
14
X1 gepaart wird. Es ist zu sehen, dass mit immer gröÿerer Diskrepanz diese
Kovarianz drastisch zunimmt:
• Für X2-WENIG: 1,8
• Für X2-MITTEL: 138,5
• Für X2-VIEL: 843,3
Mit der Zunahme der Kovarianz zwischen X1 und ∆ nimmt auch die Do-
minanz dieses Summanden an der Summe im Zähler von Gl. 2.3 zu. V arX1
bleibt schlieÿlich, wie bereits erwähnt, immer gleich.
Wenn also die Kovarianz zwischen zwei Variablen von der Kovarianz ei-
ner der beiden Variablen mit der Dierenzvariablen dominiert wird, dann ist
dieser Befund ein Indikator dafür, dass trotz eines möglicherweise hohen Kor-
relationskoezientes Veränderung (auf proportionaler Ebene) stattgefunden
hat.
Abschlieÿend sei nochmals darauf hingewiesen, dass die Ausführungen hier
sich nur auf relativ hohe Korrelationen beziehen und somit lediglich unter-
schieden wird zwischen hoher Stabilität und proportionaler (!!!) Veränderung.
Die Frage nach Veränderung an sich wurde hier nicht behandelt, es ist aber
logisch, dass ein niedriger Korrelationskoezient auf mangelnde Stabilität
und somit auf nicht-lineare Veränderung hindeutet.
2.1.2 Die einfache Regression einer zeitlich vorangestell-

ten inhaltlich gleichen Variablen auf die Variable
zum späteren Zeitpunkt
Die vorhin diskutierte Frage der Beziehung zwischen zwei inhaltlich gleichen
Variablen gemessen zu zwei verschiedenen Zeitpunkten lässt sich auch in
Form einer einfachen bivariaten Regression spezizieren. In diesem Falle ist
eine gerichtete Beziehung zu benennen und zwar mit x1 als der unabhängigen
und x2 als der abhängigen Variablen. Die Regressionsgleichung lässt sich wie
folgt formalisieren (auf den Index für einzelne Werte wurde aus Veranschau-
lichungsgründen verzichtet):
x 2 = a + b1 x 1 + e
15
mit:
a =Regressionskonstante
b1 =unstandardisierter Regressionskoezient der unabhängigen Variablen
e =Fehlerterm
Der Regressionskoezient ist im Vergleich zum Korrelationskoezienten
ein unstandardisiertes und asymmetrisches Maÿ (letzteres weil die Kovarianz
nur durch die Varianz der unabhängigen Variablen geteilt wird). Im Falle
bivariater Regression lässt er sich einfach berechnen durch:
Covx1 x2
bx 1 =
V arx1
Nach der in Kapitel 2.1.1 eingeführten Aufteilung lässt sich die Kovarianz
zerlegen. Dies eingesetzt ergibt:
V arx1 + Covx1 ∆x V arx1 Covx1 ∆x Covx1 ∆x

bx 1 = = + =1+
V arx1 V arx1 V arx1 V arx1
Covx1 ∆x
Der zweite Summand ist hierbei nichts anderes als der Regressions-
V arx1
koezient der unabhängigen Variablen auf die Dierenzvariable ∆x, im Fol-
genden bezeichnet mit b̂x1 . So kann man für die ursprüngliche Gleichung
schreiben:
x2 = a + (1 + b̂x1 )x1 + e
x2 = a + x1 + b̂x1 x1 + e
x2 − x1 = a + b̂x1 x1 + e
∆x = a + b̂x1 x1 + e (2.4)
Die letzte Gleichung stellt die Regressionsgleichung mit x1 als der unab-
hängigen und ∆x als der abhängigen Variablen dar. In dieser Gleichung
wird thematisiert, inwieweit die Veränderung in derX -Variable (präziser: die

Streuung der Dierenzvariablen), durch die Werte der X -Variable, gemessen
zum ersten Zeitpunkt, erklärt werden kann. Da Folgendes gilt: bx1 = 1 + b̂x1 ,
kann der Regressionskoezient der ∆x-Regression aus dem ursprünglichen
Koezienten bx1 einfach berechnet werden.
16
Die gerade besprochenen Regressionskoezienten sind unstandardisiert,
deswegen ist prinzipiell kein Wertebereich anzugeben, der starke Verände-
rung oder hohe Stabilität ausdrückt. Sie zu standardisieren würde aber im
bivariaten Fall wiederum die Werte des Korrelationskoezienten liefern, so
dass man vor dem ursprünglichen Problem zu Beginn des Kapitels 2.1.1 stün-
de.
Allerdings kann man etwas über perfekte Stabilität sagen: Ist bx1 = 1, so
ergibt sich für b̂x1 = 0. Geht man von einer fehlerfreien Regression aus, bei
welcher der Fehlerterm vernachlässigt werden kann, so wären in dem Fall
die Dierenzwerte (Werte von ∆x) allein durch die Regressionskonstante

bestimmt. Gilt weiter für diese a = 0, so hätte die Dierenzvariable durch-
gehend die Ausprägung 0 und es hätte sich demzufolge zwischen den Werten
von x1 und x2 nichts geändert.
Betrachtet man dann wieder die ursprüngliche Regression mit x2 als abhän-
gige Variable, so erscheint dies logisch, denn bei einer Regressionskonstanten
a = 0, dem Koezienten bx 1 = 1 und einem zu vernachlässigenden Fehler-
term würden sich die x2 -Werte direkt aus den x1 -Werten ergeben.
Trotz fehlender Standardisierung lassen sich die Regressionskoezienten
dann vergleichen, wenn den Variablen immer gleiche Messeinheiten zu Grun-
de liegen. Bezogen auf das obige Beispiel in Kap.2.1.1 ergeben sich folgende
Regressionsgleichungen:
X2W EN IG = −0, 295 + 1, 052 · X1 + e

X2M IT T EL = 0, 6421 + 4, 958 · X1 + e
X2V IEL = −1, 079 + 25, 093 · X1 + e
Man sieht, wie mit zunehmender Diskrepanz zwischen den x1 - und x2 -
Werten, also mit zunehmender Kovarianz von x1 und x2 der Regressionsko-
ezient stetig ansteigt.
Allerdings sei nochmals darauf hingewiesen: Dieser Zusammenhang gilt le-
diglich dann, wenn die Abweichung der x2 -Werte von den x1 -Werten gleich-
mäÿig, also proportional zunimmt. Ist dies nicht der Fall, kovariieren die
Werte nicht gleichmäÿig, so kann die Kovarianz und in der Folge der Re-
gressionskoezient sehr niedrig ausfallen.
Spätestens dann muss die univariate Ebene verlassen werden, denn es muss
17
3
weitere Variablen geben, welche die Veränderung in X beeinussen. Solchen
Sachverhalten widmen sich die nächsten Abschnitte.
2.2 Eine kurze Einführung in die Pfadanalyse

Einige der im Verlauf des Skripts vorgestellten Verfahren enthalten Elemente
der Pfadanalyse, so dass es zweckmäÿig ist, an dieser Stelle ihre elementare
Funktionsweise nahe zu bringen.
Die Pfadanalyse ermöglicht es, komplexe Zusammenhänge zwischen meh-
reren Variablen zu modellieren. In Regressionsmodellen z.B. formuliert man
Zusammenhänge zwischen einer abhängigen und mehreren unabhängigen Va-
riablen. Je nachdem, wie viele unabhängige Variablen einbezogen werden,
nimmt das Modell an Komplexität zu. Nun lassen sich aber darüber hinaus
noch komplexere Modelle denken. Solche Modelle können von der Pfadana-
lyse aufgegrien werden, sie erweitern den Regressionsansatz um folgende
Punkte:
• Es kann mehr als eine abhängige Variable formuliert werden
• Es können Variablen einbezogen werden, welche in Bezug auf einen Teil
der anderen Variablen als abhängige, und in Bezug auf einen zweiten
Teil der Variablen als unabhängige Variablen fungieren (somit können
indirekte Einüsse zwischen Variablen, die über mehrere zwischenlie-
gende Variablen vermittelt werden, mitmodelliert werden)
• Es werden sowohl gerichtete als auch ungerichtete Beziehungen zuge-
lassen
Da solche Zusammenhänge schnell kompliziert werden können, lassen sie
sich über Pfaddiagramme visualisieren. Folgende Spielregeln gelten:
• Zwei zusammenhängende Variablen werden durch Pfeile (auch: Pfade)
verbunden
3 Und wie schon an anderer Stelle angemerkt: Selbst bei hoher Stabilität kann die Variable X zum Zeitpunkt t1 nicht
unreektiert als eine kausale Wirkung auf sich selbst zum Zeitpunkt t2 angenommen werden.
18
• Bei einer gerichteten Beziehung zeigt der Pfeil auf die abhängige Va-
riable, im Falle der Ungerichtetheit zeigt der Pfeil auf beide Variablen
• Variablen, auf die kein einseitig gerichteter Pfeil zeigt, nennt man exo-
gene Variablen, alle anderen bezeichnet man als endogene Varia-
blen
• Über den Pfeilen stehende Werte werden Pfadkoezienten genannt

(Zur Bedeutung s.u.)
• Die zwei Subskripte eines Pfadkoezienten symbolisieren die zwei Va-
riablen, wobei die abhängige Variable als erstes gelistet wird (pyx würde
also bedeuten, dass y die abhängige und x die unabhängige Variable
ist); bei ungerichteten Beziehungen ist die Reihenfolge bedeutungslos
Wie bei Regressionsmodellen auch, werden Annahmen über die Verbin-
dungen der Variablen (durch Pfeile) a priori gemacht, also bevor konkrete
Berechnungen beginnen. Auch der Wert mancher Pfadkoezienten wird a
priori festgelegt (das kann z.B. die Annahme der Unkorreliertheit zwischen
Residuen und endogenen Variablen betreen).
Ein Beispiel für ein Pfaddiagramm mit acht Variablen (sechs gemesse-
ne Variablen + zwei Residualvariablen) sei in Abbildung 2.3 vorgestellt.
Aus Übersichtlichkeitsgründen wurden die Pfadkoezienten nicht abgetra-
gen. Das Diagramm stellt ein Modell von Felson and Bohrnstedt (1979) dar,
in dem die von Schulkindern wahrgenommene physische Attraktivität und
wahrgenommene Schulleistung der Mitschüler thematisiert worden ist (Auf

die Inhalte dieser Studie wird im Weiteren nicht eingegangen).
Nun ist zu fragen, wie die einzelnen Pfadkoezienten berechnet werden
und welche Bedeutung sie haben. Zuerst muss man wissen, dass Pfadmodelle
als mehrere miteinander verbundene Regressionsmodelle (Engel 1994: 22)
zu denken sind.
Die Pfadkoezienten drücken die Eekte einzelner Variablen aufeinander,
unter Berücksichtigung der Einüsse weiterer einbezogener Merkmale, aus
es sind sozusagen bereinigte Eekte.
Denn das Problem bivariater Korrelation (nullter Ordnung) zwischen zwei
Variablen ist, dass sie einen Zusammenhang ausdrückt, in welchem die Ein-
üsse weiterer auÿenstehender Variablen beinhaltet sein können. Diese sollen
19
1
GPA academic error1
height
1
weight attract error2
rating
GDA = Grade Point Average

height = Deviation of height from mean by grade and sex
weight= Weight adjusted for height
rating = Physical attractiveness rated by children outside class
academic = Perceived academic ability, based on class-mates’
ratings
attract = Perceived attractiveness, classmates’ ratings
beispiel.pdf
Abbildung 2.3: Beispiel für ein Pfaddiagramm
aus den Pfadkoezienten herausgehalten werden; wobei das nur für Varia-
blen möglich ist, welche im Modell aufgenommen werden.
Deswegen ist die schwierigste Aufgabe, überhaupt erst ein geeignetes Mo-
dell aufzustellen. Dazu gehört Fingerspitzengefühl. Die darauf folgenden Be-

4
rechnungen sind dann wiederum standardisierte Prozesse. Diesen wollen wir
uns nun an einem einfachen Beispiel widmen. Es wird folgendes Modell be-
trachtet (vgl. Opp 1976: 134 ):
4 Fragen nach der Modellanpassung werden an dieser Stelle erst mal ausgeklammert.
20
x
y z
ey ez
Abbildung 2.4: Pfaddiagramm des Beispiels
x,y und z sind beliebige gemessene Variablen

ey ist das zur Variablen y zugehörige Residuum
ez ist das zur Variablen z zugehörige Residuum
Zuerst soll davon ausgegangen werden, dass die Variablen z-transformiert
sind, um bestimmte Berechnungen zu erleichtern. Die Regressionskonstante
z.B. entfällt. Weiterhin wird angenommen, dass die Zusammenhänge zwi-
schen den Variablen linear sind.
Nun lassen sich zwei Regressionsgleichungen aufstellen, die daraufhin inein-
ander verschachtelt werden. Die Residuen ey und ez werden als eigenständige
Variablen behandelt, so dass auch ihnen Pfadkoezienten zugewiesen wer-
den. Diese Pfadkoezienten werden gemäÿ oben eingeführter Konvention
bezeichnet. Die Gleichungen lauten:
y = pyx x + pyey ey (2.5)
z = pzx x + pzy y + pzez ez (2.6)
An dieser Stelle schätzt man nicht die einzelnen Parameter wie in der
Regressionsanalyse, sondern man versucht, die einzelnen Pfadkoezienten
durch Umformung und Verschmelzung der Gl. 2.5 und 2.6 zu ermitteln. Hier-
zu wird zunächst jede Gleichung mit jeder unabhängigen Variablen (auÿer
mit den Residuen) gesondert multipliziert:
yx = pyx x2 + pyey ey x (2.7)
21
zx = pzx x2 + pzy yx + pzez ez x (2.8)
zy = pzx xy + pzy y 2 + pzez ez y (2.9)
Es entstehen drei Gleichungen, da Gl. 2.5 eine und Gl. 2.6 zwei unabhängige
Variablen enthält.
Nun wurde bislang zur Vereinfachung auf den Fälle-Index i verzichtet.
Trotzdem gilt für jede Variable, dass sie Platzhalter für die Werte einzelner
Fälle ist. Im Gegensatz dazu sind die Pfadkoezienten für alle Fälle N kon-
stant. Die einzelnen Variablen und Variablenprodukte lassen sich demnach
zur Mittelwertsformel erweitern. Daraufhin werden die Gleichungen 2.7, 2.8
und 2.9 modiziert:
Σ(yx) Σ(x2 ) Σ(ey x)

= pyx + pyey (2.10)
N N N
Σ(zx) Σ(x2 ) Σ(yx) Σ(ez x)

= pzx + pzy + pzez (2.11)
N N N N
Σ(zy) Σ(xy) Σ(y 2 ) Σ(ez y)

= pzx + pzy + pzez (2.12)
N N N N
Dem Umstand, dass es sich um standardisierte Variablen handelt, welche
also alle einen Mittelwert von Null und eine Standardabweichung von Eins
haben, ist zu verdanken, dass die Mittelwerte der Variablenprodukte den
bivariaten Korrelationen der jeweiligen zwei Variablen entsprechen.
Bezeichnet man die Korrelation der Variablen i und j als rij und bedenkt
man, dass eine Korrelation einer Variablen mit sich selbst Eins ergibt, dann
vereinfachen sich Gleichungen 2.10 - 2.12) wie folgt:
ryx = pyx + pyey rey x (2.13)
rzx = pzx + pzy ryx + pzez rez x (2.14)
rzy = pzx rxy + pzy + pzez rez y (2.15)
22
Setzt man weiterhin die Annahme, dass die Residuen nicht mit den unab-
hängigen Variablen korrelieren, dann erfolgt eine weitere Vereinfachung:
ryx = pyx (2.16)
rzx = pzx + pzy ryx (2.17)
rzy = pzx rxy + pzy (2.18)
Der Pfadkoezient pyx entspricht der Korrelation ryx . Dies sollte nicht wei-
ter verwundern, denn in diesem hier betrachteten einfachen Modell wird die
Variable y nur von x beeinusst. Die zwei weiteren Korrelationen setzen sich
dagegen aus mehreren Summanden zusammen. Um die Pfadkoezienten zu
bestimmen, muss substituiert werden. Dies ist die Stelle, an der die Ver-
schachtelung der zwei multiplen Regressionsmodelle beginnt.
Man löst Gl. 2.17 nach pzx auf und ersetzt pzx in Gl. 2.18 mit dem Ausdruck
rzx − pzy ryx . Nun lässt sich die neue Gleichung nach pzy auösen. Es ergibt
sich:
rzy − rzx rxy

pzy = 2
1 − ryx
Analog dazu verfährt man mit pzx , so dass sich im Endeekt für die drei
Pfadkoezienten drei Ausdrücke ergeben, welche sich aus den bivariaten Kor-
relationskoezienten zusammensetzen. Sie lauten:
pyx = ryx (2.19)
rzy − rzx rxy

pzy = 2
(2.20)
1 − ryx
rzx − rzy rxy
pzx = 2
(2.21)
1 − ryx
Generell lässt sich sagen, dass sich die Pfadkoezienten, wie auch Kor-
relationskoezienten, in einem standardisierten, interpretierbaren Intervall
23
−1 ≤ p ≤ +1 bewegen.
Gleichung 2.19 wurde bereis oben diskutiert. An den anderen Gleichungen
2.20 und 2.21 sieht man, dass die jeweiligen Pfadkoezienten die entspre-
chenden bivariaten Korrelationen bereinigen.
Betrachtet man z.B. für Gl. 2.20 nur den Zähler, dann sieht man, dass von
der Korrelation rzy das Produkt der anderen Korrelationen, nämlich rzx rxy
subtrahiert wird. Somit sieht man schon hier, dass je dominanter die eigent-
liche Korrelation der im Pfadkoezienten betrachteten Variablen gegenüber
den weiteren Korrelationen ist, umso gröÿer (bei Konstanthaltung des Nen-
5
ners) der Wert des Pfadkoezienten wird.
Geteilt wird in Gl. 2.20 durch den Anteil der nicht erklärten Varianz,
wenn man eine einfache Regression mit den Variablen xy (also die, welche
6
hier auf z wirken) durchführen würde. Daraus lässt sich schlieÿen: Je höher
die quadrierte Korrelation zwischen den auf z wirkenden Variablen ist (bei
Konstanthaltung des Zählers), umso gröÿer ist pzy .7 .

Somit bleibt soz. als Bösewicht die Korrelation von rzx übrig. Wenn sie
hoch ist, ist sie in erster Linie dafür verantwortlich, wenn der Pfadkoezient
pzy rzy eher niedrig ausfällt. Dies ist logisch, da in

auch bei hohen Werten von
unserem Beispiel die Variablen x und y um den Einuss auf z konkurrieren.
Betrachten wir den bereinigten Einuss von y auf z (was ja bei pzy der Fall
ist), so wird er höher ausfallen, wenn der Einuss von x auf z möglichst
gering ist und letzterer manifestiert sich schlieÿlich in rzx .
Nun sei noch auf zwei Extremfälle hingewiesen:
pzy = rzy , wenn rxy = 0.

Auch dies ist logisch erschlieÿbar, denn in diesem Fall wirken y und x völlig
unabhängig voneinander auf z.
Auÿerdem gilt: pzy = 0, wenn rzx ryx = rzy .
Die Korrelation von z und y setzt sich in diesem Fall gewissermaÿen aus
den jeweiligen Korrelationen der beiden Variablen mit x zusammen. Hier-
nach hat [y ] keine Wirkung auf [z ], die unabhängig von dem Einuss von
[x] ist (Opp 1976: 142).
Um diese vorhin diskutierten Sachverhalte zu demonstrieren, sind im Fol-
5 Wobei dieses Verhältnis nicht linear ist

6 Die Frage nach der Richtung dieser Regression ist irrelevant, denn auch wenn die Regressionsanalyse ein asymmetri-
sches Verfahren ist, so ist der Determinationskoezient wiederum symmetrisch.
7 s. Fuÿnote 4
24
genden ktive Beispiele aufgeführt:
rzy rxy rxz Zähler Nenner pzy

0, 8 0, 7 0, 7 0, 31 0, 51 0, 61
0, 8 0, 6 0, 6 0, 44 0, 64 0, 68
0, 8 0, 55 0, 65 0, 44 0, 697 0, 63
0, 8 0, 65 0, 55 0, 44 0, 578 0, 76
Tabelle 2.1: Verschiedene Korrelationsstrukturen
Die Tabelle 2.1 zeigt vier Beispiele für unterschiedliche Werte der drei Kor-
relationskoezienten. Die Ausgangskorrelation rzy wurde in allen Beispielen
mit 0, 8 konstant gehalten, um zu zeigen, wie sich trotz der Invarianz dieser
Korrelation der Pfadkoezient verändert. Die Beispiele in Zeile 1 und 2 zei-
gen erst mal die allgemeine Tendenz, dass pzy steigt, wenn die anderen zwei
Korrelationen fallen.
Dann wird die Betrachtung weiter dierenziert. Die Werte von rxy und rxz
werden in Zeile 3 und 4 variiert, allerdings so, dass der Zähler immer gleich
bleibt und dem in Zeile 2 entspricht. So hängt pzy nur noch vom Nenner, bzw.
2 2
der Höhe von ryx ab. ryx hängt wiederum im Falle eines konstanten Zählers
von rxz ab, so dass sichtbar wird: Bei steigenden Werten von rxz , unter
Kontrolle weiterer Einüsse, wird der reine Einuss von y auf z
(pzy ) geringer.
An dieser Stelle bleibt noch zu sagen, dass die eben festgestellten Zu-
sammenhänge sich noch weiter verkomplizieren, wenn das Modell komplexer
wird. Deswegen wurde hier ein recht einfaches Modell gewählt, in dem die
Beziehungen überschaubar sind, um auf einfachem Wege in das Funktions-
prinzip der Pfadanalyse einzuführen.
Nun wurden die Pfadkoezienten im obigen Beispiel auf umständlichem
Wege ermittelt. Die Berechnung wird im Falle von mehr als drei Variablen
und einer steigenden Anzahl an postulierten Beziehungen noch umständ-
licher, da die Anzahl der Gleichungen, welche denen im Beispiel 2.7 - 2.9
entsprechen, schnell ansteigt.
25
Es gibt eine Formel, das sog. Grundtheorem der Pfadanalyse, welche allge-
mein gehalten ist und einiges an Rechenarbeit erspart (vgl. Opp 1976: 166
f ). Sie lautet:
X
rij = piq rqj (2.22)
q
Mit dieser Formel lässt sich jede Korrelation zweier beliebiger Variablen
xi und xj eines Pfadmodells ausdrücken. Der Index q symbolisiert hingegen
jede Variable, welche auf xi einen Einuss ausübt. Es gibt also so viele q-
Variablen, wie Pfeile auf xi zeigen.
Übertragen auf das obige Beispiel lässt sich z.B. rzx wie folgt ausdrücken
(wobei es drei q-Variablen gibt x, y und ez ):
rzx = pzx rxx + pzy ryx + pzez rez x (2.23)
Gemäÿ der Tatsache rxx = 1 und der Annahme rez x = 0 verkürzt sich der
rechte Ausdruck der Gleichung 2.23 zu pzx + pzy ryx und entspricht dem obi-
gen Ausdruck in Gleichung 2.17. Analog dazu verfährt man mit den anderen
Korrelationen. Danach bleibt es, wieder umzuformen und zu substituieren,
um die Pfadkoezienten zu bestimmen. Man hat sich aber die vorherigen
Rechenschritte ersparen können.
Zum Schluss sei noch erwähnt, dass die Pfadkoezienten immer Ausdruck
eines sog. direkten Eekts sind. Denn auch wenn sie in die Berechnung
die Korrelationen benachbarter Variablen einbeziehen, so stehen sie dennoch
unmittelbar auf dem kürzesten Wege, der zwei Variablen verbindet, nämlich
auf dem direkten Pfad zwischen ihnen.
Es gibt darüber hinaus noch einen sog. indirekten Eekt. Das ist ein
Eekt, welcher über mehrere dazwischenliegende Variablen verläuft.
Im obigen Beispiel (s. Abb. 2.4) hat die Variable x einen direkten Eekt
auf z, da sie durch einen Pfeil unmittelbar verbunden sind. Die Variable x
hat aber auch einen indirekten Eekt, welcher über y, also über zwei Pfade
verläuft. Dieser indirekte Eekt berechnet sich, indem die Pfadkoezienten,
welche auf dem Weg liegen multipliziert werden. Da es sich bei diesen Koef-
zienten um Werte < |1| handelt, wird bei zunehmender Anzahl an Schritten,
26
welche zwischen zwei Variablen liegen, das Produkt immer kleiner (da immer
mehr Faktoren, welche < |1| sind, miteinander multipliziert werden). Dies ist
logisch, denn je weiter weg zwei Variablen voneinander sind, umso weni-
ger können sie indirekt Einuss aufeinander ausstrahlen. Der Eekt verput
sozusagen auf dem langen Weg zwischen ihnen.
Es sei dann noch der Begri des totalen Eekts eingeführt. Der totale
Eekt erfasst sowohl den direkten als auch den indirekten Eekt. Er lässt
sich intuitiv einfach berechnen (E steht für Eekt):
Etotal = Edirekt + Eindirekt (2.24)
2.3 Eine einfache Pfadanalyse mit Paneldaten

Diese sehr theoretischen Ausführungen sollen durch ein praxisnahes Beispiel
aufgelockert werden. Die Basis stellen manifeste Variablen aus einem Panel-
8
datensatz dar. Der Datensatz ist ktiv .
Es geht darum, die Hypothese zu testen, wie Lebenszufriedenheit und Ge-
sundheitszustand zusammenhängen. Im ersten Augenblick denkt man intui-
tiv, dass der Gesundheitszustand eine kausale Wirkung auf die Lebenszufrie-
denheit haben kann. Aber die umgekehrte Richtung ist ebenfalls denkbar.
Schlieÿlich hört man immer wieder von Theorien, in denen behauptet wird,
dass eine gute psychische Verfassung (und dazu gehört schlieÿlich eine ge-
wisse Lebenszufriedenheit als Indikator) gesund hält. Die Richtung gilt es
anhand von Paneldaten zu testen. Es werden folgende Variablen in die Ana-
lyse einbezogen:
• subjektive Lebenszufriedenheit zum Zeitpunkt t: x1
• subjektive Lebenszufriedenheit zum Zeitpunkt t+5 Jahre: x2
• subjektiv eingeschätzter Gesundheitszustand zum Zeitpunkt t: y1
• subjektiv eingeschätzter Gesundheitszustand zum Zeitpunkt t + 5 Jah-

re: y1
• Residuum der Variablen x2 : ex2

8 s. Appendix 4.2
27
• Residuum der Variablen y2 : ey2
Weiterhin soll angenommen werden, dass die Variablen auf einer 7-stugen
Rang-Skala gemessen worden sind (von 1=sehr unzufrieden bis 7=sehr
zufrieden) und als quasi-metrische Variablen behandelt werden. Es werden
folgende Zusammenhänge postuliert (für ein Beispiel mit gleicher Modell-
struktur s. Engel 1994: 25 ):
• Der Querschnittseekt px1 y1 =rx1 y1
• Die sog. kreuzverzögerten Eekte p x2 y1 und p y2 x1
• Die sog. Stabilitätskoezienten px2 x1 und p y2 y1
• Die Unkorreliertheit der Residuen mit anderen Variablen: px2 ex2 = 0

und py2 ey2 = 0
Eine Visualisierung dieses Modells taucht in einem anderen Zusammenhang
in Abb. 2.13 auf.
Im Folgenden wird die Korrelationsmatrix dargestellt. Es sei noch mal dar-
auf hingewiesen, dass der Datensatz vom Autor frei erfunden ist und die
Korrelationen sicherlich stark überschätzt sind. Aber gönnen wir uns mal
den Luxus, auch mal mit hohen Korrelationen zu rechnen:
Korr. x1 y1 x2 y2
x1 0, 74 0, 87 0, 75
y1 0, 635 0, 816
x2 0, 63
y2
Tabelle 2.2: Korrelationsmatrix für eine Pfadanalyse
Hier lässt sich die oben eingeführte allgemeine Formel 2.22 anwenden,
so dass die Korrelationen der Modell-Variablen wie folgt ausgedrückt wer-
den (wobei Selbstkorrelationen und Korrelationen = 0 bereits rausgerechnet
sind):
ry1 x1 = py1 x1 (2.25)
28
rx2 x1 = px2 x1 + px2 y1 rx1 y1 (2.26)
rx2 y1 = px2 y1 + px2 x1 rx1 y1 (2.27)
ry2 x1 = py2 x1 + py2 y1 rx1 y1 (2.28)
ry2 y1 = py2 y1 + py2 x1 rx1 y1 (2.29)
Um die einzelnen Pfadkoezienten zu bestimmen, müssen nun die Glei-
chungen umgeformt und substituiert werden. Es ergibt sich zuerst für die
Stabilitätskoezienten :
rx2 x1 − rx2 y1 rx1 y1

px2 x1 = (2.30)
1 − rx21 y1
ry2 y1 − ry2 x1 rx1 y1
p y2 y1 = (2.31)
1 − rx21 y1
Des Weiteren lassen sich die kreuzverzögerten Eekte berechnen:
rx2 y1 − rx2 x1 rx1 y1

px2 y1 = (2.32)
1 − rx21 y1
ry2 x1 − ry2 y1 rx1 y1
py2 x1 = (2.33)
1 − rx21 y1
Die Ergebnisse für das Beispiel sind in der folgenden Tabelle 2.3 aufgelistet:
Querschnittseekt px1 y1 = 0, 742

Stabilitätskoezienten px2 x1 = 0, 89
py2 y1 = 0, 586
Kreuzverzögerte Eekte px2 y1 = −0, 03
py2 x1 = 0, 31
Tabelle 2.3: Ergebnisse Pfadanalyse
Ohne sich zu weit aus dem Fenster zu lehnen, möchte der Autor eine kleine
29
Deutung der Befunde vornehmen:
Zuallererst sieht man an p x1 y1 , dass die beiden Variablen x und y im Quer-

9
schnitt recht stark miteinander zusammenhängen.
Dann ist festzustellen, dass beide Variablen über die verstrichene Zeit rela-
tiv stabil in ihren Werten sind, wobei dies in einem stärkeren Maÿe auf p x2 x1 ,
also auf die Variable Lebenszufriedenheit zutrit. Während die Werte der
Korrelationen rx2 x1 und ry2 y1 recht nah beieinander liegen, macht sich die
stärkere reine Stabilität der Variablen x im Vergleich zu y bei den Pfadko-
ezienten deutlicher bemerkbar.
Die Stabilitätskoezienten fallen deutlich höher aus als die kreuzverzöger-
ten Eekte. Das liegt in der Natur der Sache, dass gewisse Variablen in einem
bestimmten Zeitraum nicht so stark variieren. Dennoch lässt sich ein nach
Augenmaÿ signikanter Eekt von x1 nach y2 ausmachen. Der Wert ist höher
als der praktisch nicht vorhandene Eekt px2 y1 . Auch hier ist die Diskrepanz
zwischen den beiden Pfadkoezienten höher als zwischen den Korrelations-
koezienten.
Das würde die These stützen, dass die Lebenszufriedenheit durchaus einen
Eekt auf den Gesundheitszustand haben kann. Aber auch hier sei nochmals
darauf hingewiesen, dass solche Ergebnisse mit Vorsicht zu interpretieren
sind. Eine echte Kausalität ist damit noch längst nicht nachgewiesen. Erstens
ist das zeitliche Vorangehen der wirkenden Variablen durch ein Paneldesign
nicht sicher bestätigt (da keine experimentelle Manipulation der wirkenden
Variablen vorliegt), zweitens ist nicht geprüft worden, ob das Modell kor-
rekt speziziert ist und somit keine wirkenden Drittvariablen ausgeschlossen
worden sind.
Trotz aller Bescheidenheit wären solche Ergebnisse, wenn sie denn einem
echten Datensatz zugrunde lägen, für den Statistiker ein kleines Erfolgser-
lebnis.
Auÿerdem lieÿ sich zeigen, dass bereinigte Koezienten in der Lage sind,
gewisse Relationen zwischen Zusammenhängen von Variablen deutlicher her-
vorzuheben, als das bei z.B. bivariaten Korrelationskoezienten der Fall sein
kann.
9 Das Problem der Multikollinearität soll hier nicht diskutiert werden.
30
2.4 Das Ein-Indikatoren-Modell als Ansatz zur
Unterscheidung zwischen Veränderung und
mangelnder Reliabilität
In diesem Abschnitt betrachten wir wieder nur eine inhaltliche Variable
zumindest auf der empirisch-deskriptiven Ebene. Allerdings wird diese Be-
trachtung um eine sog. latente Variable erweitert.
Das Konzept latenter Variablen postuliert, dass sich hinter gemessenen
Merkmalen u.U. latente Gröÿen verbergen, welche auf die Messung einen
kausalen Einuss haben. So kann man hinter der Zustimmung eines Befrag-
ten zu einem Item wie Ausländer haben in Deutschland nichts zu suchen
(empirische Variable) eine starke Ausprägung der latenten Variablen Aus-
länderfeindlichkeit vermuten.
Stellt man solch eine Verbindung zu latenten Gröÿen her, so werden in die-
sem Zusammenhang empirische Variablen als Indikatoren der latenten Va-
riablen bezeichnet. Die so entstehende Verbindung heiÿt Messmodell.
I.d.R. fungieren ganze Itembatterien als Indikatoren einer einzigen latenten
Gröÿe. So wird in einer Befragung, welche u.a. Tendenzen zur Ausländerfeind-
lichkeit messen soll, normalerweise eine Reihe ähnlicher Items (sog. multiple
Indikatoren) vorgelegt, und nicht nur, wie im obigen Beispiel, lediglich eins.
Dies hat zum Vorteil, dass einerseits durch Techniken wie die der Itemana-
lyse unbrauchbare Indikatoren identiziert und anschlieÿend entfernt werden
können und dass andererseits durch mehrere gute Indikatoren, welche als
wiederholte Messungen einer latenten Variablen verstanden werden können,
die Messung an sich insgesamt weniger fehlerbehaftet wird.
Denn genau das ist ein groÿes Problem: Jede Messung ist mit einem Feh-
ler behaftet. Dies lässt sich nicht verhindern. Es muss allerdings angestrebt
werden, den Fehler möglichst gering zu halten und dafür zu sorgen, dass
er unsystematisch ist, er sich also bei wiederholten Messungen soweit wie
möglich aufhebt. Das Konzept der latenten Variablen versucht, gerade solche
Variablen zu konstruieren, welche messfehlerfrei sind.
Die gerade erwähnten unsystematischen oder anders gesagt: zufälligen Mess-
fehler sind Ausdruck fehlender Präzision bei der Messung. Je präziser ein
Messinstrument misst, umso verlässlicher ist es, deswegen bezeichnet man
den hier angesprochenen Sachverhalt als die Frage nach der Reliabilität einer
31
Messung / eines Messinstruments.
Wenn nun eine gemessene Variable als einziger Indikator für eine latente
Variable betrachtet wird, dann wird hier der einfachste Fall modelliert: Das
Ein-Indikatoren-Modell. Die latente Variable ist hierbei inhaltlich mit dem

Indikator identisch, sie enthält allerdings keine Messfehler. Das ist eine sog.
true score variable. Geht man von einer Messung im Querschnittdesign aus,
so hat dieses Konzept keine Bedeutung, da sich aus einer einmalig gemesse-
nen Variablen nichts anderes als sie selbst konstruieren lässt. Aussagen über
Messfehler sind nicht möglich. Latente Variable und Indikator wären somit
redundant.
Dieser Zustand ändert sich, wenn Paneldaten zur Analyse hinzugezogen
werden. Denn nun stehen, bei z.B. zwei Zeitpunkten, zwei gemessene Va-
riablen (und zwei latente) der Analyse zur Verfügung. Die zweite Messung
kann hierbei als eine Wiederholung der ersten Messung angesehen werden
und wiederholte Messungen sind geeignet, um die Reliabilität einer gemesse-
nen Variablen zu schätzen.
Ohne sehr weit abzuschweifen, soll nun kurz auf die Grundlagen der klas-
sischen Testtheorie eingegangen werden, um die Berechnung der Reliabilität
plausibel darzustellen.
Jeder gemessene Wert x wird als Summe eines wahren Wertes und eines
Messfehlers begrien:
x=τ + (2.34)
mit τ =wahrer Wert und =Messfehler.
Unter der Annahme, dass wahrer Wert und Messfehler in einer Messreihe
unkorreliert sind (vgl. Engel 1994: 32), lässt sich die Varianz von x [V arx ]
folgendermaÿen darstellen:
V arx = V arτ + V ar (2.35)
Je gröÿer der Anteil der Varianz von τ (wahre Varianz) an der Gesamtvari-
anz ist, umso geringer ist die Varianz von (Fehlervarianz). Des Weiteren: Je
präziser (also: reliabler) eine Messung über mehrere Objekte ist, umso klei-
ner ist die Fehlervarianz. Somit lässt sich Reliabilität (p) formal denieren
32
als Anteil der wahren Varianz an der Gesamtvarianz:
V arτ
px = . (2.36)
V arx
Das Problem hierbei ist: Die wahren Werte sind meist unbekannt. Ständen
sie zur Verfügung, dann wäre das Problem gelöst und man könnte mit ih-
nen statt mit den gemessenen Werten weiterrechnen. Ebenso ist die wahre
Varianz unbekannt.
So bleibt es dem Statistiker, die Reliabilität auf anderem Wege zu schätzen.
Zu diesem Zwecke wurden verschiedene Verfahren entwickelt, welche gröÿten-
teils darauf basieren, dass mehrere Messungen als Wiederholungen ein und
derselben Messung zu verstehen sind. Denn wenn ein Messinstrument verläss-

lich ist, so muss es bei wiederholten Messungen sehr ähnliche Werte liefern.
Ein einfaches und intuitives Verfahren ist die Test-Retest-Methode: Ein und
dieselbe Messung an derselben Stichprobe wird zu zwei Zeitpunkten durch-
geführt. Die Korrelation dieser zwei Messungen gilt als Schätzung für Relia-
bilität. Eine solche Konzeption ist durch das Paneldesign zu verwirklichen.
Das zentrale Problem dieser Methode, welches oben als Vorteil des Pa-
neldesigns diskutiert wurde, ist die Zeit, welche zwischen zwei Messungen
verstreicht. Nur wenn man annimmt, dass sich die wahren Werte einer Mes-
sung zwischen zwei Zeitpunkten nicht verändert haben, gilt die Korrelation
zwischen den zwei Messwertreihen als unverzerrter Schätzer der Reliabilität.
Aber auch wenn der Statistiker notwendigerweise öfters zur Berechnung
gewisser Koezienten notwendige Annahmen setzt, so ist die Annahme in
diesem Fall sehr fraglich. Es gilt zu fragen:
Sind Schwankungen zwischen zwei zeitlich versetzten Messungen Ausdruck

von Veränderung oder von mangelnder Reliabilität?
Diese Unterscheidung wird aufgegrien, indem im Folgenden als latente
Variablen die wahren Werte der gemessenen Variablen x modelliert werden
(vgl. Engel 1994: 32 ). Liegt eine Messung zu zwei Zeitpunkten vor, so lassen
10
sich die Beziehungen im folgenden Pfaddiagramm veranschaulichen :
10
Standard mit dem Graphikprogramm nicht zu verwirklichen war; Unterstrich steht für
wurde ausgeschrieben und mit error bezeichnet.
Index des Pfadkoezienten
Die Bezeichnung der Pfadkoezienten in der Graphik weicht etwas ab von dem bisher gewählten Standard, weil dieser
, τ
33
Error Tau2
p_tau1tau2
Tau1 Tau2
p_tau1x1 p_tau2x2
Error 1 Error 2
x1 x2
Abbildung 2.5: Pfaddiagramm eines Ein-Indikatoren-Modells
Die Variablen lauten:
x1 = Die Variable x zum ersten Zeitpunkt

x2 = Die Variable x zum zweiten Zeitpunkt
τ1 = Die True-Score-Variable von x zum ersten Zeitpunkt
τ2 = Die True-Score-Variable von x zum zweiten Zeitpunkt
1 , 2 = Die Fehlerterme der Variablen x1 und x2
p
ξ2 = Die Fehlervariable von τ2 = 1 − p2τ2 τ1
Die Fundamental-Gleichung 2.22 lässt sich auch hier anwenden. Es ergeben

11
sich folgende Gleichungen :
rx1 x2 = px1 τ1 rx2 τ1 (2.37)
rτ2 τ1 = pτ2 τ1 (2.38)
rx2 τ1 = px2 τ2 pτ2 τ1 (2.39)
Durch Umformung und Substitution lässt sich die Test-Retest-Korrelation
rx1 x2 nun als Produkt von Pfadkoezienten darstellen:
11 Die Zerlegung von rx1 τ2 ist für diese Zwecke unbrauchbar.
34
rx1 x2 = px1 τ1 px2 τ2 pτ2 τ1 (2.40)
In diesem Kontext lassen sich px1 τ1 und px2 τ2 als Reliabilitätskoezien-

ten und pτ2 τ1 als Stabilitätskoezient begreifen. Setzt man die Annahme,
dass die Reliabilität eines Messinstruments über die Zeit stabil bleibt, dann
lassen sich px1 τ1 und px2 τ2 vereinheitlichen zu pxτ .

Gleichung 2.40 lässt sich somit schreiben als:
rx1 x2 = p2xτ pτ2 τ1 (2.41)
Aber auch in diesem Falle hat die Gleichung zu viele, nämlich zwei Unbe-
kannte, so dass eine saubere arithmetische Lösung nicht möglich ist.
Bezieht man allerdings einen dritten Messzeitpunkt ein, dann entstehen
neue Möglichkeiten. Unter der Annahme, dass τ1 keinen direkten Einuss auf
τ3 besitzt (vgl. Engel 1994: 36), gesellen sich zu der Test-Retest-Korrelation
aus Gl. 2.41 zwei weitere in Form von:
rx2 x3 = p2xτ pτ3 τ2 (2.42)
rx1 x3 = p2xτ pτ2 τ1 pτ3 τ2 (2.43)
Auch an dieser Stelle muss wieder Umformungsarbeit geleistet werden, die
aber schlussendlich in der eindeutigen Bestimmung der Koezienten mündet.
rx1 x2 rx2 x3
p2xτ = rx1 x3
r
pτ2 τ1 = rxx1 xx3 (2.44)
2 3
r
pτ3 τ2 = rxx1 xx3
1 2
An dem Reliabilitätskoezienten p2xτ erkennt man, dass je kleiner die Kor-
relation von x1 und x3 im Verhältnis zu den Korrelationen zwischen benach-
barten Zeitpunkten ist, umso gröÿer wird die geschätzte Reliabilität.
35
Dies ist einleuchtend, denn wenn die Werte des ersten und des zweiten Zeit-
punktes schwach miteinander korrelieren, die Werte des dritten Zeitpunktes
aber plötzlich wieder viel stärker mit den ersten Werten zusammenhängen,
dann liegt dies die Vermutung nahe, dass etwas mit dem Messinstrument
nicht stimmt.
Hier ist also stillschweigend die Annahme implementiert, dass sich Verän-
derung kontinuierlich vollzieht als Folge der Annahme von Linearität.
Ein Prozess, bei dem sich vom ersten zum zweiten Zeitpunkt vieles wan-
delt (z.B. Veränderung der Institution Familie), dieser Wandel aber Orientie-
rungslosigkeit nach sich zieht und sich in Folge dessen zum dritten Zeitpunkt
eine Rückentwicklung zur Struktur des ersten Zeitpunkts vollzieht (z.B. die
Rückbesinnung auf alte Werte), würde von diesem Modell nicht identiziert,
sondern als mangelnde Reliabilität gedeutet.
Dieser Sachverhalt wird auch an den Stabilitätskoezienten deutlich, da
vor allem die Höhe der Korrelation zwischen den entfernten Zeitpunkten t1
und t3 (im Zähler stehend) ausschlaggebend für die Beurteilung der Stabili-
tät / Veränderung zwischen benachbarten Zeitpunkten ist.
Auf ein grundlegendes Problem sei an dieser Stelle noch hingewiesen: Man
darf nicht vergessen, dass eine solch saubere arithmetische Lösung wie die
obige nur unter den getroenen Annahmen möglich ist. Würde man nicht
unterstellen, dass
• die Residuen unkorreliert sind (gerade bei Paneldaten ist dies fragwür-
dig),
• die Reliabilität über die Messzeitpunkte konstant ist
• und τ1 nicht direkt auf τ3 wirkt,
dann müsste man diese Sachverhalte ebenfalls modellieren, so dass sich mehr
Unbekannte als Gleichungen ergäben und in Folge eine rein rechnerische Lö-
sung nicht möglich wäre.
Nichtsdestotrotz lässt sich hier eine enorme Bereicherung festhalten, die
durch Paneldaten ermöglicht wird:
36
Ab drei Messzeitpunkten ist es möglich, mit Panel-
daten rechnerisch zwischen wahrer Veränderung und
mangelnder Reliabilität zu unterscheiden!
Es gibt weitere Ansätze, im Ein-Indikatoren-Modell die Reliabilität von
der Stabilität zu trennen (z.B. das Zurückgreifen auf Kovarianzen anstatt
auf Korrelationen), auÿerdem lässt sich das Modell zu einem multiplen Indi-
katorenmodell erweitern. Für Interessierte sei hier auf die Ausführungen von
Engel/Reinecke (1994: 38 ) verwiesen.
2.5 Regressionsmodelle für Paneldaten

Dieses Kapitel stellt Regressionsmodelle vor, welche speziell auf Paneldaten
zugeschnitten sind.
Gemeint sind hier vor allem lineare Modelle für manifeste Variablen. Im
Gegensatz zum vorhergehenden Kapitel wird die Ebene latenter Variablen
also wieder verlassen. Stattdessen liegt der Fokus darauf, sich mit der Ein-
beziehung von sich inhaltlich unterscheidenden Variablen zu befassen. Dies
war im Ein-Indikatoren-Modell nicht der Fall. Es ging letztendlich um eine
Variable x, gemessen zu mehreren Zeitpunkten und erweitert um ihre eigene
True-Score-Variable.
Nachdem also in diesem Kapitel auf manifester Ebene mehrere in Bezie-

12
hung zueinander stehende Variablen betrachtet werden , kann im nächsten
Kapitel dazu übergegangen werden, diese Betrachtungsweise um latente Grö-
ÿen zu erweitern. Tabelle 2.4 gibt hierzu eine Übersicht:
Nur manifeste Variablen Manifeste+Latente Variablen

Eine inhaltliche Variable Kap. 2.1 Kap. 2.4
(elementare Veränderungen) (Ein-Indikatoren-Modelle)
Mehrere inhaltliche Variablen Kap. 2.3/2.5 Kap. 2.6

(Pfadmodelle/Regressionsmodelle) (Strukturgleichungsmodelle)
Tabelle 2.4: Übersicht über die Eigenschaften vorgestellter Modelle
12dies geschah zwar bereits in dem Beispiel zur Pfadanalyse, allerdings wurde das Verfahren konventionell angewendet,
ohne speziell auf das Paneldesign hin modiziert zu werden.
37
Wenn auch dieses Kapitel speziell Regressionsmodellen gewidmet ist, so
schärfen die hier vorgestellten Kriterien, nach denen Modelle für Paneldaten
unterschieden werden, den Blick für die sich erönenden Möglichkeiten, aber
auch statistisch-mathematischen Fallen, die generell mit Paneldaten einher-
gehen.
Zunächst einmal muss, wie auch schon an früheren Stellen des Skripts deut-
lich wurde, eine einheitliche und präzise Darstellung der Individual- und der
Zeitebene gesichert sein. Nur auf diesem Wege können die unterschiedlichen
Regressionsmodelle formal korrekt dargestellt werden. Dies geschieht in der
Regel mithilfe einer Index-Notation, wie sie auch schon aus der Querschnitts-
regression bekannt ist. Hier wird allerdings neben der Unterscheidung nach
Individuen auch ein Index für die Unterscheidung nach Zeitpunkten einge-
führt.
Die Ergänzung einer Variablen x um den Personenindex i (mit i =

1, 2, ..., N ) und den Wellenindex t (mit t = 1, 2, ..., T ), zu xit drückt also
aus, dass x Werte verschiedener Personen zu verschiedenen Zeiten annehmen
kann. x2,4 wäre folglich der x-Wert der 2. Person zum 4. Zeitpunkt einer
Untersuchung.
Nun lassen sich neben den Variablen auch die Koezienten eines Regres-
sionsmodells mit diesen Indizes versehen. Somit wäre im Falle der einfachen
13
Regression theoretisch das folgende Maximal-Modell denkbar:
yit = ait + bit xit + it (2.45)
mit
yit = Wert der abhängigen Variablen für die i-te Person zum Zeitpunkt t
ait = Regressionskonstante für die i-te Person zum Zeitpunkt t
bit = Regressionskoezient für die i-te Person zum Zeitpunkt t
xit = Wert der unabhängigen Variablen für die i-te Person zum Zeitpunkt
t
it = Residuum für die i-te Person zum Zeitpunkt t
Der Rückgri auf die Indizes verkürzt die Darstellung, da die Modellglei-
chung 2.45 im Grunde für jedes i und t als separate Gleichung ausgeschrieben
13
einfach bezieht sich hier auf den Sachverhalt, dass das Modell inhaltlich gesehen eine einzige unabhängige Variable
berücksichtigt dies lässt sich jedoch bedenkenlos auf eine multiple Regressionskonstruktion übertragen; dies gilt auch
für weitere Formulierungen von Regressionsgleichungen in diesem Abschnitt.
38
werden könnte:
y1,1 = a1,1 + b1,1 x1,1 + 1,1

y2,1 = a2,1 + b2,1 x2,1 + 2,1
...
y1,2 = a1,2 + b1,2 x1,2 + 1,2 (2.46)
y2,2 = a2,2 + b2,2 x2,2 + 2,2

...
yN,T = aN,T + bN,T xN,T + N,T
Eine solche Modellformulierung ist jedoch weder inhaltlich sinnvoll, noch
sind die Koezienten mathematisch bestimmbar. Denn es müsste pro Per-
son und Zeitpunkt jeweils ein Regressionskoezient und eine Regressions-
konstante geschätzt werden. In der Regel dienen Regressionsmodelle aber
dazu, Zusammenhangsstrukturen auf Aggregatebene zu untersuchen. Indi-
viduelle Koezienten, die auch noch von Welle zu Welle variieren, würden
diese Funktion nicht erfüllen. So ist es selten für sozialwissenschaftliche Hypo-
thesenprüfungen von Interesse, z.B. den Regressionskoezienten von Herrn
Müller und seinen persönlichen y-Achsenabschnitt aus dem Jahr 2004 zu
kennen.
Mathematisch gesehen lassen sich die Koezienten darüber hinaus nicht
schätzen, da die Anzahl der Freiheitsgrade negativ ist. Denn es stehen viel
zu wenige Informationen zur Schätzung der groÿen Anzahl von Koezienten
zur Verfügung.
Doch auch wenn das Maximal-Modell lediglich ein Gedankenexperiment
darstellt, so sind doch einige Modelle mit variablen Regressionsparame-

tern konstruierbar, die inhaltlich plausibel und mathematisch berechenbar
sind.
Entscheidend ist hierbei, ob sich die Zusammenhangsstruktur auf einer der
beiden Ebenen (Zeiten- oder Personenebene) von der Zusammenhangsstruk-
tur auf der indierenten Gesamtebene (= Zeiten- + Personenebene) signi-
kant unterscheidet.
39
Zur Veranschaulichung dieses Gedankens sei ein Beispiel aufgeführt: Mal
angenommen, es liegen Paneldaten zur x = Dauer der Betriebszugehörig-
keit (unabhängige Variable) und y = Produktivität (abhängige Variable)
von Mitarbeitern einer bestimmten Firma vor. Es wird ein einfaches Regressi-
onsmodell yit = a + bxit + it formuliert, welches die Unterscheidung zwischen
der Zeiten- und der Personenebene ignoriert. Diese einfache Regressionsglei-
chung wird im folgenden als globales Modell bezeichnet. Nun sei angenom-
men, dass die Begutachtung der Koezientenschätzung zum Schluss führt,
dass kein signikanter Einuss von x auf y existiert.
Würden allerdings die Koezienten a und b nicht mehr als konstant für ein-
zelne Individuen betrachtet, so müsste das globale Modell reformuliert wer-
den müssen: yit = ai + bi xit + it (im folgenden: reformuliertes Modell). Nun
könnte sich zeigen, dass die individuellen bi -Koezienten gröÿtenteils signi-

kant und positiv sind. Dies würde bedeuten, dass für die meisten Mitarbeiter
in der Längsschnittbetrachtung gilt: Je länger ein Mitarbeiter i in der Firma

tätig ist, umso produktiver ist derselbe Mitarbeiter i. Dass dieser Zusammen-
hang zwischen x und y erst im reformulierten Modell zum Vorschein kommt,
liegt daran, dass er im globalen Modell durch inter-individuelle Unterschiede
verwischt wurde. Denn in dem globalen Modell wurden sowohl Unterschie-
de zwischen Individuen als auch Unterschiede innerhalb von Individuen im
Zeitverlauf undierenziert berücksichtigt. Besteht zwar im letzteren Falle ein
Zusammenhang zwischen x und y, im ersteren Falle aber nicht, so ist es
möglich, dass das globale Ergebnis ebenfalls keinen Zusammenhang attes-
tiert (vor allem dann, wenn die Anzahl N der Individuen der Anzahl T der
Zeitpunkte deutlich überlegen ist).
Somit ist in diesem Beispiel zu vermuten, dass der auf globaler Ebene nicht
anerkannte Einuss von x auf y auf einen fehlenden Zusammenhang im Ver-
gleich zwischen den Personen zurückgeht. Dies könnte bspw. damit erklärt
werden, dass in der Firma Arbeitsverhältnisse nicht konsequent in Abhängig-
keit der Produktivität aufrechterhalten bzw. beendet werden. Viell. herrscht
generell eine hohe Fluktuation in dem Betrieb. Oder es nutzen einige produk-
tive Mitarbeiter ihre Produktivität, um weiter aufzusteigen, während andere
produktive Mitarbeiter an einem Aufstieg kein Interesse haben und auf der-
selben Position verbleiben.
All diese Erklärungsskizzen implizieren inter -individuelle Unterschiede mit
einer fehlenden Systematik zwischen x und y. Diese sind aber derart mäch-
tig, dass das bestehende Zusammenhangsmuster auf intra -individueller Ebe-
40
ne im globalen Modell nicht zum Vorschein kommt. Das intra-individuelle
Zusammenhangsmuster ist allerdings in unserem Beispiel über das refor-
mulierte Modell nachgewiesen. Es besteht also ein, wenn auch spezischer
Zusammenhang zwischen x und y. Durchaus lässt sich schlussfolgern, dass
mit zunehmender Betriebszugehörigkeitsdauer die Produktivität steigt nur
eben immer im Verhältnis zum Produktivitätsniveau desselben Individu-

ums zu einem früheren Zeitpunkts. Da das globale Modell dies nicht
erkennt, muss es als fehlspeziziert deklariert werden.
Zur Klärung, ob eine Dierenzierung der Regressionsparameter nach i und
t sinnvoll ist, sollten in erster Linie theoretische Annahmen herangezogen
werden. Es ist aber auch eine rein statistische Überprüfung mithilfe von F-
Tests möglich (vgl. Hsiao 2005: 14. wird hier nicht weiter behandelt).
Die möglichen Dierenzierungen lässt sich formal veranschaulichen, indem
die Maximal-Gleichung 2.45 auf unterschiedlichen Kombinationswegen re-
stringiert wird. Allerdings sind nicht alle Kombinationsmöglichkeiten inhalt-
lich plausibel. An dieser Stelle seien daher nur die gängigsten Modellformu-
lierungen genannt:
1) Es wird angenommen, dass die Regressionsparameter über den Indivi-
duen aber nicht über die Zeit variieren können. Gleichung 2.45 vereinfacht
sich zu:
yit = ai + bi xit + it (2.47)
2) Ausgehend von Gleichung 2.47 könnte weiter dierenziert werden, ob nur
die Regressionskonstante oder nur der Regressionsparameter über i variieren

kann:
yit = ai + bxit + it (2.48)
yit = a + bi xit + it (2.49)
Es sei angemerkt, dass es gängiger ist, 2.48 anzunehmen. Die Begründung
hierfür wird in Kap. 2.5.1 geliefert.
3) Es kann letztendlich angenommen werden, dass beide Parameter für alle
i und t konstant sind. Dies würde zu dem sog. pooled model, also einem
41
einfachen Regressionsmodell führen, in dem die Panelstruktur ignoriert wird
(wie im obigen Beispiel im Falle des globalen Modells):
yit = a + bxit + it (2.50)
Die Koezienten des in 2.50 formulierten Modells lassen sich mit der Me-
thode der kleinsten Quadrate (KQ) auf gewöhnlichem Wege schätzen. Die
Parameter der Modelle 2.47 und 2.48 bedürfen hingegen eines verfeinerten
Schätzansatzes. In diesem Kontext wird der variierenden Regressionskonstan-
te ai ein zentraler Stellenwert beigemessen. Die Unterscheidung, ob ai als ein
zu schätzender Parameter oder als eine Zufallsvariable aufgefasst wird, führt
zu unterschiedlichen Vorgehensweisen bei der Schätzung und gipfelt in unter-
schiedlichen Interpretationen der Parameter. Eng damit verbunden sind zwei
Sachverhalte, und zwar 1.) die Frage, welche Quelle der Varianz (Variation
der Werte über Individuen vs. über Zeitpunkte) der im Regressionsmodell in-
volvierten Variablen berücksichtigt wird und 2.) die Frage, ob die Annahme
fehlender Autokorrelation der Residuen weiterhin plausibel ist, wenn Panel-
daten vorliegen.
Die nach diesen Gesichtspunkten zu unterscheidenden sog. xed- und
random-eects-Modelle werden im Kapitel 2.5.1 vorgestellt.
Die Frage, ob Regressionsparameter über i und t variieren können, lässt
sich ebenso für die Variablen eines Regressionsmodells stellen. So gibt es
Merkmale, deren Ausprägungen über die Zeit relativ konstant bleiben (z.B.
das Geschlecht) und welche, die sich relativ häug ändern können (z.B. die
Einschätzung über das aktuelle politische Geschehen). Auch kann es Merk-
male geben, die für Individuen relativ konstant sind, welche aber über die
Zeit variieren (z.B. die Inationsrate eines Landes). I.d.R. ist die Deklaration
einer Variablen x als x, xi , xt oder xit im Vergleich zur obigen Deklarati-
onspicht bei Regressionsparametern nicht notwendig. Denn die Werte einer
Variablen liegen nun mal vor und ändern sich nicht, je nachdem, ob sie mit ei-
nem i- bzw. t-Index versehen werden. Parameter müssen hingegen geschätzt
werden. In diesem Falle macht es einen substantiellen Unterschied, ob ein
Regressionsparameter über i bzw. t gleichgesetzt wird. Somit können Varia-
blen eines Regressionsmodells bedenkenlos in der Maximalversion, also als
xit bzw. yit notiert werden.
Der Sachverhalt ändert sich, wenn Annahmen über im Regressionsmodell
42
nicht -berücksichtigte unabhängige Variablen getroen werden. In diesem Fal-
le ist eine Unterscheidung sinnvoll, da sich mithilfe von sog. Dierenzenglei-
chungen die Einüsse einer bestimmten Klasse nicht berücksichtigter un-
abhängiger Variablen eliminieren lassen nämlich derer, die über die Zeit
konstant sind, für die also gilt: xit = xi .

Diese Art von Elimination wird in Kap. 2.5.2 diskutiert. Es sei nur kurz an-
gemerkt, dass in den oben erwähnten xed- und random-eects-Modellen
der Beseitigung der Eekte nicht-berücksichtigter Variablen ebenfalls ein zen-
traler Stellenwert zukommt. Zum Schluss des Kapitels 2.5.2 werden die Vor-
und Nachteile dieser Modelle denen des Dierenzenmodells gegenübergestellt.
Abschlieÿend werden noch Modelle mit endogener Dynamik angesprochen.
Diese Modelle berücksichtigen den Einuss, den die abhängige Variable zeit-
versetzt auf sich selbst ausübt. Somit fungiert die inhaltlich gleiche Variable
als unabhängige Variable, gemessen vor der Messung der eigentlichen abhän-
gigen Variablen z.B. in der Form: yit = a + bxit + cyi,t−1 + it , wobei c
den zur zeitverzögerten Variablen yi,t−1 zugehörigen Regressionskoezienten
darstellt.
Die mit einer solchen Konstruktion verbundenen Besonderheiten sind Be-
standteil des Kapitels 2.5.3.
Insgesamt wird deutlich, dass lineare Regressionsmodelle für Paneldaten

14
nach verschiedenen Kriterien kategorisiert werden können ein Auszug:
• Modelle mit unterschiedlichen Annahmen hinsichtlich der Va-

riation von Regressionsparametern über i und t (s. Kap. 2.5.1),
mit den Unterthemen:
Zerlegung der Varianz der abhängigen Variablen in eine objekt-

und eine zeitbezogene Komponente
Annahme korrelierender Residuen
• Dierenzenmodelle, in denen zwischen verschiedenen Typen

unabhängiger Variablen unterschieden wird (vor allem im Kon-
text nicht-berücksichtigter Variablen s. Kap. 2.5.2)
14 hier werden nur Kriterien aufgeführt, welche erst durch die Möglichkeiten, die Paneldaten erönen, bestehen. Natürlich
lassen sich Regressionsmodelle für Paneldaten ferner auch nach gängigen Unterscheidungskriterien dierenzieren, wie z.B.
nach Skalenniveau der involvierten Variablen.
43
• Modelle mit endogener Dynamik (also die Frage, ob unter den un-
abhängigen Variablen eines Modells die abhängige Variable eines frü-
heren Zeitpunkts auftaucht s. Kap. 2.5.3)
Es sei noch gesagt, dass sich diese Kriterien bei der Formulierung eines
Regressionsmodells auch kombiniert berücksichtigen lassen. So stellt sich für
Dierenzenmodelle und Modelle mit endogener Dynamik ebenfalls die Frage,
welche Annahmen hinsichtlich der Variation von Regressionsparametern über
i und t getroen werden.
2.5.1 Modelle mit variablen Regressionskostanten: Fixed-

und Random-Eects-Modelle
In der Einleitung dieses Kapitels 2.5 wurden einige gedankliche Ansätze zu
Regressionsmodellen mit Paneldaten angeschnitten:
1. die Frage, inwieweit Regressionsparameter über i und t variieren kön-
nen,
2. die Frage, inwieweit es notwendig ist, die Varianz einer (abhängigen)
Variablen in eine Personen- und eine Zeitkomponente zu zerlegen, und
3. die Frage, ob die Annahme fehlender Autokorrelation der Residuen
weiterhin plausibel ist, wenn Paneldaten vorliegen.
Diese Fragestellungen hängen stark miteinander zusammen. Deren gemein-
same analytische Umsetzung führt zur Modellierung der im späteren Verlauf
vorgestellten Fixed- und Random-Eects-Modelle. Zunächst werden aller-
dings diese Gedankengänge vertieft, um den Zusammenhang zwischen ihnen
zu verdeutlichen. Dabei wird bewusst auf eine starke mathematische For-
malisierung verzichtet (was aber in der Spezikation der Modelle nachgeholt
wird). Denn ehe die konkrete mathematische Umsetzung der Modelle bespro-
chen wird, sollen die sich dahinter verbergenden grundlegenden Ideen nach-
vollzogen sein. Allerdings müssen an manchen Stellen einige regressions- und
varianzanalytischen Grundlagen und Begriichkeiten als bekannt vorausge-
setzt werden. Im Abschnitt 4.7 des Anhangs werden einige Anregungen und
Literaturhinweise angeboten, falls diese Grundlagen nicht vorhanden sind.
44
2.5.1.1 Die Dekomposition der Varianz einer Variablen bei vor-
liegenden Paneldaten
Stehen Daten im Panelformat zur Verfügung, so ergeben sich drei Dimensio-
nen,
• Die Dimension der Variablen (deniert über Inhalte),
• Die Dimension der Objekte und
• Die Dimension der Zeitpunkte
Optisch lässt sich dieser Sachverhalt vorstellen, indem z.B. die übliche 2-
dimensionale Excel-Tabelle oder SPSS-Datenansicht um eine in den Raum
hineinragende Dimension erweitert wird (also die Form eines Quaders an-
nimmt).
Wird nur eine Variable betrachtet, so ergeben die Daten wiederum eine
2-dimensionale Tabelle, welche durch Objekte und Zeitpunkte aufgespannt
wird. Diese könnte beispielsweise für 4 Zeitpunkte und 7 Objekte so aussehen
(O=Objekte, Z=Zeitpunkte):
O↓ Z → t1 t2 t3 t4
1 1,3 1,4 1,4 1,2
2 3 3,1 3,3 3,4
3 8,8 8,4 8,5 8,6
4 5,5 9 3 2,4
5 5,4 8,9 2,8 2,1
6 5,7 9,1 2,6 2,1
7 3 9,9 8 5
8 8 4 2,6 11
9 6,5 2,1 0 8,6
Tabelle 2.5: Werte einer Variablen von Objekten zu verschiedenen Zeitpunk-

ten
Wird beim Vorliegen von Querschnittsdaten eine univariate Verteilung ana-
lysiert, so lässt sich nur eine Quelle der Variation feststellen: Werte einer
Variablen variieren mit den Beobachtungen, sprich mit den Objekten.
Diese Variations- oder Streuungsquelle erweitert sich bei Paneldaten durch
eine zweite Dimension. Nun kann dierenziert werden zwischen:
45
• Between Variation Variation zwischen den Objekten
• Within Variation Variation zwischen den Zeitpunkten
Betrachtet man in der Tabelle 2.5 die Daten für die Fälle 1 bis 3 (zeilenweise),
so kann man eine Dominanz der between variation gegenüber der within va-
riation feststellen. Die Werte der Objekte bleiben über die Zeitpunkte relativ
konstant, während sich die Werte zwischen den Objekten relativ stark un-
terscheiden. Dies könnte z.B. eine Gruppe unterschiedlicher Individuen sein,
welche bzgl. einer Einstellung jeweils eine eher gefestigte Meinung haben.
Die Fälle 4 bis 6 weisen genau das Gegenteil auf: Die Werte der Objek-
te variieren von Zeitpunkt zu Zeitpunkt sehr stark. Zwischen den Personen
aber sind sie relativ ähnlich. Within variation dominiert hier. Dies könnte ei-
ne Gruppe von Personen sein, welche sich z.B. bzgl. eines Verhaltensmusters
relativ ähnlich sind. Da sich aber zwischen den Messungen starker Wandel
vollzieht, äuÿert sich dieses Verhalten von Zeitpunkt zu Zeitpunkt unter-
schiedlich (z.B. vor und nach einem Krieg).
Schlieÿlich weisen die Fälle 7 bis 9 beide Arten der Streuung im ähnlichen
Ausmaÿ auf.
Nun stellen sich die Fragen, wie diese Varianz-Dekomposition mit der Idee
einer variablen Regressionskonstanten zusammenhängt und was in diesem
Kontext mit xen bzw. zufälligen Regressionskonstanten gemeint ist. Um
diese Fragen zu beantworten, muss der Umweg über die Idee der Varianz-
bzw. Kovarianzanalyse gegangen werden.
2.5.1.2 (Ko-)Varianzanalytische Überlegungen auf dem Weg zu

variablen Regressionskonstanten
Die Idee, in einer Regressionsgleichung eine variable Regressionskonstante
einzubauen, ist nicht speziell im Kontext der Panelanalyse entstanden. Viel-
mehr ist diese Möglichkeit immer gegeben, wenn sich die Fälle eines Da-
tensatzes in überschneidungsfreie Gruppen aufteilen lassen. Dann lassen sich
nämlich die Werte einer beliebigen Variablen x in der in Tab. 2.5 vorgeführten
zweidimensionalen Form auühren. In der formalen Darstellung der Werte
von x ist die Aufsplittung in zwei Dimensionen durch die Dierenzierung
der Laundizes umsetzbar. Der erste Index gibt die Gruppe an, derer ein
46
Objekt zugehört, der zweite Index erlaubt die Identizierung des Objektes
innerhalb der Gruppe. Ein Beispiel für diese Formalisierung könnte die Er-
gänzung einer Variablen x um die Indizes j mit j = 1, 2, ..., nk und k mit
k = 1, 2, ..., K xjk sein. Hierbei bezeichnet k den Laundex der jeweili-

zu
gen Gruppe mit K = Anzahl der Gruppen. j steht für den Laundex der
Objekte innerhalb einer Gruppe k , nk kennzeichnet entsprechend die Anzahl
der zur Gruppe k gehörenden Objekte. Wird bspw. als eine Variable x die
Körpergröÿe von Basketballspielern 18 verschiedener Vereine deklariert und
hat der fünfte Spieler (j = 5) der vierten betrachteten Basketballmannschaft

(k= 4) eine Körpergröÿe von 212 cm inne, dann lieÿe sich dieser Wert formal
15
darstellen als: x5,4 = 212.
Nun stellt die in Paneldaten mögliche Unterscheidung zwischen einer Per-
son und einem Zeitpunkt nichts anderes als einen Spezialfall der Einteilung
von Objekten in Gruppen dar: Die Gruppen sind die einzelnen Personen
(k = i)16 und die Mitglieder einer Gruppe k sind die Werte einer Person k
im Zeitverlauf (j = t). Auch die umgekehrte Gruppenzuweisung mit k =t
und j = i ist möglich. Es wird in den folgenden Ausführungen geklärt, warum
es sinnvoll ist, eine Person als eine Gruppe aufzufassen.
Zurück zu der allgemeinen Idee der Gruppierung von Objekten: Kausal-
analytisch gesehen ist eine solche Gruppierung dann sinnvoll, wenn vermu-
tet wird, dass die Gruppenzugehörigkeit einen Einuss auf eine Variable y
hat. Genau dies entspricht der Grundidee einer (im einfachsten Falle ein-
17
faktoriellen univariaten) Varianzanalyse: Über die Zerlegung der Varianz
von y in eine Innergruppen- und eine Zwischengruppen-Komponente wird
geprüft, inwieweit die Gruppierung einen Einuss auf die gesamte Streuung
der Variablen y hat. Dieser Einuss ist umso stärker, je homogener die Grup-
penmitglieder einer Gruppe (geringe Innergruppenvarianz) sind und je mehr
sich die Mitglieder verschiedener Gruppen im Vergleich unterscheiden (hohe
Zwischengruppenvarianz).
Ein Beispiel für einen mittleren Einuss der Gruppierung zwischen bspw.
der allgemeinen Lebenszufriedenheit y und dem Familienstand (mit insge-
samt K Ausprägungen bzw. Gruppen k = 1, 2, .., K ) könnte auf die folgen-
15Die Setzung des Kommas zwischen den beiden Indexwerten beugt lediglich der potentiellen Gefahr vor, die beiden
Werte fälschlich als einen Zahlenwert 54 zu lesen.
16entsprechend der bisherigen Notationen: einerseits s. Beginn von 2.5 (Dierenzierung der zwei Panelebenen), und
andererseits s. vorheriges Beispiel zur allgemeinen Notation im Falle gruppierter Objekte.
17An dieser Stelle kann keine erschöpfende Abhandlung über die Varianzanalyse erfolgen; es sei auf Backhaus (2006)
und auf das uni-interne Skript zu multivariaten Analyseverfahren (Stein, Pavetic, Noack) verwiesen.
47
de ktive Konstellation zurückgehen: Unter den ledigen Personen (k = 1)
weisen die meisten einen ähnlich niedrigen Zufriedenheitswert auf, sind also
eher unzufrieden. Dies äuÿert sich in einer geringen Innergruppen-Varianz
der Gruppe k =1 bei einem verhältnismäÿig niedrigen Gruppenmittelwert

18
y1) . Hingegen sind unter den verheirateten Personen (k = 2) die meisten
19
auf einem ähnlich hohen Niveau zufrieden somit auch hier eine geringe
Innergruppen-Varianz bei einem allerdings verhältnismäÿig hohen Gruppen-
mittelwert y2. Nur die Gruppe der Geschiedenen (k = 3) folgt nicht dem
gruppenhomogenen Trend, was sich statistisch an einer gröÿeren Innergruppen-

20
Varianz erkennen lässt bei einem im Gruppenvergleich moderaten Grup-
penmittelwert y3 nahe dem Gesamtmittelwert y (y 1 < y 3 ≈ y < y 2 ).

Die relative Heterogenität der Zufriedenheit in der Geschiedenen-Gruppe ist
dafür verantwortlich, dass der Zusammenhang zwischen Familienstand und
Lebenszufriedenheit nur moderat ausfällt. Im Extremfall wäre dieser Zusam-
menhang dann perfekt, wenn innerhalb jeder Familienstand-Gruppe absolute
Homogenität vorherrschen würde, also die Zufriedenheit jedes Gruppenmit-
glieds dem Gruppenmittelwert entspräche (y1k = y2k = ... = ynk k = y k ), und
sich die Gruppenmittelwerte aber voneinander unterscheiden würden, im Ex-
tremfall: y 1 6= y 2 6= ... 6= y K .21 In diesem Falle wäre die vollständige Varianz
von y auf die Gruppenunterschiede zurückzuführen.
Übertragen auf Paneldaten würde dieser perfekte Zusammenhang bedeu-
ten, dass die Werte einer abhängigen Variablen y im Falle k = i für jedes
Individuum über die Zeit konstant bleiben, sich aber zwischen den Individu-
en unterscheiden. Bevor diese Feststellung weiter vertieft wird, soll erst kurz
auf eine Erweiterung der Varianzanalyse eingegangen werden:
Die unabhängige Variable, welche die Gruppierung deniert, kann ein be-
liebiges Skalenniveau annehmen. Am sinnvollsten ist die Anwendung auf
nominalskalierte Variablen (wie eben Familienstand) und ordinale Varia-
blen, welche nicht als quasi-metrisch behandelt werden können. Für (quasi-
)metrische Variablen eignet sich hingegen die Regressionsanalyse eher, da in
18 Allgemein ist das arithmetische Mittel einer Gruppe y k deniert als n1

Pnk
yjk . Da hier k = 1, wird der Mittelwert
k j=1
1 PK Pnk
bezeichnet als y 1 . Der allgemeine Mittelwert von y lautet entsprechend: n k=1 j=1 yjk (n = n1 + n2 + ... + nK =
Anzahl aller Objekte)
19 Wahrscheinlich ist dieses Beispiel sehr unrealistisch.
20 die vereinfachend darauf zurückgeführt werden könnte, dass einige Personen eine Scheidung als Befreiungsakt und
andere als Verlust empnden.
21
Es sollten aber zumindest zwischen
demselben Wert entsprechen.
einigen
Gruppen Mittelwertsunterschiede bestehen, sonst würden alle
Der Extremfall ist unter Vorliegen der ersten Bedingung nicht zwingend für einen perfekten Zusammenhang notwendig.
Werte von y
48
der Schätzung von Regressionskoezienten der volle mathematische Gehalt
dieser Variablen ausgenutzt wird. So werden z.B. bei der metrischen Varia-
blen x = Körpergröÿe in cm zwei Ausprägungen x = 157 und x = 163 aus
varianzanalytischer Sicht lediglich als zwei verschiedene Gruppen betrach-
tet. Es wird aber nicht, wie in der Regressionsanalyse, die Information der
mathematischen Wertigkeit dieser Ausprägungen und des mathematischen
Abstandes zwischen 157 und 163 verarbeitet. Ferner führt bei metrischen
Variablen mit vielen Ausprägungen eine zu feine Gruppierung dazu, dass die
meisten Gruppen nur sehr schwach besetzt sind. Die aus einer Stichprobe
errechnete Innergruppen-Varianz für eine solchen schwach besetzte Gruppe
kann dann keine zuverlässige Schätzung der entsprechenden Subpopulations-
Varianz darstellen.
Aber im Prinzip folgen sowohl die Regressions- als auch die univariate Va-
rianzanalyse demselben Grundgedanken: der Aufklärung der Varianz einer
abhängigen Variablen. Im Endeekt unterscheiden sie sich, vereinfachend
formuliert, lediglich durch skalenniveau-abhängige Zulassungsbeschränkun-
gen in Hinblick auf unabhängige Variablen. Es liegt daher nahe, beide An-
sätze zu einem allgemeinen linearen Modell zu verknüpfen. Ausgehend von
der linearen Regression würde dies über die Aufnahme nominalskalierter Va-
22
riablen in Form von Dummy-Variablen (pro Gruppe ein Dummy) funk-
tionieren. Wird wiederum die Varianzanalyse als Ausgangspunkt gewählt, so
lassen sich metrische unabhängige Variablen in Form von sog. Kovariaten be-
rücksichtigen man spricht dann von der Kovarianzanalyse. Beide Ansätze
führen zu identischen Ergebnissen. Wird z.B. nur eine Gruppierungsvaria-
ble und eine abhängige Variable betrachtet, dann beziehen sich die über die
OLS-Schätzung berechneten Regressionskoezienten der Dummy-Variablen

23
auf die korrespondierenden Gruppenmittelwerte der abhängigen Variablen .
Anhand dieser Verbindung wird deutlich, dass im Endeekt ein und diesel-
be Sachlage aus zwei verwandten mathematischen Perspektiven untersucht

24
wird.
Angelehnt an die Terminologie der Varianzanalyse lässt sich im einfachen
22 Technisches Detail: Um die OLS-Schätzung mathematisch zu ermöglichen, muss ein Dummy in der Formulierung der
Regressionsgleichung weggelassen werden; die entsprechende Gruppe wird dann durch die Regressionskonstante repräsen-
tiert.
23 Auch diese Aussage muss technisch präzisiert werden. Denn der Gruppenmittelwert der in der Gleichung weggelassenen
entsprechen den Abweichungen

Gruppe stellt die Referenz dar und bestimmt den Wert der Regressionskonstanten. Die anderen Regressionskoezienten
des Gruppenmittelwertes von dieser Referenz.
24 Diese
anzanalyse unterstrichen; diese Unteroption erzeugtinnerhalb einer Varianzanalyse
Verknüpfung wird bspw. in STATA mit der Unteroption regress innerhalb des Befehls anova für eine Vari-
einen Output mit Regressionskoef-
zienten der Dummy-Variablen zu der in der Varianzanalyse spezizierten Gruppierungsvariablen.
49
Fall einer Gruppierungsvariablen und einer abhängigen Variablen y , entspre-
chend obiger Notation folgende Gleichung aufstellen:
yjk = ak + jk (2.51)
mit ak = Mittelwert von y in der Gruppe k, formal aufschlüsselbar:
K nk nk
1 XX 1 X
ak = y k = y − ∆k = yjk − (y − yjk ) (2.52)
n k=1 j=1 nk j=1
Der Gruppenmittelwert lässt sich somit trivial als die Dierenz des Ge-
1
Pnk
samtmittelwertes von ∆k schreiben, wobei formal gilt ∆k =
nk j=1 (y −yjk ).
Inhaltlich steht ∆k eben für den Eekt der Gruppe k, entspricht also dem
Wert, um den der Gruppenmittelwert von dem Gesamtmittelwert abweicht.
Die varianzanalytische Gleichung 2.51 kann nun um unabhängige metrische
Variablen erweitert werden, was letztlich zu der oben diskutierten Verbindung
beider Ansätze führt. Im einfachen Fall der Ergänzung um eine unabhängige
Variable x gilt:
yjk = ak + bxjk + jk (2.53)
mit b= der zu schätzende Einusskoezient der Variablen x.
Diese Gleichung entspricht exakt einer in der Einleitung dieses Kapitels
vorgestellten Variante von panelanalytischen Regressionsmodellen mit un-
terschiedlich variierenden Regressionsparametern, nämlich Gl. 2.49, in der
die Regressionskonstante über die Individuen i variiert und der Regressions-
koezient über i und t konstant ist.
Unabhängig von Detailfragen in Bezug auf die Schätzung der Parameter
von 2.53 können die Vorteile einer solchen kovarianzanalytischen Modellie-
rung benannt und auf die Paneldaten-Situation übertragen werden: Aus vari-
anzanalytischer Perspektive kann durch die Hinzunahme von Kovariaten der
Einuss der Gruppierung auf y unter Kontrolle eben dieser Kovariate abge-
schätzt werden. Wird zu dem obigen Beispiel als Kovariate x das persönliche
Nettoeinkommen der Probanden hinzugenommen, so lieÿe sich der Einuss
des Familienstandes auf die um den Einkommenseinuss bereinigte Lebenszu-
50
friedenheit quantizieren. Beispielsweise würde der Eekt eliminiert, der ent-
steht, wenn Personen durch eine Heirat automatisch aufgrund des Wechsels
25
der Steuerklasse einen höheren Nettoverdienst haben. Der vom Familien-
stand ausgehende Einuss bezieht sich also soz. auf die Lebenszufriedenheit,
aus der der Einkommenseekt herausgerechnet ist.
Aus einer regressionsanalytischen Perspektive kann umgekehrt genauso die
Wirkung des Einkommens unter Kontrolle des Familienstandes abgeschätzt
werden. Und genau diese Perspektive ist für die Betrachtung von Paneldaten
von groÿem Reiz. Die Möglichkeit, Gruppenzugehörigkeits-Eekte herauszu-
rechnen, erfordert nämlich lediglich die Kenntnis der Gruppenzugehörigkeit
eines Objektes. Das Wissen um die konkreten Mechanismen und Motiva-
tionen, welche zu dieser Mitgliedschaft führen, ist nicht notwendig. Wenn
nun bei vorliegenden Paneldaten ein Individuum eine Gruppe darstellt, dann
lassen sich mit Gl. 2.53 entsprechend die individuellen zeitkonstanten Eek-
te kontrollieren. So ist es nicht mehr notwendig, zeitkonstante Variablen, die
einen Einuss auf y haben könnten, zu entdecken, Daten zu ihnen zu erheben

und sie explizit mitzumodellieren. Sie rechnen sich automatisch (!) heraus.
Um zu verstehen, warum diese Eekte als zeitkonstant deklariert wer-
den, muss man sich die Grundidee der der Varianzanalyse nochmals
verdeutlichen: Es werden die Werte der abhängigen Variablen y der
Mitglieder einer Gruppe k nämlich immer in Bezug zum Gruppen-
mittelwert yk gesetzt. Der Gruppenmittelwert ist somit die Quanti-
tät, welche, als konstanter Bezugspunkt für alle Gruppenmitglieder ei-
ner Gruppe, diese analytisch miteinander verbindet. Die Mitglieder
im Paneldatenkontext sind einzelne Zeitpunkte. Ihre einzelnen Wer-
te sind also als Abweichungen vom Gruppenmittelwert yk zu sehen.
Der Gruppenmittelwert wiederum ist in diesem Kontext ein für ein
Individuum (=Gruppe) k konstanter Wert im Zeitverlauf. Diese Ab-

weichungen sind zwar als zeitliche Schwankungen aufzufassen, deren
Basis stellt aber mit yk immer der individuelle, zeitunveränderliche
Mittelwert dar. Dieser lässt sich begreifen als eine Art zeitkonstan-
te Ausgangslage des Individuums, von derer aus sich zeitpunkt- bzw.
ereignisbedingte Schwankungen ergeben.
Im oberen Beispiel zu Beginn des Kapitels 2.5 wurde der Zusammenhang
zwischen der Länge der Betriebszugehörigkeit und Produktivität im Zeitver-
25 wobei sich hier natürlich die kritische Frage stellt, ob nicht dieser Eekt in Hinblick auf die Lebenszufriedenheit durch
ein oft damit einhergehendes gleichzeitiges Abfallen des Nettoäquivalenzeinkommens sogar überkompensiert wird.
51
lauf diskutiert. Angewendet auf Gl. 2.53 und den damit verbundenen rech-
nerischen Bereinigungsmöglichkeiten könnten zeitlich relativ unveränderliche
(und oftmals nicht erhobene) und die Produktivität beeinussende Merkma-
le wie Intelligenz, Geschlecht, körperliche Eigenschaften und sonstige (auch
genetische) Dispositionen kontrolliert werden. Diese Merkmale markieren un-
terschiedliche Ausgangslagen der Individuen, die ihre Arbeitsleistung mitbe-
einussen. Der in Gl. 2.53 geschätzte Koezient b würde dann den Eekt
der Länge der Betriebszugehörigkeit im Zeitverlauf unter Konstanthaltung
dieser individuell unterschiedlichen Ausgangslagen angeben. Auf diese Art
und Weise lassen sich also relativ zeitkonstante Eekte, die eigentlich un-
bekannt sind, explizit mitmodellieren und führen unter der Annahme, dass
26
diese zeitkonstanten Variablen in ihrer Summe einen signikanten Eekt
auf y haben, zu einer im Vergleich zur Querschnittsregression besseren Mo-
dellspezikation.
Es müssen abschlieÿend noch wichtige Punkte noch angemerkt werden: Die
Konstanthaltung inter-individueller Unterschiede führt dazu, dass letztlich
nur die within-variation der abhängigen Variablen berücksichtigt wird.

Denn die between-variation wird über die individuellen Regressionskon-
stanten herausgerechnet. Damit gehören die individuellen zeitkonstanten
Ausgangslagen zu den unabhängigen Variablen. Wie weiter unten erläutert
wird, gehören konzeptionell unabhängige Variablen in einem Regressions-
bzw. Kovarianzanalyse-Modell zu den xen, bzw. gesetzten und nicht zu den
Zufallsvariablen. Daher charakterisiert die hier erläuterte Anwendung der
Kovarianzanalyse auf Paneldaten die Idee der xed -eects-Modelle. Folge-
richtig ist nun klären, was den Unterschied zwischen xed- und random-
eects-Modellen ausmacht.
2.5.1.3 Der Unterschied zwischen xen und zufälligen variablen

Regressionskonstanten
Die Frage nach dem Unterschied zwischen xen und zufälligen variablen Re-
gressionskonstanten verweist auf eine generellen Sachverhalt in Regressions-
modellen: Einige Variablentypen werden als zufällig, andere als x betrach-
tet. Um diese gedanklich-konzeptionelle Unterscheidung zu verstehen, muss
26
Es muss bei einzelner Betrachtung dieser Variablen noch nichtmals eine
Somit muss das Kriterium nicht erfüllt sein, dass alle zeitkonstanten Variablen einzeln einen signikanten Eekt haben.
Variable einen signikanten Eekt haben.
52
die inferenzstatistische Grundidee deutlich werden, dass Eigenschaften von
Merkmalsträgern und Zusammenhänge zwischen diesen Eigenschaften bereits
vor einer Datenerhebung bzw. einer Datenanalyse existieren.
Bevor also überhaupt eine Stichprobe gezogen wird, Daten erhoben werden
und eine Analyse durchgeführt wird, existiert eine Grundgesamtheit G. Fer-
ner wird angenommen, in dieser Grundgesamtheit G gilt eine wahre (aber
uns unbekannte) und unter allen gängigen Annahmen zu Regressionsmodel-
len korrekt spezizierte Regressionsgleichung, welche den Einuss zwischen
einer abhängigen Variablen x und einer abhängigen Variablen y quantiziert:
y = a + bx + (2.54)
mit
a = Regressionskonstante
b = Regressionsparameter zur Variablen x
= Residuum.
Nun wird aus G eine Zufallsstichprobe mit n Elementen gezogen und die
Datenerhebung durchgeführt. Es wird (vorübergehend!) angenommen, dass
die Werte von y mithilfe eines experimentellen Designs erhoben werden. Im
experimentellen Design kann nämlich der Reiz, also die Ausprägung der x-
Variablen kontrolliert gesetzt werden. Auch wenn unabhängige Variablen ei-
ner linearen Regression als metrisch angenommen werden, so wird hier (auch
wieder vorübergehend!) vereinfachend x als eine binäre Variable deklariert,
so dass nur zu unterscheiden ist, ob ein Reiz gesetzt wurde (x = 1) oder
nicht (x = 0). In einem Experiment wird ja sozusagen die Realität in der
Grundgesamtheit simuliert. Somit sind bereits vor dem Experiment bzw.
unabhängig von dessen Durchführung einige Elemente der Grundgesamtheit
G mit einem Reiz versehen (x = 1, z.B. die Einnahme eines Medikamentes)
und andere nicht (x = 0, das Medikament wird nicht eingenommen). Anhand

dieser Unterscheidung lässt sich G als eine in Subpopulationen zerteile bzw.
geschichtete Gesamtheit verstehen. In dem einfachen Fall hier teilt sich G
folglich in zwei Gruppen G1 und G2 auf, entsprechend der Unterscheidung
zwischen x = 1 (G1 ) und x = 0 (G2 ). Diese Situation lässt sich problemlos
auf eine multiple Regression mit mehreren (metrischen) unabhängigen Va-
riablen erweitern: Demnach wird G gedanklich in so viele Schichten geteilt,
53
wie Merkmalskombinationen der x-Variablen existieren.
In diesem Verständnis entspricht die zufällige Auswahl einer Person für ein
Experiment und ihre Zuordnung in die Experimentalgruppe (x = 1) dem
Prozess der Ziehung einer Person aus der Subpopulation der Personen, die
dem Reiz (x = 1) ausgesetzt sind analog dazu ist die Stichprobenziehung
im Falle x = 0 zu verstehen. Nun wird eine aus der Population x=1 gezo-
gene Person einem Reiz ausgesetzt und reagiert auf diesen Reiz, produziert
also scheinbar einen y -Wert. Doch diese Auassung muss korrigiert werden,
wenn angenommen wird, dass in G bereits vor dieser Untersuchung ein fes-
ter, wahrer Einuss von x auf y besteht. Die Gleichung y = a + bx +

quantiziert nämlich bereits vor der Durchführung des Experiments den be-
stehenden linearen Zusammenhang. b ist also bereits vorhanden (auch wenn
uns bekannt).
Ferner ist es aufgrund der Komplexität der meisten Zusammenhangsstruk-
turen selten realistisch anzunehmen, dass y immer perfekt durch den Term
a + bx erzeugt wird. Daher ist in der Gleichung ein Störterm enthalten, wel-
cher zufällige Abweichungen von der perfekten, aber unrealistischen linearen
Zusammenhangsstruktur y = a + bx einfängt. Da x im experimentellen De-

sign für eine Messung gesetzt wird und mit a + bx der feste Einuss von x auf
y charakterisiert wird, fängt die Messung von y letztlich die Abweichung von
diesem idealen linearen Zusammenhang ein. Es wird demnach, gegeben dem
x-Wert bzw. der Subpopulationszugehörigkeit, das Residuum gemessen

bzw. erfasst! Das so erfasste Residuum erzeugt (unter der Bedingung von
x) durch die Addition mit a + bx den y -Wert. y ist somit gedanklich als eine
lineare Transformation von dem Residuum zu sehen. Aus diesem erweiterten
Blickwinkel sollte nun die vertraute Gleichung y = a + bx + gelesen werden.

Das Residuum umfasst die Summe von (z.T. unkalkulierbaren) Einüs-
sen, welche neben der festen Wirkung von x einen Einuss auf die Messung
von y haben. Da oben angenommen wird, dass der Einuss von x auf y durch
die lineare Gleichung y = a + bx + nicht von Annahmeverletzung betroen
ist und folglich korrekt speziziert ist, weist das Residuum keine Systematik
auf. Da zusätzlich die Probanden zufällig aus den Subpopulationen G1 und
G2 gezogen wurden, ist das Zustandekommen der Residualwerte innerhalb
der Subpopulationen als ausschlieÿlich zufallsbedingt zu sehen. Daher wird
das Residuum als eine Zufallsvariable, gegeben x, verstanden. Da es sich bei
den y -Werten lediglich um lineare Transformationen der Residualwerte han-
delt, ist folglich auch y als eine Zufallsvariable aufzufassen (von Auer
54
2007: 68f.). Damit ist eine klare analytische Unterscheidung zwischen der un-
abhängigen Variablen x und der abhängigen Variablen y zu treen: Erstere
ist eine nicht-stochastisch xe Variable, letztere ist eine Zufallsvariable.
Dieser Gedanke lässt sich sofort auf das multiple Regressionsmodell
erweitern. Es muss in Bezug auf unabhängige Variablen lediglich im
Plural gesprochen werden. Demnach sind die unabhängigen Varia-
blen als nicht-stochastisch zu verstehen. Zur Vereinfachung wird ab
sofort die Konvention eingeführt, mehrere unabhängige Variablen mit
einem transponierten Spaltenvektor zu bezeichnen. Für K unabhän-
gige Variablen gilt entsprechend: x0 = (x1 , ..., xK ). Auch die Gröÿe b

muss damit einhergehend zu einem transponierten Spaltenvektor mit
zu den Elementen von x0 korrespondierenden Regressionsparametern
b0 = (b1 , ..., bK ) erweitert werden. Folglich lässt sich die einfache Re-
gressionsgleichung y = a + bx + im multiplen Falle schreiben als
y =a+ b0 x +
Warum ist diese Unterscheidung wichtig? Ausgehend von der Deklaration
der Residuen als Zufallsvariablen lassen sich einige Annahmen über Regres-
sionsmodelle formulieren; die Erfüllung bzw. Verletzung dieser Annahmen
ist bedeutend für die Einschätzung, ob ein Modell oder Teile des Modells
korrekt speziziert sind. Die Annahmen über das Residuum als Zufallsva-
riable, zusammen mit der Annahme des nicht-stochastischen Charakters von
x0 , erlaubt den Nachweis, dass es sich bei den Schätzern nach dem Kleinste-
27
Quadrate-Prinzip (KQ-Prinzip) um BLUE-Schätzer handelt (vgl. von Au-
er 2007: 83, 430). Ohne ins Detail zu gehen sei kurz erwähnt, dass dieser
0
Nachweis deshalb gelingt, weil die Eigenschaft der Nicht-Zufälligkeit von x
u.a. an einer bestimmten Stelle eine entscheidende mathematische Umfor-

28
mung erlaubt (vgl. von Auer 2007: 83, 430).
Nun basieren aber sozialwissenschaftliche Studien oftmals nicht auf dem
experimentellen Design, sondern entstammen einem Ex-Post-Facto-Design,
wie z.B. einer Befragung. Da in einer Befragung die x-Werte nicht als Reize
manipuliert werden können, müssen sie streng genommen ebenfalls als sto-
chastische Zufallsvariablen angesehen werden unter der Annahme, dass der
Pool der Befragten durch die Realisation einer Zufallsstichprobe zustande
27 BLUE steht für den besten (=ezientesten) Schätzer aus der Gruppe der unverzerrten linearen Schätzer (vgl. allgemein
zu den Voraussetzungen der BLUE-Eigenschaft von Auer 2007: 74).
28 Denn es gilt für eine nicht zufällige, xe Gröÿe x, dass ihr Erwartungswert E(x) = x. Diese Vereinfachung gegenüber
den Erwartungswerten von Zufallsvariablen ist für die angesprochene mathematische Beweisführung entscheidend.
55
kam. Es lässt sich aber mathematisch nachweisen, dass mit zunehmendem
Stichprobenumfang n (n → ∞) die Schätzer eines Regressionsmodells nach
der KQ-Methode dennoch die BLUE-Eigenschaft, zumindest asymptotisch
besitzen. Da dieses Grundkonzept also im Falle von stochastischen unabhän-
gigen Variablen nicht in sich zusammenbricht, gleichzeitig aber gerade auf der
Prämisse von xen x-Variablen aufbaut, kann weiter konzeptionell zwischen
festen unabhängigen Variablen x und der Zufallsvariablen y unterschieden
werden auch wenn Befragungsdaten vorliegen.
2.5.1.4 Die Bedeutung der Unterscheidung zwischen xen und

zufälligen variablen Regressionskonstanten für Regressi-
onsmodelle mit Paneldaten (xed- und random-eects-
Modelle)
Warum war dieser Gedankenexkurs derart wichtig? Weil er dazu verhelfen
soll, die Unterscheidung zwischen random- und xed-eects-Modellen zu ver-
stehen. Die mit dieser Unterscheidung einhergehende Frage stellt sich in Be-
zug auf die Behandlung der variablen Konstante ai :29 Soll ai als eine xe
(F-Fall) oder als eine Zufallsvariable (Z-Fall) aufgefasst werden? Auf Basis
obiger Ausführungen lässt sich diese Frage konkretisieren:
• F-Fall ai wird zu den unabhängigen Variablen gezählt und explizit in
die Parameterschätzung involviert
• Z-Fall ai wird als eine Komponente des Residuums gesehen; da das
Residuum eine Zufallsvariable darstellt, zählt ai als eine seiner Kom-
ponenten auch zu dem Lager der Zufallsvariablen
Aufbauend auf dieser Konkretisierung ist nun zu fragen, welche Konsequen-
zen die Unterscheidung zwischen dem F- und dem Z-Fall für die Interpreta-
tion der Regressionsparameter dieser Modelle hat.
Für die folgenden Ausführungen soll, entsprechend der Gleichungen
2.53 und 2.48 und der obigen Erweiterung auf den Fall multipler Re-
gression, folgende Ausgangsgleichung gelten:
yit = b0 xit + ai + it (2.55)
29 i stellt entsprechend obiger Notationen, z.B. Gl. 2.48, den Laundex für die einzelnen Objekte in der Querschnittsbe-
trachtung dar.
56
mit
i= Laundex für die einzelnen Objekte in der Querschnittsbetrach-
tung
t= Laundex für die einzelnen Zeitpunkte (Wellen)
y= Abhängige Variable
b0 = (b1 , ..., bK ) = Transponierter Spaltenvektor mit K Regressions-
parametern
x0 = (x1 , ..., xK ) = Transponierter Spaltenvektor mit K unabhängigen
Variablen
a= Regressionskonstante
= Residuum, allerdings nur dann, wenn ein xed-eects-Modell vor-
liegt.
Mit uit wird ferner eine weitere Gröÿe eingeführt:
uit = ai + it (2.56)
uit stellt das Residuum dar, wenn ein random-eects-Modell vorliegt.
Somit lässt sich Gl. 2.55 reformulieren:
yit = b0 xit + uit (2.57)
Worin die Unterscheidung zwischen uit im random- und it im xed-
eects-Modell begründet ist, wird weiter unten deutlich.
Im F-Fall (xed-eects-Modell) gehen, wie oben erläutert, die Regres-
sionskonstanten der einzelnen Personen explizit in die Parameterschätzung

0
ein. Damit werden die Regressionsparameter von x it unter der Kontrolle
der individuellen Ausgangslagen geschätzt und entsprechend interpretiert.
M.a.W. rechnen sich inter-individuellen Unterschiede völlig heraus. Es wird
nur die within-variation als Variations- und somit Informationsquelle für die
0
Berechnung des Einusses von x it auf yit genutzt. Ein Regressionskoezient
0
in einem xed-eects-Modell sagt demnach aus, wie sich yit gegeben x it im
Zeitverlauf verändert, wenn inter-individuelle Ausgangslagen konstant
57
gehalten werden. Dies stellt eine einseitige Fokussierung der zeitlichen Ent-
0
wicklung zwischen x it und yit in den Vordergrund. Die explizite Modellierung
von unabhängigen Variablen, die zeitkonstant sind und die a priori einen Ef-
fekt auf yit haben, ist nicht möglich allein schon mathematisch nicht (s.u.).
Es können also keine Eekte zeitunveränderlicher Merkmale, die vielleicht
für die Analyse von Bedeutung sind, berechnet werden, da sie sich vorher
schon durch die explizite Modellierung von ai als xe Variable implizit her-
ausgerechnet haben.
Im Z-Fall (random-eects-Modell) werden die Regressionsparameter von

0
x it nicht unter der expliziten Konstanthaltung der individuellen Unterschiede
berechnet. Die ai -Werte stellen in diesem Sinne keine unabhängigen Variablen
dar. ai wird im random-eects-Modell vielmehr als Komponente des Residu-
ums aufgefasst und gehört somit zu den Zufallsvariablen. Sie stellt, gegeben
x0 it , die zufällige Abweichung von der Regressionsgleichung yit = b0 xit dar,

welche für ein konkretes Individuum i über die Zeit konstant ist. In diesem
Sinne enthält ai , analog zu den xed-eects-Modellen, ebenfalls zeitunver-
änderliche Merkmale eines Individuums, welche eine Art Ausgangslage bzw.
Ausgangsniveau konstituieren. Nur wird dieser zeitkonstante Individualeekt
nicht explizit als zu schätzender Parameter in die Schätzung involviert, son-
dern als zu minimierender Rest, welcher einen perfekten Zusammenhang

0
zwischen x it und yit stört.
Die Extraktion einer zeitkonstanten Komponente aus dem Residuum uit ,

nämlich eben ai , hat zur Konsequenz, dass eine zentrale Annahme der KQ-
Methode verletzt wird: Die Unkorreliertheit der Residuen untereinander.
Folglich gilt nicht mehr die Annahme, dass die Kovarianz von Residuen zweier
verschiedener Zeitpunkte t = r und t = s (mit r 6= s) ir und is Null beträgt,
wenn i in beiden Fällen gleich ist.
Diese Erkenntnis ist nicht nur mathematisch, sondern auch intuitiv nach-
vollziehbar. Schlieÿlich können z.B. im Falle einer Befragung zwei Teilnah-
men ein und derselben Person zu zwei verschiedenen Zeitpunkten nicht als
stochastisch unabhängig betrachtet werden. Folglich kann auch in einem Re-
gressionsmodell das Residuum einer konkreten Person i zum Zeitpunkt t = r

nicht als unkorreliert mit dem Residuum derselben Person zum Zeitpunkt
t = s (mit r 6= s) aufgefasst werden. Wird diese Erkenntnis im Zuge der
Schätzung der Regressionsparameter ignoriert, dann sind die resultierenden
KQ-Schätzer nicht mehr ezient und verlieren somit die BLUE-Eigenschaft
58
(vgl. Hsiao 2005: 35; von Auer 2007: 74 ). Folglich muss das Vorgehen bei
der KQ-Schätzung modiziert werden, indem die Korreliertheit der Residuen
von gleichen Personen zu verschiedenen Zeitpunkten mithilfe von ai explizit
in der Varianz-Kovarianzmatrix der Residuen berücksichtigt wird (s.u.). Dies
führt zu der sog. generalized-least-squares-Schätzung (GLS-Schätzung). Die
so geschätzten Regressionsparameter machen das random-eects-Modell aus.
Ohne dieses Prinzip mathematisch zu erläutern sei gesagt, dass auf diesem
Wege die Schätzer die BLUE-Eigenschaft erreichen. Der Zusammenhang zwi-
schen xit und yit wird auf diesem Wege korrekter berechnet, da im Gegen-
satz zum z.B. pooled-Modell (s. Gl. 2.50) der panelspezischen Struktur der
Daten über die Einbeziehung einer zeitinvarianten Fehlerkomponente Rech-
nung getragen wird.
Nun stellt sich die Frage nach der Interpretation der GLS-Schätzer im
random-eects Modell: Es lässt sich mathematisch zeigen, dass auf dem Weg
zur Schätzung sowohl die within-variation als auch die beetween-variation
der abhängigen Variablen verarbeitet wird (vgl. Hsiao 2005: 37f.): Der GLS-
Schätzer stellt einen gewichteten Durchschnitt aus dem within-Schätzer
(dies ist der Schätzer des xed-eects-Modells) und dem between-Schätzer

30
(dies ist der Schätzer des sog. between-eects-Modells) dar. Das Gewicht ist
davon abhängig, wie groÿ die der Anteil der Varianz der Fehlerkomponente ai
an der Gesamtvarianz der Residuen ist. Das random-eects-Modell ist somit
als eine exible (da sich automatisch gewichtende) Kompromisslösung zwi-
schen dem xed-eects-Modell (es wird nur die within-Variation der y -Werte
im Zeitverlauf unter der Kontrolle inter-individueller Unterschiede berück-
sichtigt) und dem pooled-Modell (s. Gl. 2.50; die Unterscheidung zwischen
within- und between-Variation wird völlig ignoriert; die einzelnen Varianzen
werden einfach aufsummiert) gesehen.
Zusammenfassend lässt sich kontrastieren:
Das xed-eects-Modell behandelt die Regressionskonstante ai als eine xe
unabhängige Variable. Dies hat zur Konsequenz, dass sich inter-individuelle

0
Unterschiede bei der Schätzung der Parameter von x it vollständig heraus-
rechnen und daher nur die within-variation der abhängigen Variablen yit
30 Das 0
between-eects-Modell ignoriert die within-variation völlig: Zunächst wird pro involvierte Variable x und y für
PT
jede Personi ihr eigenes arithmetisches Mittel entlang der Messzeitpunkte errechnet; z.B. für y : y i = 1
t t=1 yit (mit
T = letzter Zeitpunkt). Schlieÿlich wird mit diesen neuen Mittelwertsvariablen eine normale Regression nach der
KQ-Methode durchgeführt.
59
berücksichtigt wird.
Das random-eects-Modell konzeptualisiert ai als Zufallsvariable und als
Komponente des Residuums. ai

gehört somit nicht zu den unabhängigen Va-
0
riablen. Bei der Schätzung der Parameter von x it wird folglich, wie auch
auch bei der Regression des pooled-Modells, sowohl die within- als auch
die between-variation der abhängigen Variablen yit verwertet. Im Gegensatz
zum pooled-Modell werden aber beide Variationsquellen analytisch dieren-
ziert. Diese Dierenzierung wird erreicht, indem mit der Extraktion von ai
als eine zeitinvariante Residualkomponente des Gesamtresiduums einer der
für Paneldaten-Regressionen bedeutendsten Eigenschaft Rechnung getragen
wird: Der Korreliertheit von zeitversetzten Residuen ein und derselben Per-
son.
Nachdem nun die Unterschiede zwischen dem xed- und dem random-
eects-Modell geklärt sind, stellt sich die Frage, nach welchen Kriterien in
einer konkreten Analysesituation eines der beiden Ansätze gewählt werden
soll. Um diese Frage zu beantworten wird zunächst pro Verfahren die konkre-
te Spezikation und Parameterschätzung anhand eines Beispiels vorgestellt.
Schlieÿlich werden Vor- und Nachteile diskutiert.
2.5.1.5 Spezikation der einzelnen Modelle und Schätzung der

Koezienten
In diesem Abschnitt soll zunächst die inhaltliche Bedeutung von ai in xed-
eects-Modellen (ab sofort abgekürzt: FEM) und random-eects-Modellen
(ab sofort abgekürzt: REM) konkretisiert werden. Es werden die Ausgangs-
gleichungen formuliert. Zur Vereinfachung enthalten diese nur jeweils eine

31
x-Variable. Sie lassen sich aber problemlos auf den multiplen Fall Dann
wird die Schätzung der Koezienten vergleichend vorgestellt.
Der nächste Abschnitt diskutiert die Vor- und Nachteile der FEM- und
REM-Modelle. Im abschlieÿenden Abschnitt soll dann das Verständnis die-
ser theoretischen Ausführungen anhand eines Beispiels vertieft werden.
Zunächst zum FEM:

Als erstes soll die Ausgangsgleichung präzisiert werden, indem Gl. 2.55 um
31 Zur Übertragung auf den multiplen Fall vgl. Hsiao 2005.
60
die für Individuen i konstante Regressionskonstante a erweitert wird. a ist
aus der Querschnittsregressionen bekannt. Sie wurde bislang aus Gründen
der Übersichtlichkeit weggelassen. Die Gleichung mit nur einer x-Variablen

lautet dann (entsprechend der Notation in Gl. 2.55):
yit = a + ai + bxit + it (2.58)
Eigentlich stellt auch schon Gl. 2.58 eine multiple Regression dar, da neben
x die einzelnen ai -Gröÿen unabhängige Variablen darstellen (s.o.). Wird aber

Gl. 2.58 für eine konkrete Person i betrachtet, dann lässt sich entsprechend
dem Fall einer einfachen Regression eine Regressionsgerade zwischen x und
y vorstellen.
Die Gröÿe ai ergibt dann in Addition mit der Regressionskonstante a die
Stelle, an der die Regressionsgerade der i-ten Person die y-Achse schneidet
(an der also x = 0 gilt).
Ferner ist zu bedenken, dass b für alle Personen i konstant ist. Daher stel-
len alle individuellen Regressionsgeraden der n Personen parallel zueinan-
der liegende Geraden dar. Der ai -Wert gibt an, um wieviel y -Einheiten die
Regressionsgerade im Vergleich zur Basis a verschoben wird. Jedes Indivi-
duum besitzt somit soz. seine eigene Regressionskonstante. Der individuelle
Schnittpunkt mit der y -Achse ergibt sich aus a + ai .32 Die relative Höhe der
Regressionsgeraden markiert die Ausgangslage eines Individuums (vgl. das
graphische Beispiel in Kohler 2008: 252).
Nun wurde bereits oben im Kontext der kovarianzanalytischen Überlegun-
gen erwähnt, dass eine Möglichkeit zur Bestimmung von ai darauf basiert, für
jedes Individuum eine Dummy-Variable zu bilden und sie zu den unabhängi-
gen Variablen des Modells zu zählen. Umfasst die Stichprobe n Individuen, so

33
werden n − 1 Dummy-Variablen benötigt. Die Koezienten der Dummy-
und der x-Variablen können dann mit der gewöhnlichen KQ-Methode ge-
schätzt werden.
Weist ein FEM-Modell k x-Variablen auf, so umfasst es insgesamt
32 Wird in vielen Regressionsmodellen a durch Zentrierung der Variablen weggelassen, so bedeutet dies nichts anderes,
können
Variablen zu arbeiten, da durch die Einführung von Dummy-Variablen, welche per Denition
, im endgültigen Modell sowieso eine Regressionskonstante a 6= 0 auftaucht.
nicht zentriert werden
als a = 0. Die eben erwähnten Zusammenhänge gelten allerdings genauso; in diesem Modell ist es sinnlos, mit zentrierten
33 Referenzkategorie
Von n wird 1 abgezogen, da der letzte bzw. irgendein Fall (in anderen Kontexten wird dieser Fall als
bezeichnet) sich automatisch dadurch ergibt, dass alle Dummy-Variablen die Ausprägung Null aufweisen; der n-te Dummy
wäre somit redundant.
61
k+n−1 unabhängige Variablen. Die Anzahl der zu schätzenden Pa-
rameter übersteigt im Falle einer Querschnittsregression die überhaupt
vorhandene Anzahl n der Fälle. Daher wären, wenn Daten nur zu ei-
nem Zeitpunkt vorliegen würden (T = 1), die Parameter von 2.58 nicht
schätzbar, da nicht genügend Informationen vorhanden wären.
Somit kann ein individueller Eekt nur dann errechnet werden, wenn
mehrere Werte eines Individuum i zur Verfügung stehen. Mehrere Wer-

te können wiederum nur dann gegeben sein, wenn Messungen zu meh-
reren Zeitpunkten vorliegen. In einem Querschnittsdatensatz würde

aber der einzige y -Messwert der Person i automatisch den individu-
ellen Eekt (bzw. dem Regressionskoezienten der Dummy-Variable)
ausmachen und das System wäre somit redundant.

34 Erst mit der Ein-
führung der durch wiederholte Messungen zustande kommenden within
variation erhalten die Individualeekte ai eine inhaltliche Daseinsbe-
rechtigung (s.o.).
Es ist oensichtlich, dass mit einem hohen n auch die Anzahl der zu schät-
zenden ai -Koezienten steigt. So kann die Berechnung eines FEM-Modells
sehr aufwendig werden, da es, wie oben erwähnt, k +n−1 Regressionskoezi-

enten zu schätzen gilt. Wenn z.B. n = 1.000, dann müssten entsprechend Gl.
2.58 1.001 Koezienten ermittelt werden. Wie allerdings weiter unten aus-
geführt wird, ist eine Berechnung der Dummy-Koezienten nicht zwingend
notwendig.
Die ai -Werte lassen sich zudem relativ leicht ermitteln. Wie oben im Kon-
text kovarianzanalytischer Überlegungen erwähnt wurde, beziehen sich die
Dummy-Koezienten eines Individuums i auf seinen individuellen Mittel-
wert yi. Konkret ergibt die KQ-Schätzung für Gl. 2.58 (vgl. Hsiao 2005: 33):
ai = y i − a − bxi
b (2.59)
mit
ai = Geschätzter ai -Wert
b (hier nach der KQ-Methode)
xi = Mittelwert der i-ten Person in Bezug auf die Variable x
34 Dies würde sich rechnerisch darin bemerkbar machen, dass im Falle von Querschnittsdaten alleine die lineare Ver-
knüpfung von Individual-Dummy-Variablen die abhängige Variable vollständig erklären würde unabhängige Variablen
wären überüssig (und deren Koezienten könnten wg. k + n − 1 > n gar nicht erst berechnet werden), das Modell würde
allerdings auch nichts aussagen.
62
Es wird also von dem individuellen Mittelwert yi der Term (a + bxi ) abge-
zogen. Die individuelle Konstante ai ist somit der individuelle y -Mittelwert,
welcher um den Einuss von x bereinigt wurde.
Durch einen rechnerischen Trick (vgl. Hsiao 2005: 32) lässt sich b schät-
zen, ohne dass die einzelnen ai -Werte vorher bestimmt sein müssen. Somit
ist man eben nicht darauf angewiesen, k+n−1 Koezienten zu bestim-
men. I.d.R. werden die ai -Werte auch nicht zur Interpretation gebraucht.
Man interessiert sich hauptsächlich für den Einuss von x auf y , wenn die in-
dividuellen zeitinvarianten Merkmale herausgerechnet sind. Eine aufwendige
Bestimmung aller Dummy-Koezienten macht nur in seltenen Fällen Sinn
z.B. wenn Daten aus einer sehr kleinen Grundgesamtheit vorliegen und ihre
Elemente so spezisch sind, dass ihre ai -Werte einzeln analysiert werden sol-
35
len. Bei wenigen Fällen ist aber wiederum die Anzahl k +n−1 relativ klein.
Bevor die Schätzungen des b-Koezienten vorgestellt werden, werden die
wichtigsten Gröÿen in Bezug auf die Variablen x und y nochmals tabella-
risch übersichtlich dargestellt (die übrigen Gröÿen werden entsprechend obi-
ger Ausführungen, z.B.: 2.55, 2.56 und 2.57 deniert. Ferner stehen n und T
respektive für den letzten Wert von i bzw. t).
Kontext: Kontext:
Variable x Variable y
Variable variiert über i (Objekte) und t (Zeitpunkte): xit yit
Arithmetisches Mittel des Objektes i xi yi
Globales arithmetisches Mittel (über alle i und t) x y
Unter Verwendung von 2.59 bzw. des oben erwähnten rechnerischen Tricks
kann nun nach der KQ-Methode b aus Gl. 2.58 geschätzt werden (warum die
Formel in blauer Farbe erscheint, wird an späterer Stelle geklärt):
35z.B. wenn die Elemente der Grundgesamtheit zusammengenommen die Menge aller Bundesländer Deutschlands bilden
und die Ausgangsniveaus der einzelnen Bundesländer miteinander verglichen werden sollen.
63
n X
X T
(xit − xi )(yit − y i )
bbf = i=1 t=1
(2.60)
Xn XT
(xit − xi )2
i=1 t=1
mit
bbf = Schätzer von b aus Gl. 2.58 nach der KQ-Methode. Das f symbolisiert
das f ixed-eects-Modell.
Die Formel erinnert an die Schätzung des Regressionskoezienten

Pn einer ein-
(xi −x)(yi −y)
fachen Regression von y auf x im Falle von Querschnittsdaten: i=1
P n 2 .
i=1 (xi −x)
Der wesentliche Unterschied ist, dass im Falle des xed-eect-Schätzers aus
Gl. 2.60 die Variablenwerte von den individuellen arithmetischen Mitteln
abgezogen werden. Dies ergibt sich rechnerisch eben aus der Tatsache, dass
mit ai inter -individuelle Unterschiede herausgerechnet wurden. Somit bleibt

zur Schätzung von b nur die Informationsquelle über, die sich aus intra -
individuellen Unterschieden im Zeitverlauf ergibt. Dies sind die Abweichun-
gen der Werte einer Person von ihrem eigenen arithmetischen Mittel, welche
die within variation charakterisieren. Die between variation wird entspre-
chend nicht berücksichtigt.
Die Schätzung bbf ist also zu interpretieren als der Betrag, um den der
geschätzte y -Wert steigt, wenn x um eine Einheit steigt und (!) alle Unter-
schiede zwischen den Individuen vorher herausgerechnet wurden. Er gibt soz.
den durchschnittlichen intra-individuellen Veränderungswert von y unter der
Bedingung von x im Zeitverlauf wieder.
Es sein nochmals darauf hingewiesen, dass es sich bei bbf um einen
gewöhnlichen Schätzer nach der KQ-Methode handelt. Würden, statt
des Rückgris auf Gl. 2.59, die individuellen Regressionskonstanten
als Regressionskoezienten von Dummy Variablen berechnet werden,
so ergäbe sich die übliche KQ-Gleichung des multivariaten Falls zur
Schätzung der Koezienten in Matrizenform: b = (X 0 X)−1 X 0 y. b =

Spaltenvektor mit den Regressionskoezienten; y = Spaltenvektor mit
den Werten der abhängigen Variablen y (die Werte dierenziert nach
i und t werden einfach untereinander geschrieben); X = Martrix mit

den Werten der unabhängigen Variablen. Jede unabhängige Variable
64
stellt innerhalb der Matrix einen Spaltenvektor dar. Wichtig ist, dass
die Matrix ausk + n − 1 Spalten besteht: n − 1 Spaltenvektoren stehen

für die Dummy-Variablen und k Spalten für die echten unabhängigen
Variablen. Im hier diskutierten Falle k = 1 entspricht dann der letzte
Wert des Vektors b dem Schätzer b bf aus Gl. 2.60.
Schätzung im REM:
Wie oben gezeigt, berücksichtigt das FEM nur die in Paneldaten enthaltene
within-variation. Das andere Extrem, in dem nur die Informationen der
between-variation genutzt werden, existiert ebenfalls: Das between-eects-
Modell (BEM). Warum dieses Modell im Kontext des REM vorgestellt wird,
wird im weiteren Verlaufe deutlich.
Wie oben in einer Fuÿnote erwähnt, ignoriert das BEM die within-variation
völlig: Zunächst wird pro involvierte Variable x und y für jede Person i ihr
eigenes arithmetisches Mittel entlang der Messzeitpunkte errechnet, also xi

und yi. Schlieÿlich wird mit diesen neuen Mittelwertsvariablen eine nor-
male Regression nach der KQ-Methode durchgeführt.
Sinnvoll ist diese Anwendung, wenn das Ausmaÿ der within-variation in-
haltlich uninteressant ist und statistisch gesehen gering ausfällt. Die Zusam-
menfassung mehrerer Werte einer Person i zu ihrem individuellen Mittelwert

verbessert dann die Reliabilität der Daten im Vergleich zur Querschnittsre-
gression. Denn es kann angenommen werden, dass sich kleine Zufallsschwan-
kungen in den Werten einer Person i im Zeitverlauf gegenseitig herausrech-
nen. Ist hingegen eine klare Systematik in der zeitlichen Entwicklung der
y -Werte anzunehmen, dann ist das BEM nicht geeignet.
Die Regressionsgleichung des BEM im einfachen Falle einer Variablen x

lässt sich ausdrücken als:
y i = a + bxi + i (2.61)
Die Schätzung bbb (das kleine b steht für between) des Koezienten im
BEM lautet dann (die Wahl der Farbe rot wird weiter unten erläutert):
n
X
(xi − x)(y i − y)
bbb = i=1
n (2.62)
X
2
(xi − x)
i=1
Nun zurück zum REM: Wie oben erläutert wurde, wird im REM ai nicht
65
mehr als xe Gröÿe sondern als Zufallsvariable aufgefasst, die eine Kompo-
nente des Residuums darstellt. Dies schlägt sich auch in der Ausgangsglei-
chung des REM nieder. Angelehnt an die Gleichungen 2.55, 2.56 und 2.57
lautet sie:
yit = bxit + ai + it (2.63)
Wenn also ai zum Residuum gehört, dann lassen sich die zwei Komponenten
ai + it zusammenfassen zu uit . Eingesetzt in 2.63 ergibt sich:
yit = bxit + uit (2.64)
Oben wurde bereits erläutert, dass die Residuen uit im REM nicht als
unkorreliert angenommen werden können. Damit wird eine zentrale Annahme
verletzt, auf der die KQ-Schätzung basiert. Die Korreliertheit von uit lässt
sich exemplarisch für die Kovarianz von zwei Residualvariablen ui1 und ui2
(mit t=1 und t = 2) zeigen:
X
Cov(ui1 ui2 ) = (ui1 ui2 )
X
= [(ai + i1 )(ai + i2 )]
X
= [a2i + ai i2 + i1 ai + i1 i2 ] (2.65)
X X X X
= a2i + ai i2 + i1 ai + i1 i2
X
= a2i
Folgende Annahmen, abgeleitet aus gewöhnlichen linearen Regressionsmo-
dellen nach der KQ-Methode, liegen den Umformungen in 2.65 zugrunde:
• ui t, ai und it besitzen einen Erwartungswert von 0, daher vereinfacht
sich die Gleichung der Kovarianz zur Summe der Residuenprodukte

P
(ui1 ui2 )
P
• ai und it sind miteinander unkorreliert, deshalb gilt für ai i2 = 0
und für Σi1 ai = 0
P
• Die Fehler it sind untereinander unkorreliert, daraus resultiert i1 i2 =
0
66
Mit der letzten Zeile von 2.65 wird also die oben getroene Annahme, dass
die Residuen im REM nicht unkorreliert sind, mathematisch nachgewiesen.

P 2
ai ist nichts anderes, als die Varianz von ai , bezeichnet mit V (ai ). Folglich
lautet der Erwartungswert der Kovarianz zweier uit -Variablen (wenn ihre t-
Werte verschieden sind): V (ai ).
Weiterhin kann, unter der getroenen Annahme, dass ai und it unkorreliert
sind, aus der Aufteilung des Fehlertermes uit = ai + it die Aufteilung der
Fehlervarianzen abgeleitet werden:
V (uit ) = V (ai ) + V (it ) (2.66)
Entsprechend der Homoskedastizitäts-Annahme sind die einzelnen Varian-
zen für i und t konstant. Folglich vereinfacht sich Gl. 2.66 zu:
V (u) = V (a) + V () (2.67)
Gleichungen 2.65 und 2.67 konstituieren die Ausgangslage des REM, dessen
Koezienten nun mit einem alternativen Schätzverfahren bestimmt werden
müssen. Dann die KQ-Methode setzt die Unkorreliertheit von uit voraus.
Stattdessen muss auf die sog. generalized-least-squares-Methode (GLS) zu-
rückgegrien werden, mithilfe derer verschiedene Annahmen hinsichtlich der
Korrelationsstruktur von Residuen berücksichtigt werden können. Die Her-
leitung der GLS-Schätzung zeigt Hsiao (2005: 35.). Hier liegt der Fokus
auf dem Verständnis der resultierenden Formel des GLS-Schätzers: Bei der
Betrachtung dieses Ergebnisses ist es nämlich wichtig, die Komponenten zu
erkennen, welche einerseits in dem FEM-Schätzer b

bf (blaue Farbe) und an-
dererseits in dem BEM-Schätzer b
bb (rote Farbe) vorkommen. Der Koezient
aus Gl. 2.64 kann mit der GLS-Methode durch bbr wie folgt geschätzt werden:
n X
X T n
X
1
T
(xit − xi )(yit − y i ) + G · (xi − x)(y i − y)
bbr = i=1 t=1 i=1
(2.68)
n X
X T n
X
1
T
(xit − xi )2 + G · (xi − x)2
i=1 t=1 i=1
mit:
V ()
G= V ()+T ·V (a)
Die Gröÿe G stellt in Gl. 2.68 den Faktor dar, mit dem die Komponenten
67
der BEM-Schätzung (rote Farbe) gegenüber den Komponenten der FEM-
Schätzung (blaue Farbe) gewichtet werden. Somit kann der Schätzer des
REM-Modells bbr als ein gewichteter Durchschnitt aus dem Schätzer des
FEM- und dem des BEM-Modells gesehen werden. Die Gewichtung hängt
von G und somit von dem Anteil der Varianz des nicht-zeitkonstanten Resi-
duums V () an der Gesamtvarianz V (u) ab.36

Tendiert G gegen 0, dann liegt dies an der Dominanz von V (a) und folg-
lich an der Dominanz zeitinvarianter individueller Abweichungen. Der REM-

Schätzer bbr konvergiert dann gegen den FEM-Schätzer bbf . Gl. 2.68 reduziert
sich dann im Extremfall G=0 auf den blauen Teil.
Tendiert G gegen 1, dann dominieren mit V () die Abweichungen, welche
über die Zeit und die Individuen variieren. Die Anteile des FEM-Schätzers
und des BEM-Schätzers am REM-Schätzer sind dann gleichgewichtig, so
dass man eigentlich nicht weiter zwischen i und t zu dierenzieren braucht. Es
würde die einfache KQ-Methode des pooled-Modells (s.o.) ausreichen. Somit
würde der Schätzer bbr gegen den Schätzer des pooled-Modells, bbp konvergie-
ren, mit:
n X
X T
(xit − x)(yit − y)
bbp = i=1 t=1
(2.69)
Xn XT
(xit − x)2
i=1 t=1
2.5.1.6 Vor- und Nachteile und sinnvolle Anwendungsgebiete der

REM und FEM-Modelle
Vorteile des REM sind u.a. darin zu sehen, dass beide Quellen der Variati-
on von y (between- und within-Variation) genutzt werden. Damit verbunden
bietet das REM eine mittlere Lösung zwischen FEM und BEM einerseits
und FEM und dem pooled-Modell andererseits. Wenn V (a) signikant von
Null verschieden ist, dann ist das REM auch korrekter speziziert als das
pooled-Modell nach der KQ-Methode.
In welchem Falle eine Entscheidung zugunsten des REM oder FEM fal-
len sollte, ist auch an den Entstehungsmechanismus der Daten geknüpft.
Stellen die im Datensatz enthaltenen Objekte die Realisierung einer Zu-
36 Zur Schätzung der Fehlervarianzen vgl. Hsiao 2005: 38
68
falls stichprobe dar, dann unterliegen die durch ai charakterisierten Ausgangs-
lagen der Objekte selbst einer zufälligen Auswahl. In diesem Falle wäre ei-
gentlich das REM vorzuziehen (warum eigentlich, wird gleich erläutert).

Denn es ist wenig einleuchtend, mithilfe von ai die zufällig aus einer grö-
ÿeren Grundgesamtheit gezogenen Objekte als xe unabhängige Gröÿen zu
modellieren.
Entlang dieser Logik eignet sich FEM mehr für spezische Objekte einer
Grundgesamtheit, deren Auswahl keinem Zufallsprozess unterliegt. Dies ist
vor allem dann gegeben, wenn Vollerhebungen zu kleinen Grundgesamtheiten
vorliegen z.B. wenn über alle Mitglieder des Bundestages Daten zu ihren
politischen Aktivitäten vorliegen würden. Da die Struktur einer kleinen, spe-
ziellen Grundgesamtheit stärker von den Spezika ihrer einzelnen Mitglieder
abhängen kann, ist es sinnvoller, die Ausgangslagen dieser Mitglieder als xe
unabhängige Variablen zu konzeptualisieren.
Allerdings wird dieser Gedankenstrang verkompliziert durch einen Nach-
teil des REM: Aus der Unterscheidung zwischen xen und zufälligen Gröÿen
ergibt sich nämlich generell eine für Regressionsmodelle logische Annahme:
Die Unkorreliertheit zwischen Residuen (Zufallsgröÿen) und unabhängigen
Variablen (xe Gröÿen). Wenn nun unter den in ai zusammengefassten zei-
tinvarianten Einussgröÿen eine oder mehrere Variablen (z.B. das Geschlecht
oder die Intelligenz) besonders in ihrem Einuss auf y dominieren, dann
ist es nicht unplausibel anzunehmen, dass diese Einzelgröÿen auch mit den
un abhängigen Variablen korreliert sind. Die oben erwähnte Annahme wäre

dann verletzt.
In diesem Falle kann doch das FEM die bessere Alternative sein auch wenn
die Objekte einer Zufallsstichprobe entstammen. Dann steht nämlich ai nicht
mehr für eine zufällig gezogene Person, derer Ausgangslage sich aus vielen
kleinen, einzeln genommen unbedeutenden Zufallseinüssen zusammensetzt.
Vielmehr repräsentiert der ai -Wert dann eine oder wenige bedeutsame Einzel-
variablen, die auf diesem Wege zurecht als xe Gröÿen berücksichtigt werden
können.
Wie so oft in der Statistik verbleibt die Entscheidung FEM vs. REM in der
Angemessenheit des Anwenders. Dabei sollten vor allem inhaltlich plausible
Kriterien zur Rate geezogen werden.
69
2.5.1.7 FEM vs. REM ein Beispiel
Die konkrete Anwendung von FEM und REM soll nun anhand eines einfachen
Beispiels vollzogen werden: Es wurde ein sehr kleiner ktiver Datensatz vom
37
Autor konstruiert. Dieser Datensatz weist folgende Eckdaten auf:
• eine abhängige Variable yit : Körpergewicht einer Person i zum Zeit-

punkt t
• eine unabhängige Variable xit : Fettgehalt des Essens, welche eine Per-
son i zum Zeitpunkt t täglich durchschnittlich zu sich nimmt
• Messungen an vier Personen (n = 4; alle Personen weisen dasselbe
Alter und dieselbe Körpergröÿe auf, so dass der body-mass-index nur

von dem Körpergewicht abhängt)
• Messungen zu drei Zeitpunkten (T = 3)
Es soll hier der allseits bekannten Hypothese nachgegangen werden, dass
das Ausmaÿ des Essens von fetthaltigen Gerichten das Gewicht positiv be-
einusst.
Würde hier die Besonderheit ignoriert, dass ein Paneldatensatz vorliegt,
dann lieÿe sich mit den Daten eine einfache pooled-Regression, entsprechend
der Schätzung in Gl. 2.69 berechnen.
Schon nach Augenmaÿ lässt sich ein leichter positiver Zusammenhang zwi-
schen beiden Variablen feststellen. Die geschätzte Gleichung lautet:
yit = −19 + 1, 635xit + eit (2.70)
mit r2 = 0, 66
Der Regressionskoezient ist positiv und der Determinationskoezient ist
mit 66% der erklärten Varianz von y relativ hoch. Dies stützt die Hypothese
eines positiven Zusammenhangs.
Im nächsten Schritt soll nun das FEM nach Gl. 2.58 berechnet werden.
Aus Veranschaulichungsgründen wird mit der Dummy-Variante gearbeitet.
37 abgelegt unter Appendix 4.4, in Tab. 4.1
70
In diesem Fall werden drei Dummy-Variablen (n − 1 = 4 − 1 = 3) eingeführt,
so dass Gl. 2.58 ausgedrückt wird als:
yit = a + a1 + a2 + a3 + bxit + it (2.71)
Um die Dummy-Variablen kenntlich zu machen, wird nun statt ai ai di ge-

schrieben, wobei ai für den individuellen Regressionskoezienten i-ter Ein-
heit und di für die entsprechende Dummy-Variable steht:
yit = a + a1 d1 + a2 d2 + a3 d3 + bxit + it (2.72)
Die Datenstruktur inkl. Dummy-Variablen ist in Appendix 4.4 unter Tab.
4.2 abgelegt. Es ist zu sehen, dass auch die letzte Person des Datensatzes,
Person D, im Modell aufgenommen wird und zwar durch die Konstellation
alle Dummy-Variablen nehmen den Wert Null an. Ihr an ergibt sich somit
rechnerisch aus der Konstanten a.

Diese Datenstruktur, so wie sie in Tab. 4.2 zu sehen ist, wird nun einer ein-
fachen linearen Regression nach der KQ-Methode unterzogen (z.B. in SPSS).
Es ergibt sich folgende Gleichung:
yit = 142 − 45, 4d1 − 32, 31d2 − 10, 67d3 − 0, 702xit + it (2.73)
mit r2 = 0, 9969
I.d.R. sind die Koezienten einzelner Individuen nicht von Interesse. Hin-
2
gegen sehr von Belang sind der Koezient b und r . Es stellt sich die Frage,
wie sich diese Koezienten unter der Konstanthaltung individueller zeitin-
varianter Eekte verändern.
Man sieht, dass das Bestimmtheitsmaÿ drastisch gestiegen ist (um mehr
als 20%). Die Berücksichtigung inter-individueller Ausgangslagen in Form
unabhängiger Variablen steigert also die erklärte Varianz der abhängigen
Variablen auf rund 99%.
Nun ist zu fragen, wie b im Kontext des Beispiels zu interpretieren ist und
warum der Koezient im Vergleich zum einfachen Regressionsmodell hier

38
sein Vorzeichen geändert hat.
38 Fragen nach der Signikanz von Koezienten sollen hier ausgeklammert werden, da schlieÿlich ein erfundener und
kleiner Datensatz vorliegt
71
Wie oben mehrfach erwähnt, ist ein Regressionskoezient einer unabhän-
gigen Variablen x im FEM zu verstehen als Einuss von x auf y bereinigt
um intra-individuellen Ausgangslagen, die in den Term ai absorbiert werden.
Wie an Gl. 2.60 deutlich wird, werden sowohl im Zähler als auch im Nenner
des Schätzers nur Abweichungen der x- und y -Werte von den individuellen
arithmetischen Mitteln berechnet und aufsummiert. Wäre die Varianz der
x-Variablen für alle Personen i konstant, dann würde der FEM-Koezient
sogar exakt dem Durchschnittswert aller n individuellen Regressionskoe-

zienten der Regressionen von y auf x entsprechen. Denn man könnte bei
Pn PT 2
konstanter x-Varianz statt i=1 t=1 (xit − xi ) schreiben: n · C . C ist hier-
bei der für alle i konstante Zähler der individuellen x-Varianz. Formel 2.60
würde sich vereinfachen zu:
n X
X T
(xit − xi )(yit − y i )
bbf = 1 · i=1 t=1
(2.74)
n C
Die Übereinstimmung in der x-Varianz ist im Beispiel für die ersten beiden
Personen A und B gegeben:
Zuerst wird für diese Personen eine Regression mit jeweils drei Wertepaaren
(xt |yt ) errechnet sozusagen als Analyse des Zusammenhangs der Werte
eines Individuums, welche über mehrere Zeitpunkte streuen. Es ergibt sich

für den Regressionskoezienten der Variablen x mit y als abhängige Variable
• für Person A: b = −0, 643,
• für Person B: b = −0, 929.
Es ist hier also in beiden Fällen ein negativer Zusammenhang zwischen x

2
und y zu sehen (in beiden Fällen ist r relativ hoch).
Wird nun ein FEM nur für diese beiden Personen gerechnet, dann er-
gibt sich in diesem Modell für den Regressionskoezienten der Variablen x:

b = −0, 786. Dieser Wert ist eben nichts anderes, als das arithmetische
Mittel der Regressionskoezienten für Person A und B. An dieser
Stelle wird nochmals deutlich, dass sich das FEM nur der within variation
bedient.
Nun soll der Vorzeichenwechsel im FEM gegenüber dem pooled-Modell
angesprochen werden. Denn die individuellen Zusammenhänge weisen eine
72
39
negative Richtung auf, während das Gesamtsystem einen positiven Trend
verzeichnet.
Es gilt zuerst tendenziell: Je fettiger das Essen, umso mehr Gewicht. Für
eine einzelne Person gilt aber entlang der Zeitachse: Je fettiger das Essen,
umso weniger (!) Gewicht. Dies klingt widersprüchlich. Plausibel erklärbar

(reine statistische Mathematik wird hier zunächst ausgeklammert) wird die-
ses Zusammenhangssystem allerdings, wenn man die kausale Richtung auf
der Individualebene umkehrt. Gehen wir nun davon aus, dass x die abhängi-
ge Variable ist. So lautete die Hypothese auf der Individualebene: Je mehr
Gewicht, desto weniger fettig das Essen.
Es könnte hier also ein rekursiver Prozess derart stattnden, dass wenn
Personen relativ zu ihrem persönlichen Ausgangsgewicht zunehmen, sie auf
die Zunahme mit der Reduktion von fettigem Essen reagieren. Umgekehrt,
wenn Personen es schaen, relativ zu ihrem Ausgangsgewicht ein paar Kilo
abzunehmen, dann werden sie nachlässig bei der bewussten Ernährung, und
essen wieder fettiger. Beide Fälle sind Formulierungen eines negativen Zu-
sammenhangs zwischen x und y.
Auch wenn diese Erklärung sicherlich nicht ganz der Realität entspricht,
sehr vereinfachend ist und, wenn überhaupt, dann nur auf bestimmte Perso-
nengruppen zutrit, so soll sie doch ein allgemeines Phänomen veranschauli-
chen: Die Zusammenhangsstruktur von x und y kann sich völlig unterscheiden

zwischen der Betrachtung entlang der Personen i einerseits und entlang der
zeitlichen Entwicklung t andererseits. Es lässt sich festhalten:
Das Gesamtsystem weist einen bestimmten Zusammenhang zwischen zwei
Variablen auf. Dieser Zusammenhang besitzt aber auf der Individualebene
entlang der Zeitachse, im Schnitt über alle Individuen, eine ganz andere
Struktur. Solch eine Unterscheidung von Zusammenhangsebenen ist, wie
gezeigt, durch das Vorhandensein von Paneldaten analysierbar.
Im Kontext dieses Beispiels wird nochmals die Reduziertheit des FEM deut-
lich: Wird die Analyse auf die Variation innerhalb einzelner Individuen re-
duziert, dann sagt das Modell prinzipiell nichts darüber aus, wodurch die
Unterschiede zwischen den Individuen zustande kommen. Warum wiegt z.B.
eine Person mehr als eine andere (bei kontrollierter Körpergröÿe)? Das fetti-
39dies lässt sich am Datensatz bereits mit dem Auge erkennen, wenn nur die Wertepaare eines Individuums betrachtet
werden
73
ge Essen als erklärende Variable reicht bei Leibe nicht aus, denn ausgehend
von dem einfachen Modell in Gl. 2.70 bleibt noch ein groÿer Prozentsatz
unerklärter Varianz über.
Ein sehr hoher Wert von r2 im FEM darf nicht darüber hinweg täuschen,
dass durchaus wichtige Einussgröÿen nicht im Modell enthalten sein könn-

2
ten. Denn ein solch hoher r -Wert ist schlieÿlich durch die Einführung künst-
licher Dummy-Variablen zustande gekommen und die individuellen Eekte

2
sind zwar in die Rechnung zugunsten einer Erhöhung von r eingeossen,
müssen aber noch selbst erklärt werden. Es wäre also zu überlegen, ob die
unterschiedlichen individuellen Ausgangslagen ai von wenigen einussreichen
zeitinvarianten Variablen dominiert werden, oder es sich dabei um eine Ge-
mengelage aus vielen, im einzelnen betrachtet unbedeutenden Einüssen han-
delt.
Zur technischen Durchführung ist anschlieÿend noch zu sagen, dass die
Berechnung eines FEM mit z.B. STATA einfach realisierbar ist. Dort ist
dieses Modell explizit als Analyseoption implementiert, so dass die Bildung
von Dummy-Variablen nicht manuell zu tätigen ist (im Gegensatz zu SPSS).
Der zu analysierende Datensatz muss in STATA lediglich in das sog. lange
Format gebracht werden und es muss deniert werden, welche Variable die
einzelnen Personen und welche die Zeitpunkte deniert (zur Durchführung
dieser Schritte vgl. Kohler 2008: 245f ).
Ist dies getätigt, dann reicht ein Befehl aus, um das FEM zu berechnen:
xtreg y x, fe
Die Bezeichnungen y und x sind hierbei Platzhalter für beliebige Variablen.

Wichtig ist, dass die abhängige Variable in der Reihenfolge zuerst notiert
wird. Daraufhin können beliebig viele unabhängige Variablen (aber nicht (!!!)
die Dummy-Variablen, nur die inhaltlichen unabhängigen Variablen) folgen.
Ähnlich einfach lässt sich die GLS-Schätzung des REM-Modells in STATA

umsetzen. Die etwas abschreckend wirkende Formel 2.65 muss also nicht ei-
genhändig programmiert werden. Stattdessen wird einfach nur in der oben
dargestellten Befehlszeile der Ausdruck fe durch re ersetzt.
Entsprechend der Gl.2.64 lautet auch für das hier behandelte Beispiel die
REM-Ausgangsgleichung (mit uit = ai + it ):
74
yit = bxit + uit (2.75)
Die GLS-schätzung nach Gl. 2.65 ergibt einen Koezient von b = −0, 578.
Es zeigt sich, dass auch in einem Verfahren, in dem sowohl die within- als
auch die between-variation in die Analyse einieÿen, der Koezient auf einen
negativen Zusammenhang zwischen Gewicht und Fetthaltigem Essen hin-
deutet. Dies ist eine Tendenz, welche erst unter Beachtung der Panelstruktur
zum Vorschein gekommen ist, da, wie bereits in Gl. 2.70 gezeigt wurde, eine
einfache Regression eher einen positiven Zusammenhang vermuten lässt.
Rechnerisch ergibt sich der negative Koezient aus der Tatsache, dass das
Gewicht G aus der Schätzformel 2.68 mit 0,00349 sehr klein ausfällt. Folglich
wird die Between-Variation von y bzw. die Between-Kovariation von x und
y zugunsten der Within-(Ko-)Variation deutlich runtergewichtet. Da der Zu-
sammenhang zwischen x und y aus der Within-Perspektive negativ ist, setzt
sich letztlich aufgrund der starken Abwertung der Between-Perspektive das
negative Vorzeichen bei der REM-Koezientenschätzung durch.
Der kleine Gewichtungswert von G ist wiederum, wie unterhalb der For-
mel 2.68 zu sehen ist, auf einen in Relation zu V () hohen Schätzwert der
Between-Fehlervarianz V (a) zurückzuführen (mehr zu den Schätzformeln

40
s.u.). In den Daten manifestiert sich dieser Unterschied darin, dass die ab-
soluten Unterschiede zwischen den Personen (relativ hohe Between-Varianz)
deutlich gröÿer sind, als die Unterschiede innerhalb der Personen (relativ
niedrige Within-Varianz). Dies gilt sowohl in Hinblick auf die Varianzen von
x und y als auch für die Kovarianz zwischen den beiden Variablen. Da mit
einer relativ hohen Between-(Ko-)Varianz auch hohe absolute Residualwerte
drohen, wird insgesamt die Between-Varianz in der Schätzung mithilfe von
G heruntergewichtet.
An dieser Stelle sollen noch einige interessante Gröÿen im STATA-Output
der REM- und FEM-Modelle besprochen werden. Es folgt eine Auistung
der Berechnungsformeln der wichtigsten Maÿzahlen / Schätzungen.
Zunächst sind unabhängig von der Modellwahl immer drei Arten von Deter-
minationskoezienten angegeben. R-sq: within bezieht sich auf den An-

teil der Within-Varianz von y , welche durch die Within-Varianz von x erklärt
wird. Das Pendant dazu ist R-sq: between , bei der nur die Between(Ko-
40 Vb () = 0, 9942602 = 0, 98855 und V (a) = 9, 70092 = 94, 107
75
)Variation von x und y berücksichtigt wird. R-sq: overall ist der Anteil
der gesamten Varianz von y , welche durch x erklärt wird. Sie entspricht dem
Determinationskoezienten in der pooled Regression, in der zwischen der
Zeit- und der Personenebene nicht weiter unterschieden wird.
Die dazugehörigen Formeln in der unteren Auistung zeigen, dass die ver-
schiedenen Determinationskoezienten dem selben Prinzip unterliegen: Es
wird die jeweilige quadrierte Kovarianz von x und y in Relation gesetzt zu
dem Produkt der korrespondierenden Varianzen beider Variablen. Dies ent-
spricht der Quadrierung des Zählers und des Nenners des Korrelationskoef-
zienten, aus dem sich ja im einfachen Falle einer unabhängigen Variablen
direkt der Determinationskoezient errechnen lässt (eben durch die Qua-
drierung).
Wichtig ist, dass sich R-sq: overall nicht additiv aus den beiden ande-
ren Gröÿen zusammensetzt. In dem Beispiel ist er sogar niedriger, als das
Between- bzw. Within-Bestimmtheitsmaÿ. Dies liegt daran, dass auf der
Between-Ebene ein positiver und auf der Within-Ebene ein negativer Zusam-
menhang zwischen x und y besteht. Auf der undierenzierten Gesamtebene
heben sich diese gegenläugen Zusammenhänge teilweise auf, so dass R-sq:
overall niedriger ausfällt. Auch daran wird deutlich, dass es sinnvoll sein
kann, bei Paneldaten die Zeiten- und die Objektebene gesondert zu betrach-
ten.
Für die Koezienten lassen sich Standardfehler berechnen und ein Signi-
kanz-Test durchführen. Die Vorgehensweise und die Interpretation ist völlig
deckungsgleich mit der einer gewöhnlichen Regression. Dies gilt auch für die
F-Teststatistik (oberer der beiden F-Werte) im FEM und die Wald chi2-
Statistik im REM. Beide testen die Nullhypothese, inwieweit alle Koezien-
ten des Modells aus einer Population kommen, in der alle korrespondierenden
Parameter dem Wert 0 entsprechen.
Im FEM ist ferner eine zweite F-Teststatistik angegeben: F test that

all u_i=0 . Mithilfe dieser wird geprüft, ob die individuellen Regressions-
konstanten ai in ihrer Gesamtheit aus einer Population kommen, in welcher
all diese Konstanten Null betragen. Würde diese Nullhypothese beibehal-
ten werden, dann wäre die Einführung von ai in die Regression unnötig. Die
individuellen Regressionskonstanten würden keinen signikanten Erklärungs-
beitrag leisten. In dem Beispiel kann allerdings die Nullhypothese verworfen
werden. Schlieÿlich gibt es signikante Gewichtsunterschiede zwischen den
76
Personen (Between-Variation).
Die Gröÿe corr(u_i, Xb) entspricht der Korrelation zwischen den indi-
viduellen Regressionskonstanten einerseits und der mithilfe von x geschätzten
y -Werte andererseits. Letztere sind, wie in einer gewöhnlichen Regression,
gegeben über die lineare Kombination aus unabhängigen Variablen und Re-
gressionskoezienten hier im einfachen Falle: ybit = bbf · xit . Die Korrelation

besagt, wie stark die gemeinsame Wirkung der x-Variablen mit den indivi-
duellen Ausgangslagen korreliert. Bei Vorliegen nur einer Variablen x ver-

41
einfacht sich der Sachverhalt: Der Betrag der Korrelation corr(u_i, Xb)
entspricht dann der bivariaten Korrelation zwischen x und ai . Im oberen
Beispiel gibt sie also an, wie stark das Ausmaÿ fetthaltigen Essens mit den
individuellen Gewichtniveaus zusammenhängt. Dieser Zusammenhang ist
mit -0,8934 recht stark, was auch durch den hohen R-sq: between unter-
strichen wird. Schlieÿlich werden für die Berechnung von R-sq: between
die intra-individuellen Streuungen zu den Gröÿen x und y zusammengefasst,
welche konzeptionell diese Ausgangslagen zum Ausdruck bringen. Somit be-
einusst das fetthaltige Essen signikant das Gewichtsniveau, auf dem sich
Personen benden.
Ein hoher corr(u_i, Xb)-Wert spricht gegen die Anwendung des REM.
Denn im REM werden die individuellen Ausgangslagen zu der als Zufallsva-
riable aufgefassten Fehlerkomponente gezählt, welche bei gegebenem x-Wert
einen Erwartungswert von 0 hat. Der Fehler wird als zufällig um die perfekte
Beziehung y = br · x streuend angenommen, ist folglich mit x unkorreliert. Es

gilt a priori corr(u_i, Xb)=0 Diese Annahme ist allerdings anzuzweifeln,
wenn sich im FEM, also bei der Behandlung von ai als xe Gröÿe, doch ei-
ne relativ hohe Korrelation corr(u_i, Xb) zeigt. Für eine Diskussion dieser
Problematik wird auf Hsiao (2005) verwiesen.
Die Angaben zu sigma_u , sigma_e und rho (= ρ) werden zu-
nächst für den REM-Fall erläutert:

Im REM stehen sie für die Schätzungen der Standardabweichungen der
beiden Fehlerkomponenten. sigma_u ist die Schätzung für die Wurzel aus
V (a); sigma_e entspricht der Schätzung für die Wurzel aus V (). Um de-
ren Bedeutung zu verstehen, wird der Sachverhalt zuerst auf eine einfache
Regression heruntergebrochen: In der normalen linearen Regression nach der
41 Die Multiplikation mit bf kann lediglich das Vorzeichen der Korrelation von x und ai ändern, aber nicht die Stärke
b
77
KQ-Methode existiert bekanntlich nur ein Fehlerterm. Für diesen Fehlerterm
wird eine über alle Beobachtungen gegeben der x-Werte konstante Stan-
dardabweichung angenommen. Diese Gröÿe wird als σ bezeichnet. Es lässt
42
sich zeigen, dass auch y als abhängige (Zufalls-)Variable dieselbe, über al-
le Beobachtungen (wieder gegeben x) konstante Standardabweichung σ inne
hat (vgl. Auer 2007: 81).
Um die konkrete Bedeutung von σ nachvollziehbar zu machen, soll bspw.
eine einfache Regression des Körpergewichtes y auf die Körpergröÿe x mit
der Gleichung yi = a + bxi + betrachtet werden. Nun könnte man sich die
Verteilung des Gewichtes y gedanklich vorstellen, wenn man nur aus einer
Subpopulation von Personen mit einer festgelegten Körpergröÿe ,

z.B. x = 165cm, unendlich oft Personen per Zufall auswählt und deren Ge-
wicht bestimmt. σ entspricht dann der Streuung des Gewichtes eben in dieser
Subpopulation x = 165 (Erwartungswert ist a + b · 165). Genau das ist ge-
meint, wenn von gegeben x die Rede ist. Ferner wird σ unter der Annahme
von Homoskedastizität als gleich für alle Werte deklariert, die x annehmen
kann. Bspw. beträgt die Streuung von y gegeben x = 203, 32cm ebenfalls σ .
σ 2 ist entsprechend die Varianz, und zwar sowohl des Residuums als auch
2
der Variablen y . Im REM entspricht σ der Gröÿe V (uit ) aus Gl. 2.66. Die-
selbe Gleichung zeigt auch die Aufteilung von V (uit ) in die Varianzen der
beiden Fehlerkomponenten. Folglich entspricht die auf x konditionierte Vari-
anz V (yit ) der Zufallsvariablen y :
V (yit ) = V (uit ) = V (ai ) + V (it ) (2.76)
Diese Varianzen sind in der Regel unbekannt, können aber aus den Da-
ten geschätzt werden (s. untere Auistung). Die von STATA errechneten
Schätzungen erhält man über die Quadrierung der Standardabweichungen
der Fehler sigma_u bzw. sigma_e. Die Gröÿe ρ setzt nun die Varianz
der individuellen, über die Zeit konstanten Fehler V (ai ) in Relation zur Va-
rianz des gesamten Fehlers V (uit ). Da es sich bei den STATA-Angaben um
Schätzungen handelt, ist auch die Angabe rho selbst eine Schätzung mit
der Formel:
Vb (ai ) Vb (ai ) Vb (ai )

ρb = = = (2.77)
Vb (ai ) + Vb () Vb (uit ) Vb (yit )
42 y ist konzeptionell ebenfalls eine Zufallsvariable, da sie sich aus der linearen Transformation des zufälligen Residuums
ergibt; s. 2.5.1.3
78
Der letzte Term zeigt, dass es sich bei ρ um den geschätzten Anteil der
Varianz von y (!!!) handelt, welcher mit V (ai ),

b also der Between-Variation
von y erklärt werden kann. Auch diese Aussage gilt wieder unter Kontrolle
von x.
In dem Beispiel ist ρb mit 0,9896 sehr hoch, was besagt, dass fast die voll-
ständige Streuung der y -Werte auf die Unterschiede zwischen den Individuen
(Between-Variation) zurückgeht. Auch hier zeigt sich also, wie oben im Zu-
sammenhang mit der Gröÿe G erläutert, dass die absoluten Unterschiede zwi-
schen den Personen (relativ hohe Between-Varianz) deutlich gröÿer sind, als
die Unterschiede innerhalb der Personen (relativ niedrige Within-Varianz).
Rabe-Heskath et al. (2008: 58) zeigen ferner, dass ρ gleichzeitig auch die
Korrelation der y -Werte (gegeben x) einer Person zu zwei verschiedenen Zeit-

punkten darstellt. Der hier hoch ausfallende Wert besagt also, dass es sehr
wahrscheinlich ist, dass das Gewicht einer Person i bei einer zweiten Messung
ähnlich (in Relation zu den Unterschieden zwischen Personen) dem Gewicht
derselben Person i zum ersten Messzeitpunkt sein wird.
Im FEM ist die Interpretation von ρ im Prinzip äquivalent zu der im REM.

Allerdings muss hier beachtet werden, dass ai nicht zu den Zufallsvariablen
gehört, sondern eine xe Gröÿe darstellt. Daher wird V (ai ) nicht aus den
Daten geschätzt, sondern anhand der Daten eindeutig errechnet.
In den folgenden Tabellen sind die Formeln einiger hier besprochener Grö-
ÿen aufgeführt. Zwei Einschränkungen sind zu machen: Sie gelten 1. nur für
den einfachen Fall mit lediglich einer unabhängigen Variablen x. 2. sind sie
nur korrekt beim Vorliegen eines balancierten Paneldatensatzes sprich, alle
Personen haben an allen Wellen teilgenommen. Ist mindestens eine dieser
zwei Bedingungen nicht gegeben, dann verkomplizieren sich zwar die For-
meln, das den Gröÿen unterlegte Grundprinzip bleibt allerdings gleich.
Die im Kap. 2.5 eingeführte Gröÿen und Symbole werden als bekannt vor-
ausgesetzt.
79
Determinationskoezienten und Korrelationen
STATA-Bez. Formel Erläuterung
n X
X T
[ (xit − xi )(yit − y i )]2
i=1 t=1
R-sq: within
n X
T n X
T
Anteil der Within-Varianz von y, die durch x erklärt wird
X X
(xit − xi )2 (yit − y i )2
i=1 t=1 i=1 t=1
n
X
[ (xi − x)(y i − y)]2
i=1
R-sq: between n n Anteil der Between-Varianz von y, die durch x erklärt wird
X X
2 2
(xi − x) (y i − y)
80
i=1 i=1
Xn X T
[ (xit − x)(yit − y)]2
i=1 t=1
R-sq: overall
n X
T n X
T
Anteil der gesamten Varianz von y, die durch x erklärt wird
X X
2
(xit − x) (yit − y)2
i=1 t=1 i=1 t=1
Xn X
T
(ai − a)(e
yit − ye)
i=1 t=1
corr(u_i, Xb) v Korrelation zwischen den individuellen Regressionskonstan-
u n n X T
v u
y -Werten, x.
uX
ten und den geschätzten gegeben Die Formel
X
(ai − a)2 u − ye)2
F R
u u
u
t t (e
yit
bezieht sich nur auf das EM! Im EM wird der Korrelati-
i=1 i=1 t=1
onswert 0 per Annahme festgelegt.
Fehlervarianzen im FEM
v
u n X
T
uX
q
u
t 2
i=1 t=1
sigma_e Vb () = n(T −1)−1
Schätzformel für die Standardabweichung des Residu-
ums (analog zum σ in der einfachen Regression)
v
u n
uX
u
u (ai − a)2
81
p t i=1
sigma_u V (ai ) = Standardabweichung der individuellen Regressionskon-
n−1
stanten. Da diese als xe Werte betrachtet werden,
ist dies keine Schätzformel, sondern eine eindeutige
Berechnung!
V (ai )
rho ρb = Geschätzter Anteil der Between-Varianz von y an der
V (ai ) + Vb () gesamten Varianz von y (gegeben x) / Geschätzte Korre-
lation zwischen zwei y -Werten ein und der selben Person
(gegeben x)
Fehlervarianzen im REM
v
u n X
T
uX
q
u
t 2
i=1 t=1
sigma_e Vb () = n(T −1)−1
Schätzformel für die Standardabwei-
chung des Residuums (analog zum σ in
der einfachen Regression)
v
u X n
82
(xi − x)(y i − y)2

u
u
n
u 1 Vb ()
q u X
sigma_u Vb (a) = u [ (y i − y)2 i=1 n ]− Schätzformel für die Standardabwei-
un − 2 X T
t i=1
(x − x)2 i
chung der über Individuen konstanten
i=1 Fehlerkomponente ai
Vb (a)
rho ρb = Geschätzter Anteil der Between-
Vb (a) + Vb () Varianz von y an der gesamten Varianz
von y (gegeben x) / Geschätzte Korre-
lation zwischen zwei y -Werten ein und
der selben Person (gegeben x)

mit:
n
X
1
a= n
ai
i=1
yeit = xit · bbf

n X
X T
1
ye = nT
yeit
i=1 t=1
2.5.2 Regressionsmodelle mit Dierenzenvariablen

Im Kontext von Modellen mit variablen Regressionskonstanten wurde das
Problem von Fehlspezikationen in Regressionsmodellen thematisiert. Dies
ist ein sehr bedeutsames Thema. Reelle komplexe Vorgänge zu modellieren,
soz. in eine konsistente mathematische Struktur zu übersetzen, ist nämlich
ein schwieriges Unterfangen. In vielen Regressionsmodellen kann die Varianz
einer abhängigen Variablen (und somit ein komplexer Sachverhalt) nur unzu-
reichend erklärt werden. Es sind also oft zusätzlich andere, unberücksichtigte
Gröÿen (sog. omitted variables ), welche nicht in das Modell aufgenommen
wurden, am Werke. Die Nicht-Berücksichtigung dieser Variablen ist eine zen-
trale Quelle für solche Modell-Fehlspezikationen.
Dies wäre weniger tragisch, wenn dadurch nicht ein groÿes Problem auf-
träte: Für den Fall, dass solche unberücksichtigten Gröÿen mit modellierten
unabhängigen Variablen korrelieren, werden die Schätzer der Regressionspa-
rameter inkonsistent (vgl. Arminger 1990: 2 ).
Es wurde in Kap. 2.5.1 gezeigt, dass mithilfe einer variablen Regressions-
konstanten ai eine bestimmte Klasse solcher unberücksichtigter Gröÿen ge-
bündelt, und je nach Modellansatz, herausgerechnet (FEM) oder als spezielle
Fehlerkomponente explizit modelliert (REM) werden kann: Es handelt sich
um die Klasse zeitinvarianter Merkmale. Eine alternative Methode der un-
sichtbaren Berücksichtigung zeitinvarianter nicht erhobener Variablen ist die
Bildung von Dierenzenmodellen.
Um diesen Ansatz zu veranschaulichen, soll an dieser Stelle noch mal die
bei vorliegenden Paneldaten möglichen Dierenzierungen hinsichtlich der Va-
riation von unabhängigen Variablen und ihren Regressionskoezienten (bzw.
Eekten) wiederholt werden:
83
• bt xit Unabhängige Variablen, deren Werte und Eekte auf die ab-
hängige Variable mit den Zeitpunkten variieren [Fall A]
• bxi Unabhängige Variablen, deren Werte und Eekte auf die abhän-
gige Variable über die Zeit konstant sind [Fall B]
• bt xi Unabhängige Variablen, deren Werte über die Zeit konstant sind,

aber deren Eekte auf die abhängige Variable mit den Zeitpunkten
variieren [Fall C]
• bxit Unabhängige Variablen, deren Eekte über die Zeit konstant
sind, aber deren Werte mit den Zeitpunkten variieren [Fall D]
Die Zuordnung einer Variablen zu einem dieser Fälle geschieht nach theo-
retischer Erwägung. Zwar kann man aus der Betrachtung von Datensätzen
Indizien für die Zuordnung bestimmter Variablen gewinnen, aber alleine auf-
grund dessen keine klare Entscheidung treen. Schlieÿlich haben wir es bei
empirischen Datensätzen mit Variablen zu tun, welche behaftet sind mit
stichprobentheoretischen, messtheoretischen und sonstigen Fehlern.
Zentral für die folgenden Ausführungen ist die Variablen-Eekte-Konstella-
tion des Falls B. Diese Konstellation könnte bspw. für Variablen zutreen, die
bereits im Zuge der FEM-Modelle diskutiert wurden wie genetische Disposi-
tionen, die Schichtzugehörigkeit, das Geschlecht oder die Intelligenz. Manche
dieser Variablen können zwar intraindividuellen Veränderungen unterliegen,
solche Veränderungen sind aber für eher kurze Zeiträume sehr unwahrschein-
lich (z.B. bei der Schichtzugehörigkeit).
Das Problem ist, dass solche Variablen zwar einen Eekt auf andere Va-
riablen haben können, aber nicht immer erhebbar sind. Während z.B. das
Geschlecht bei den meisten Untersuchungen problemlos erhoben wird, ge-
staltet sich dies bei der Intelligenz schwieriger.
Wirkt eine solche Variable auf eine abhängige Variable in einem Regressi-
onsmodell und wird sie nicht modelliert, so können die Koezienten weiterer
unabhängiger Variablen u.U. nur inkonsistent geschätzt werden.
Als einfaches Beispiel sei folgende Regressionsgleichung eingeführt (zur Ver-
einfachung wird der Objekteindex weggelassen und die Regressionskonstante
auf Null gesetzt):
84
yt = bt xt + cz + et (2.78)
mit
y = die abhängige Variable des Modells,

x = eine unabhängige Variable des Falls A,
b = der zu x zugehörige Regressionskoezient,
z = eine unabhängige Variable des Falls B (z.B. Intelligenz),
c = der zu z zugehörige Regressionskoezient,

e = das Residuum,
t = der Index für Zeitpunkte.
Im Appendix 4.3 unter Abb. 4.2 ist ein ktiver Datensatz abgelegt mit den
Variablen x und y zum Zeitpunkt t=1 und t=2 und der nicht über die
Zeit variierenden Variablen z.
Betrachtet man im Folgenden die Variablen eines Querschnitts (hier t = 1)

und berechnet die lineare Regression der abhängigen Variablen y1 nach der
KQ-Schätzung unter Einbeziehung von x1 und z (alle Variablen sind z-
transformiert), so gelangt man zu der Lösung:
y1 = 0, 423x1 + 0, 437z + e (2.79)
mit r2 = 0, 625.
In dem Falle, dass die Variable z nicht zur Verfügung stünde, würde sich
das Modell lediglich auf x1 als abhängige Variable beschränken. Es ergäbe
sich:
y1 = 0, 724x1 + e (2.80)
mit r2 = 0, 525.
Hier ist zu sehen, dass die Variable z einen signikanten Erklärungsbeitrag
leistet (+10% der erklärten Varianz von y1 ).

Vor allem sieht man aber, wie sich b1 , also der zu x1 gehörende Regres-
sionskoezient, ändert, wenn z einbezogen wird. Die beiden Variablen sind
85
schlieÿlich nicht unkorreliert (rx1 z = 0, 69), so dass z auch einen Einuss auf
die Schätzung von b1 ausübt. Folglich muss b1 aus Gl. 2.80 als konsistenter
Schätzer für den wahren Regressionskoezienten β1 in Frage gestellt werden.

43
Es wurde hier also gezeigt, dass das Modell unter Einbeziehung von z voll-
ständiger ist, als das Modell in Gl. 2.80, somit die Konsistenz der Schätzung
von b1 verbessert wird. Hat man allerdings nur Querschnittsdaten zur Ver-
fügung und die Variable z nicht erhoben, dann besteht keine Möglichkeit, b1
konsistenter zu schätzen, als in Gl. 2.80.
Dies ändert sich, wenn die Variablen im Paneldesign zu einem zweiten Zeit-
punkt erhoben worden sind.
Nun hat man nämlich zwei Querschnittsgleichungen und somit ein Glei-
chungssystem mit folgenden Gleichungen zur Verfügung (Schreibweise orien-
tiert an Gl. 2.78):
y1 = b1 x1 + cz + e1 (2.81)
y2 = b2 x2 + cz + e2 (2.82)
Über Subtraktion der beiden Gleichungen wird der Eekt von z eliminiert:
y2 − y1 = b2 x2 − b1 x1 + e2−1 (2.83)
bzw.
∆y = b2 x2 − b1 x1 + e2−1 (2.84)
mit e2−1 = e2 − e1
Auf das Beispiel von oben angewendet, gesellt sich zu der Querschnittsre-
gression aus Gl. 2.79 zu t=1 eine zweite Gleichung zu t = 2:
y2 = 0, 474x2 + 0, 435z + e (2.85)
43 der Schätzer aus Gl. 2.79 allerdings auch, da die Variation von y1 mit r 2 = 0, 625 noch lange nicht vollständig erklärt
ist - nur an irgendeiner Stelle sind die Grenzen des Machbaren erreicht
86
mit r2 = 0, 694.
Bildet man hier die Dierenz, entsprechend Gl. 2.84, erhält man:
∆y = 0, 474x2 − 0, 423x1 + e2−1 (2.86)
Es sei also festzuhalten, dass man mithilfe der Verschmelzung von Re-
gressionsgleichungen zu zwei Zeitpunkten, über die Bildung von ∆y , die
Querschnitts-Parameter b1 und b2 besser schätzen kann, da zumindest die
Eekte von nicht-modellierten Variablen des Falls B ausgeschaltet werden
können wohlgemerkt nur für Variablen des Falls B!
Weiterhin sei gesagt, dass die Bildung von Dierenzgleichungen auf meh-
rere Variablen verschiedener Art (also verschiedener Fälle) anwendbar ist.
Wäre die Variable x in Gl. 2.84 eine des Falls D, dann würde sich eine noch
einfachere Dierenzgleichung ergeben:
∆y = b(x2 − x1 ) + e2−1 (2.87)
Hätten wir hingegen in einem Regressionsmodell die Variable jedes Falls
einmal vertreten, würde also die Gleichung für einen Querschnitt so aussehen:
yt = bt xt + cz + dt v + f wt + et (2.88)
mit
v = Variable des Falls C,

d = Regressionskoezient der Variablen v ,
w = Variable des Falls D,
f = Regressionskoezient der Variablen w,
und alle anderen Gröÿen entsprechend Gl. 2.78
dann würde sich die Gleichung, gebildet aus den Dierenzen der Quer-
schnitte t=1 und t = 2, wie folgt verkomplizieren:
87
∆y = b2 x2 − b1 x1 + (d2 − d1 )v + f (w2 − w1 ) + e2−1 (2.89)
Auch an dieser Stelle ist zu sehen, dass bei der Bildung von Dierenz-
gleichungen nur die Variable z entfällt, bzw. entfallen kann. Somit müssen
weitere Variablen, wie x, v und w bekannt sein. Sind sie es nicht, dann kann
das Problem von inkonsistenten Schätzungen auch durch Paneldaten nicht
behoben werden.
Auÿerdem sei kurz erwähnt, dass das Arbeiten mit Dierenzgleichungen
aus statistisch-mathematischer Sicht dann problematisch ist, wenn diese Dif-
ferenzen sehr klein sind, also nur geringfügige Veränderungen in den Varia-
44
blenwerten über die Zeit stattgefunden haben.
Die Schätzung der in den hier vorgestellten Modellen enthaltenen Koezi-
enten soll nun exemplarisch für das Modell aus Gl. 2.84 angesprochen wer-
den. Möglich sind zwei Varianten: Man berechnet die Dierenzvariable ∆y

und bildet anstelle der Variablen x1 die Gegenwert-Variable (−x1 ), indem
man alle Werte von x mit (−1) multipliziert. So lässt sich Gl. 2.84 ebenfalls
schreiben als:
∆y = b2 x2 + b1 (−x1 ) + e2−1 (2.90)
Durch die Bildung von (−x1 ) ist die additive Verknüpfung der Regressions-
koezienten hergestellt und nun können diese Koezienten konventionell,
z.B. in STATA nach der KQ-Methode geschätzt werden.
Eine andere Möglichkeit besteht darin, mit Gl. 2.83 zu arbeiten. Nach Ad-
dition beider Seiten der Gleichung mit y1 und unter Gebrauch der oben ein-
geführten (−x1 )-Variablen, lässt sich diese Gleichung wie folgt schreiben:
y2 = y1 + b2 x2 + b1 (−x1 ) + e2−1 (2.91)
Das Modell in dieser Form lässt sich z.B. im Programm Lisrel implemen-
tieren. Hierbei werden die Indikatoren x und y als identisch mit den latenten
Variablen ξ und η deniert (da in diesen Modell keine latenten Variablen
auftauchen, LISREL aber die Spezikation von ξ und η verlangt). Des Wei-
44 Zur Kritik und zu Problemen bei der Bildung von Dierenzenvariablen s. Engel (1994: 19); Arminger (1990: 70f)
88
teren wird die Variable y1 zu den unabhängigen Variablen gezählt, weil sie
auf der rechten Seite der Gl. 2.91 steht. Da sie aber keine echte unabhängi-
ge Variable darstellt, wird der zu ihr zugehörige Regressionskoezient nicht
zur Schätzung freigesetzt, sondern auf den Wert Eins xiert. In Matrizen-
schreibweise und entsprechend der LISREL-Symbolik sieht die Gl. 2.91 nun
wie folgt aus:
 
ξ
1
η1 = 1 b2 b1  ξ2  + ζ (2.92)
ξ3
mit y 2 = η1 ,
y1 = ξ1 ,
x2 = ξ2 ,
(−x1 ) = ξ3 und
e2−1 = ζ
Solch eine Vorgehensweise ist zunächst einmal gewöhnungsbedürftig, lässt
aber viel Raum für Variation. So können in LISREL die unterschiedlichsten li-
nearen Modelle implementiert werden: Parameter können z.B. auf gewünsch-
te Werte xiert, mit anderen Parametern gleichgesetzt oder zur Schätzung
völlig freigesetzt werden und solche Optionsvielfalt erlaubt eben auch die
Implementierung der hier besprochenen Modelle.
An dieser Stelle soll der Gebrauch von LISREL nicht weiter vertieft werden.
Dies geschieht in Kap. 2.7. Des Weiteren kann hier auf zahlreiche Statistik-
Literatur verwiesen werden so z.B. auf das Buch von Arminger (1990: 72 ),
in welchem ein ähnliches Beispiel, wie das obige, und weitere Beispiele zur
Panelanalyse ausführlich, inkl. LISREL-Anwendung, erläutert werden.
Es sei noch etwas zu dem Beispiel-Datensatz gesagt: Die Konstruktion einer
Variablen z, welche die Eigenschaften vereinigt, sowohl auf y2 als auch auf
y1 den gleichen Eekt auszuüben, ist nicht einfach vor allem dann nicht,
wenn sich die beiden Variablen x2 und x1 in ihren Werten unterscheiden und
die Einüsse imperfekt sind. Dieses Ziel wurde daher nur annähernd erreicht
(dies sieht man daran, dass der Koezient c in Gl. 2.79 nicht mit dem in Gl.
2.85 identisch ist). Deshalb erbringt eine Schätzung der Koezienten allein
anhand von Gl. 2.84 nicht exakt dieselben Werte, wie sie unter Gl. 2.86 aus
der Dierenz der Querschnittsgleichungen errechnet worden sind.
89
Für den Datensatz sprechen allerdings die realistischen Bedingungen. Ge-
meint ist, dass hier Daten konstruiert worden sind, die ein Regressionsmodell
erzeugen, in dem die Varianz der abhängigen Variablen nicht vollständig er-
klärt wird und in dem die Werte der Regressionskoezienten nicht Null oder
Eins entsprechen.
Für den Leser, der den Sachverhalt mit Daten nachrechnen will, welche
zwar unrealistisch sind, dafür den Vorteil aufweisen, dass die Rechnung voll
aufgeht, ist ein weiterer Datensatz unter Appendix 4.3 (in Abb. 4.3) abge-
legt. Das Dierenzenmodell auf Basis dieses Datensatzes wird in Kap. 2.7
mit LISREL berechnet.
Zum Schluss soll noch kurz erläutert werden, warum das Dierenzenmo-
dell als weitere Alternative zu den FEM- und REM-Modellen vorgestellt

wurde. Im Abschnitt 2.5.1.6 wurde nämlich deutlich, dass sowohl FEM- als
auch REM-Modelle mit Vor- und Nachteilen behafet sind. Die Anwendung
des FEM ist nicht immer angemessen. Das REM besitzt hingegen einen
Nachteil, welcher in Dierenzenmodellen nicht gegeben ist: Es muss in Die-
renzenmodellen nicht explizit die Annahme der Unkorreliertheit zwischen z

und den unabhängigen Variablen des Modells gesetzt werden. z gehört näm-
lich, obwohl im Modell nicht explizit benannt, wie im FEM zu den xen
unabhängigen Variablen.
Allerdings stellt sich die Frage, ob z ein bestimmtes Merkmal zum Ausdruck
bringt, oder lediglich der Platzhalter für einen Bündel von einzeln betrachtet
insignikant wirkenden Merkmalen ist, in der gleichen Schärfe wie bei der
Frage nach der Angemessenheit der Anwendung eines FEM-Modells.
Ein weiterer Nachteil des Dierenzenmodells manifestiert sich darin, dass
das Rechnen mit Dierenzenvariablen, also mit Variablen, welche eine Än-
derung zwischen zwei Zeitpunkten zum Ausdruck bringen, nicht unproble-

matisch ist. Wenn nur wenig Veränderung zu verzeichnen ist, die Dieren-
zenvariablen also Werte nahe Null annehmen, dann sinkt die Reliabilität der
Dierenzenvariablen (vgl. Engel 1994: 19). Bezogen auf die Parameterschät-
zungen kann der Ezienzverlust erheblich sein (Arminger 1990: 75).
Es muss im Einzelfall bei der Entscheidung für oder gegen eines der beiden
Verfahren abgewogen werden, welche der Nachteile am ehesten zu akzeptieren
sind.
90
2.5.3 Modelle mit endogener Dynamik
Bislang wurden, bis auf die einführenden Beispiele in Kap. 2.1, Modelle be-
trachtet, welche keine endogene Dynamik aufweisen. Endogen meint, dass
eine Variable zu einem Zeitpunkt t1 einen Einuss auf sich selbst zum Zeit-
punkt t2 ausübt.
Wird dieser Einuss in einem Regressionsmodell berücksichtigt, so spricht
man von einem autoregressiven Prozess.
Wird des Weiteren lediglich die endogene Dynamik einer Variablen zwischen
benachbarten Zeitpunkten vermutet, so liegt ein autoregressiver Prozess ers-

ter Ordnung vor (bei z.B. drei Wellen und der Variablen yt mit t =1, 2 und
3 werden also die Einüsse y1 → y2 und y2 → y3 , aber nicht y1 → y3 ange-
nommen). Dieser Fall lässt sich allerdings erweitern zu einem autoregressiven
Prozess n-ter Ordnung.
Es seien nun y1 und y2 betrachtet. y2 wird hierbei als eine abhängige Va-
riable eines beliebigen Regressionsmodells verstanden:
Im Prinzip kann sich in solch einem Regressionsmodell y1 ganz normal zu
den unabhängigen Variablen gesellen.
Nehmen wir also an, wir hätten eine unabhängige Variable x2 , dann könnte
ein einfaches dynamisches Regressionsmodell wie folgt aussehen (mit c und
b als Regressionskoezienten der unabhängigen Variablen y1 respektive x2 ;

e = Fehlerterm; Darstellung wieder unter Verzicht der Konstanten und des
Personenindizes):
y2 = cy1 + bx2 + e (2.93)
Es steht der einfachen Schätzung eines solchen Modells (und einer Erwei-
terung um weitere Regressoren) nichts im Wege.
Allerdings gibt es Besonderheiten dynamischer Modelle, welche an dieser
Stelle diskutiert werden sollten:
Zuerst stellt sich die Frage nach erhöhter Multikollinearität. Multikollinea-
rität liegt dann vor, wenn unabhängige Variablen eines linearen Regressions-
modells untereinander zusammenhängen sowohl in Form bivariater als auch
91
partieller Korrelationen. Perfekte Multikollinearität würde die Berechnung
der Regressionskoezienten unmöglich machen, sie liegt bei empirischen Da-

45
ten aber eher selten vor.
Allerdings lässt sich Multikollinearität in abgestufter Form denken, so dass
man von einer relativ hohen Multikollinearität sprechen kann. Diese verhin-
dert zwar nicht die Berechnung einer Regression, kann aber die Ezienz von
Schätzern gefährden und folglich den Standardfehler dieser Schätzer erhöhen.
Weniger mathematisch ausgedrückt lässt sich sagen, dass es bei sehr hoher
Multikollinearität schwer ist, die reinen Einüsse einzelner unabhängiger Va-
riablen auf die abhängige Variable trennscharf zu bestimmen.
Wenn man nun ein Regressionsmodell bestimmt, dann geht man i.d.R. von
der Annahme aus, dass die unabhängigen Variablen einen Einuss auf die zu
erklärende Variable ausüben. Werden zwei einfache Querschnittsregressionen
zu zwei Zeitpunkten t=1 und t=2 betrachtet, dann ergeben sich folgende
Gleichungen:
y1 = a1 + bx1 + e1 (2.94)
y2 = a2 + bx2 + e2 . (2.95)
Wir gehen davon aus, dass in Gl. 2.95 die Variable x2 mit y2 korreliert ist.
Wird nun ein dynamisches Modell, wie in Gl. 2.93, gebildet, dann kommt die
Annahme hinzu, dass y1 mit y2 korreliert ist und zwar auf eine solche Art
und Weise, dass damit auch eine signikante Korrelation von x2 mit y1 sehr
wahrscheinlich wird.
Die Wahrscheinlichkeit für hohe Multikollinearität wird somit in einem dy-
namischen Modell, wie in Gl. 2.93, gesteigert (weil hier x2 und y1 zu den
unabhängigen Variablen gehören).
Ein gewisser Grad an Multikollinearität ist allerdings bei empirischen Va-

46
riablen normal und hat keine schwerwiegenden Folgen. Es existiert auch
kein Grenzwert, ab dem Multikollinearität in ihrer Höhe inakzeptabel wird.
Nichtsdestotrotz sollte beim Arbeiten mit dynamischen Modellen stärker auf
dieses Phänomen geachtet werden als sonst.
Ein weiteres Problem dynamischer Modelle knüpft an das der erhöhten
45 Sie würde z.B. auftauchen, wenn in einer Regression mit Dummy-Variablen die Referenzkategorie auch in Form einer
Variablen in die Berechnung einieÿen würde; denn die Referenzkategorie ist von den restlichen Dummies exakt linear
abhängig
46 Völlige Abwesenheit von Multikollinearität würde man mit Hilfe von orthogonalen Faktoren im Zuge der Berechnung
einer explorativen Faktorenanalyse erzeugen
92
Multikollinearität an. Es betrit das REM. Wie bereits in Kap. 2.5.1.6 dis-
kutiert wurde, ist ein REM nur unter der Annahme berechenbar, dass die
Fehlerkomponente ai mit unabhängigen Variablen aus dem REM unkorre-
liert ist.
Dies kann in einem dynamischen Modell nicht mehr behauptet werden.
Schlieÿlich verbergen sich hinter ai unabhängige Variablen, welche eine zeit-
konstante Wirkung auf die abhängige Variable haben, aber nicht erhoben
wurden.
Wird die Fehlervarianzzerlegung aus in die zwei hier eingeführten Regressi-
onsgleichungen 2.94 und 2.95 implementiert , dann ergibt sich (hier muss zur
Unterscheidung zwischen a und ai wieder mit dem Personenindex i gearbeitet

werden):
yi1 = a1 + bxi1 + ai + i1 (2.96)
yi2 = a2 + bxi2 + ai + i2 (2.97)
mit
yi1 und yi2 = abhängige Variablen zum Zeitpunkt t = 1 bzw. t = 2

a1 und a2 = über i konstante Regressionskonstanten zum Zeitpunkt t = 1
bzw. t = 2
b ist der über i und t konstante Regressionskoezient der unabhängigen

Variablen xi1 und xi2
i1 und i2 = die auch über t variierenden Fehlerkomponenten, welche zusam-
men mit ai den Gesamtfehler ei1 bzw. ei2 aus Gl. 2.94 und 2.95 ergeben (nur
dort wurde auf die Notation des i-Indizes verzichtet)
Wird ferner in dem dynamischen Modell aus Gl. 2.93 y1 durch den Aus-
druck auf der rechten Seite von Gl. 2.96 ersetzt und die Fehleraufteilung
vollzogen, ergibt sich:
yi2 = c(a1 + bxi1 + ai + 1 ) + bxi2 + ai + i2 (2.98)
bzw.:
yi2 = c · a1 + c · bxi1 + c · ai + c · 1 + bxi2 + ai + i2 (2.99)
93
Die Variable ai taucht hier sowohl als unabhängige Variable in der Form c · ai
als auch als Fehlerkomponente ei2 = ai + i2 auf. Logischerweise ist ai aus
c · ai einerseits und aus ei2 = ai + i2 andererseits mit sich selbst korreliert, so
dass die Prämisse verletzt wird, ai dürfe nicht mit unabhängigen Variablen
aus dem Modell korrelieren.
Somit ist die Berechnung eines REM mit endogener Dynamik nicht möglich.
In dynamischen Modellen bleibt damit lediglich die Möglichkeit, ai zu invol-
vieren, indem ein Dierenzenmodell, vergleichbar mit dem aus Kap. 2.5.2,
berechnet wird. Für eine Anwendung vgl. Arminger (1990: 129 ).
An dieser Stelle soll die Implementierung eines dynamischen Modells in
LISREL vorgestellt werden. Hierbei wird von drei Wellen ausgegangen, da
das Vorhandensein dreier Zeitpunkte die Implementierung, im Verglich zu
Daten aus zwei Wellen, etwas verkompliziert.
Betrachtet wird wieder das Beispiel des Abschnitts 2.5.1.7, dessen Daten-
satz im App. unter Tab. 4.1 zu nden ist. Es werden nun die Variablen
einzelner Zeitpunkte als eigenständige Variablen gehandhabt. In das Modell
nden 5 Variablen Eingang:
• y1 : Gewicht zum Zeitpunkt t=1
• x2 : Fetthaltiges Essen zum Zeitpunkt t=2
• x3 : Fetthaltiges Essen zum Zeitpunkt t=3
Zwei Regressionsmodelle werden aufgestellt, welche anschlieÿend ineinander
verschachtelt werden:
y2 = ay1 + bx2 + e2 (2.100)
y3 = ay2 + bx3 + e3 (2.101)
Die Panelstruktur und eine endogene Dynamik erster Ordnung werden
durch folgende Aspekte berücksichtigt:
94
• Das Gewicht zum zweiten Zeitpunkt gilt als abhängig von dem Gewicht
zum ersten Zeitpunkt
• Das Gewicht zum dritten Zeitpunkt gilt als abhängig von dem Gewicht
zum zweiten Zeitpunkt
• Es wird angenommen, dass der endogene Eekt (symbolisiert mit a)

zwischen dem ersten dem zweiten Zeitpunkt dem zwischen dem zweiten
und dem dritten Zeitpunkt gleicht
• Es wird ferner angenommen, dass der Eekt der unabhängigen Varia-
blen x (symbolisiert mit b) über die Zeit konstant ist
Um das Modell nun in LISREL zu implementieren, müssen wieder im Vorfeld
Messmodelle gebildet werden, welche eine Gleichsetzung von Indikatoren und
latenten Variablen erlauben. Diese sehen wie folgt aus:
    
ξ1 1 0 0 y1
η1 1 0 y2 ξ2  = 0 1 0 x1 
=
η2 0 1 y3
ξ3 0 0 1 x2
95
Somit gilt:
η1 = y 2
η2 = y 3
ξ1 = y1
ξ2 = x2
ξ3 = x3
Man beachte, dass aufgrund der Tatsache, dass auf y1 keine weitere Variable
im Modell einwirkt, sie zu den exogenen (also unabhängigen) ξ -Variablen
hinzugezählt wird.
Die Variable y2 gesellt sich hingegen zu den endogenen Variablen. Sie wirkt
zwar auf y3 , empfängt auf der anderen Seite aber auch einen Einuss von y1 .
Diese unterschiedlichen Modell-Platzierungen von y1 und y2 haben zur Fol-
ge, dass der endogene Eekt a sowohl in der Parameter-Matrix B als auch
in Γ jeweils einmal vertreten ist.
So lässt sich nun das Strukturmodell in Matrizenschreibweise darstellen:
 
ξ1
η1 0 0 η1 a b 0   ζ1
= + ξ2 + (2.102)
η2 a 0 η2 0 0 b ζ2
ξ3
In der Modell-Spezikation mit LISREL muss vor allem beachtet werden,
dass die Parameter a und b doppelt vertreten sind und somit bei der Schät-
zung gleichgesetzt werden müssen. An dieser Stelle soll die LISREL-Zeile der
Modellspezikation wiedergegeben werden:
MO NY=2 NX=3 BE=FU,FI GA=FU,FI TD=FU,FI TE=FU,FI

FR BE(2,1)
FR GA(1,2)GA(1,1)GA(2,3)
EQ BE(2,1)GA(1,1)
EQ GA(1,2)GA(2,3)
Da hier mit ktiven Daten gearbeitet wird, lässt sich die Stichprobengröÿe
beliebig manipulieren. Dies sollte an dieser Stelle auch getan werden, denn
durch die Aufspaltung der Variablen nach Zeitpunkten stehen pro Variable
lediglich vier Fälle zur Verfügung eine zu knappe Zahl, um Regressionskoef-
zienten adäquat zu schätzen. Der Autor hat sich entschieden, den Datensatz
zu verhundertfachen, so dass sich eine Stichprobengröÿe von n = 400 ergibt.
96
Aus diesem Grunde werden inferenzstatistische Maÿzahlen nicht betrach-
tet, wir verbleiben auf der deskriptiven Ebene.
Wichtig sind die beiden Regressionskoezienten:
a = 1.19
(2.103)
b = −0.41
Hier zeigt sich das gleiche Phänomen, wie bei dem FEM und REM. Im Ver-
gleich zu einem einfachen Regressionsmodell, in dem die unterschiedlichen
Zeitpunkte ignoriert werden, verändert sich das Vorzeichen des Regressions-
koezienten b in panelanalytischen Modellen. Der Wert wird negativ, was
auf einen negativen Zusammenhang zwischen y und x schlieÿen lässt.
Der Einuss des Gewichtes aus einem früheren Zeitpunkt hat hingegen, wie
intuitiv zu erwarten ist, einen positiven Eekt auf das eigene Gewicht zu ei-
nem späteren Zeitpunkt.
Weiterhin ist interessant, dass die Determinationskoezienten für beide
abhängigen Variablen durch die Einbeziehung der endogenen Dynamik sehr

2 2
hoch werden für y2 mit r = 1, 00 perfekt und für y3 mit r = 0, 98 fast
perfekt.
Solch hohe Werte dürfen aber in der Euphorie nicht unkritisch betrachtet
werden. Denn es stellt sich nun die Frage, inwieweit ein endogener Einuss
einer Variablen auf sich selbst zum späteren Zeitpunkt kausal interpretiert
werden kann.
Vielmehr ist zu vermuten, dass sich hinter dem endogenen Einuss wei-
tere exogene Einussgröÿen verbergen könnten, welche hier implizit mit-
modelliert wurden.
Weist z.B. eine Person in einer langen Zeitperiode ein relativ hohes Gewicht
auf und wird diese Zeitperiode in einzelne Zeitabschnitte aufgespaltet, dann
korreliert das Gewicht sicherlich stark mit sich selbst zwischen verschiedenen
Zeitabschnitten damit ist aber nicht (ursächlich) erklärt, warum eine Per-
son von vorneherein übergewichtig ist, bzw. welche Faktoren es verhindern,
dass sie ihr Gewicht reduziert.
Sicherlich stellt sich das Problem der kausalen Interpretation grundsätzlich
97
immer in statistischen Zusammenhangsanalysen. Allerdings sollte sich der
Analyst im Kontext der Analyse endogener Dynamik in Panelmodellen die-
sem Thema besonders kritisch widmen.
Für weitere Ansätze zur Analyse von dynamischen Panelmodellen sei auf
Arminger (1990: Kap. 7, 8) verwiesen.
2.6 Lineare Panelmodelle mit latenten Varia-

blen
In diesem Kapitel sollen kurz mögliche Modelle für Paneldaten vorgestellt
werden, welche echte latente Variablen beinhalten.
Es ist durchaus von Vorteil, die Anwendung von LISREL bereits an früheren
Stellen des Skripts eingeführt zu haben, da hiermit für den Leser das Denken
auf der Ebene von Strukturgleichungen nicht gänzlich neu ist.
Der Unterschied besteht nun darin, dass wir es nicht mehr mit einfachen
Gleichsetzungen zwischen Indikator und latenter Variablen zu tun haben,
sondern mit Messmodellen, in denen Indikatoren und latente Variablen über
eine korrelative Beziehung miteinander verbunden sind.
Diese Korrelationen, auch Ladungen (λ: Klein-Lambda) genannt, müssen
in den meisten Modellvarianten (von LISREL oder anderen Programmen)
geschätzt werden, so dass die Anzahl der zu schätzenden Parameter steigt
und damit auch die Möglichkeit für Fehlspezikationen im Gesamtmodell,
da nun auch die Daseinsberechtigung von Beziehungen zwischen einzelnen
Indikatoren und latenten Variablen in Frage gestellt werden kann.
Es müssen folglich in einem typischen Strukturgleichungsmodell drei Sub-
modelle aufgestellt werden:
• Das Messmodell, welches die manifesten y -Variablen mit den latenten
endogenen η -Variablen verbindet
• Das Messmodell, welches die manifesten x-Variablen mit den latenten
exogenen ξ -Variablen verbindet
• Das Strukturmodell, welches die Beziehung der latenten Variablen η

und ξ untereinander speziziert
98
Veranschaulicht könnte ein Strukturgleichungsmodell nun wie folgt ausse-
hen:
Strukturgleichungsmodell am Beispiel der Migrationstheorie von

Esser
Kulturation Platzierung Interaktion Identifikation
Spr Koc Mus Pla Ein Bes v. Bes b. als D. Ver H.
Abbildung 2.6: Veranschaulichung eines Strukturgleichungsmodells
Auf die Inhalte dieses Modells soll an dieser Stelle nicht eingegangen wer-
den, es dient lediglich einer allgemeinen Veranschaulichung.
Festgehalten werden sollte, dass diese Graphik eine Erweiterung der im
Kap. 2.2 vorgestellten Methode der Visualisierung von Modellen über Pf-
addiagramme darstellt. Es wird, zusätzlich zu den Punkten aus Kap. 2.2,

konventionell unterschieden zwischen:
• Kreisen für latente Variablen und
• Rechtecken für Indikatoren.
In diesem Beispiel gibt es auf der Ebene latenter Variablen nur eine ξ-
Variable (Kreis ganz links: Kulturation), da nur auf diese Variable keine
Pfeile zeigen, und drei η -Variablen (Platzierung, Interaktion und Identi-
kation).
Jede latente Variable wird indirekt gemessen bzw. erzeugt durch zwei bis
drei Indikatoren (Rechtecke).
Aufgrund der Komplexität solcher Modelle muss der Analyst oft bei der
Anwendung auf eine inhaltliche Fragestellung eine Vielzahl ähnlicher Mo-

delle testen, bis er zu einem akzeptablen Modell gelangt. Das Aunden und
99
Aufstellen eines tauglichen Modells ist somit meistens ein iterativer Prozess
und keine standardisierte Prozedur nach Vorschrift.
Ansonsten lassen sich für Paneldaten im Kontext linearer Strukturglei-
chungsmodelle ähnliche Modellunterscheidungen vornehmen, wie die bereits
im Zuge von Regressionsmodellen (vgl. Kap. 2.5) vorgestellten.
Auch auf der Ebene von Strukturgleichungen lässt sich z.B. eine Fehlerva-
rianzzerteilung vornehmen, korrelierende Residuen (sowohl für Messmodelle
als auch für Strukturmodelle) spezizieren und zwischen dynamischen und
statischen Modellen dierenzieren.
An dieser Stelle wird ein Grundgerüst für ein einfaches Strukturgleichungs-
modell vorgestellt und ein paar Modellvarianten besprochen.
Es muss hierbei grundlegendes Wissen in Bezug auf Strukturgleichungs-
modelle vorausgesetzt werden. Für eine ausführliche Einführung und Vertie-
fung sei vor allem auf das Buch von Reinecke (2005), aber auch auf frühere
Stellen dieses Skripts (z.B. auf die Ausführungen zur Pfadanalyse, zum Ein-
Indikator-Modell und zu LISREL-Modellimplementierungen) verwiesen.
Das nun aufgegriene Beispiel bezieht sich auf einen kleinen Ausschnitt aus
dem Integrationsansatz von Esser (1999). In diesem Ansatz wird versucht,
den Prozess der Integration von Migranten zu systematisieren. Zu diesem
Prozess gehören u.a. vier Stufen der sozialen Integration, welche aufeinander
aufbauen. Diese vier Stufen lassen sich als latente Variablen auassen, wie in
Graphik 2.6 dargestellt.
Eine theoretische Auseinandersetzung mit den Inhalten dieses Ansatzes wä-
re hier fehl am Platze, es sollen viel mehr statistisch-theoretische Ausführun-
gen auf eine inhaltliche Fragestellung angewendet werden. Das Beispiel dient
also lediglich der Illustration.
Eine erste Stufe des Integrationsprozesses ist nach Esser die sog. Kultura-
tion. Sie umfasst vor allem die Sprachkompetenz. Letztere lässt sich auch als
latente Variable verstehen. Diese übt einen Einuss auf die sog. Identikation
aus ebenfalls eine latente Gröÿe, welche die emotionale Verbundenheit des
Migranten mit dem Aufnahmeland angibt.
Es soll hier somit die Hypothese untersucht werden, ob Sprachkompeten-

zen (exogene Variable) eine positive Wirkung auf die Identikation
100
(endogene Variable) haben . Beide Konstrukte sollen nun über Indikatoren
aus dem SOEP-Datensatz (zu diesem Datensatz s. einführende Bemerkungen
in der Einleitung des Skripts) indirekt messbar gemacht werden. Es ergibt
sich folgende einfache Messkonstellation:
Latente Variable Indikator
Sprachkompetenzen (SP) Deutsch schreiben (Schr)
Deutsch sprechen (Spre)
Identikation (IDT) sich als Deutscher fühlen (s.a.D.f.)
Tabelle 2.6: Verbindung zwischen Indikatoren und latenten Variablen
Wie zu sehen ist, werden Sprachkompetenzen durch zwei Indikatoren greif-
bar gemacht, während die Identikation aus Gründen der Vereinfachung le-
diglich mit einem Indikator gleichgesetzt wird.
Alle drei Variablen sind ordinalskaliert mit fünf Ausprägungen und wer-
den hier als quasi-metrisch aufgefasst. Sie reektieren Selbsteinschätzungen
ausländischer Personen.
Nun wird noch zwischen zwei Zeitpunkten dierenziert: 2001 und 2003. Da-
durch ergeben sich vier latente Variablen und sechs Indikatoren, wie folgende
Graphik illustriert:
Grundgerüst
Schr 2001 Schr 2003
SP - 2001 SP - 2003
Spre 2001 Spre 2003
s.a.D.f. 2001 IDT - 2001 IDT - 2003 s.a.D.f. 2003
Abbildung 2.7: Grundgerüst
101
Der Vorteil des SOEP-Paneldatensatzes liegt darin, dass er eine überpropor-
tionale Ausländer-Stichprobe beinhaltet. Nach einigen Datenaufbereitungs-
schritten konnte vom Autor die Korrelations- und die Kovarianzmatrix der
sechs Indikatoren, welche als Basis für weitere Berechnungen zur Verfügung
steht, ermittelt werden. In ihr sind 391 gültige Fälle erfasst. Alle bivaria-
ten Korrelationen sind auf dem 5%-Niveau signikant von Null verschieden.
Ferner sind alle Zusammenhänge positiv.
Die beiden Matrizen benden sich im Anhang 4.5, wobei die Korrelati-
onsmatrix in der Graphik 4.4 und die Kovarianzmatrix in der Graphik 4.5
aufgelistet ist.
Nun sollen einige Varianten vorgestellt werden, welche die Identikation als
abhängige und die Sprachkompetenzen als unabhängige Variablen vorsehen.
Das oben vorgestellte Grundgerüst soll somit mit Leben gefüllt werden. Es
wird in jedem Modell dem Vorteil, dass Paneldaten vorliegen, Rechnung ge-
tragen. Die Varianten stellen allerdings nur einen Auszug möglicher Modelle
dar.
Bei den ersten Modellen wird in der visuellen Darstellung auf die Fehler-
terme aus Veranschaulichungsgründen verzichtet. Es gilt die Annahme, dass
sowohl die Residuen aus den Messmodellen als auch aus dem Strukturmodell
untereinander unkorreliert sind.
Modellvariante A (statisches Modell mit kreuzverzögertem Ef-

fekt)
Hier wird ein sehr einfaches statisches Modell dargestellt. Es wird lediglich
der kreuzverzögerte Eekt zwischen den beiden latenten Variablen spezi-
ziert:
102
Statisches Modell mit kreuzverzögertem Effekt
Schr 2001 Schr 2003
SP - 2001 SP - 2003
Spre 2001 Spre 2003
p1
s.a.D.f. 2001 IDT - 2001 IDT - 2003 s.a.D.f. 2003
Abbildung 2.8: Modellvariante A
103
Die Strukturgleichung lautet:

IDT2003 = p1 SP2001 + ζ1
mit den Messmodellen:

Schr2001 λ1 δ
+ 1 = s.a.d.f.2003

= SP2001 IDT2003
Spre2001 λ2 δ2
Modellvariante B (Zwei Querschnittsmodelle)

Als nächstes werden die beiden Querschnitts-Modelle für 2001 und 2003
betrachtet:
Zwei verbundene Querschnittsmodelle (Panelstruktur über

Gleichheitsrestriktion: p3=p4)
Schr 2001 Schr 2003
SP - 2001 SP - 2003
Spre 2001 Spre 2003
p3 p4
s.a.D.f. 2001 IDT - 2001 IDT - 2003 s.a.D.f. 2003
Abbildung 2.9: Modellvariante B

IDT2001 p3 0 SP2001 ζ
= + 1
IDT2003 0 p4 SP2003 ζ2
104
     
Schr2001 λ1 0 δ1
Spre2001 λ2 0 SP2001 δ2  s.a.d.f.2001 1 0 IDT2001
Schr2003 =  0 + =
    
λ3  SP2003 δ3  s.a.d.f.2003 0 1 IDT2003
Spre2003 0 λ4 δ4
Hierbei ist zu beachten, dass die Panelstruktur in diesem Modell dann Ein-
gang ndet, wenn angenommen wird, dass der Eekt der Sprachkompetenz
auf die Identikation zu beiden Zeitpunkten gleich ist. Formal geschieht dies
über: p 3 = p4 . An dieser Stelle werden die beiden Querschnittsmodelle mit-
einander verbunden und somit die Panelstruktur der Daten berücksichtigt.
Modellvariante C (Einfaches Modell mit endogener Dynamik)

In dieser Modellvariante wird eine endogene Dynamik implementiert. Das
heiÿt, dass neben dem Einuss der Sprachkompetenz auch eine Eigenwirkung
der latenten Variablen Identikation auf sich selbst (von 2001 auf 2003) zu-
gelassen wird. Dieses Modell lässt sich wie folgt veranschaulichen:
Einfaches dynamisches Modell
Schr 2001 Schr 2003
SP - 2001 SP - 2003
Spre 2001 Spre 2003
p1
p2
s.a.D.f. 2001 IDT - 2001 IDT - 2003 s.a.D.f. 2003
Abbildung 2.10: Modellvariante C

SP2001
IDT2003 = p1 p2 + ζ1
IDT2001
105
     
Schr2001 λ1 0 δ1
 Spre2001  = λ2 SP2001
0 + δ2 
s.a.D.f.2001 0 1
IDT2001
δ3 IDT2003 = s.a.d.f.2003
Man beachte, dass somit die latente Variable Identikation 2001 zu den
exogenen ξ -Variablen gezählt wird.
Modellvariante D (Vollgepacktes Modell)

Leider geschieht es immer wieder, dass z.B. ein Mangel an fundierten In-
formationen den Forscher dazu veranlasst, ein Modell unreektiert vollzupa-
cken. Dies ist zwar an sich nicht verwerich, muss aber keine Verbesserung
der Modellanpassung an die Realität bedeuten.
Ein gutes Modell ist u.a. dadurch gekennzeichnet, dass es aus der komple-
xen Realität Sachverhalte und Zusammenhänge abstrahiert und gleichzeitig
vereinfacht darstellt. Ein vollgepacktes Modell kann sich zwar mit einer
höheren Wahrscheinlichkeit der Realität anpassen, verliert aber u.U. an Aus-
sagekraft, da sich keine einfachen Zusammenhänge aus ihm ablesen lassen.
Ferner kann in solchen Modellen das Phänomen der Multikollinearität stei-
gen, so dass Schätzer inezient werden.
Folgendes Beispiel soll nun betrachtet werden (wobei dieses Modell nur
vollgepackt in Relation zu den vorherigen Modellen ist es ist immer noch
von einer relativen Einfachheit gegenüber Strukturgleichungsmodellen in der
Praxis gekennzeichnet):
106
„Vollgepacktes“ Modell
Schr 2001 Schr 2003
SP - 2001 SP - 2003
Spre 2001 Spre 2003
p1
p3 p4
p2
s.a.D.f. 2001 IDT - 2001 IDT - 2003 s.a.D.f. 2003
Abbildung 2.11: Modellvariante D

IDT2001 0 0 IDT2001 p3 0 SP2001 ζ
= + + 1
IDT2003 p2 0 IDT2003 p1 p4 SP2003 ζ2
     
Schr2001 λ1 0 δ1
Spre2001
 = λ2 0 SP2001 + δ2  s.a.d.f.2001 1 0 IDT2001
  

Schr2003 =
0 λ3  SP2003 δ3  s.a.d.f.2003 0 1 IDT2003
Spre2003 0 λ4 δ4
Auch hier sollen die beiden Querschnittseekte gleichgesetzt werden: p3 =

p4 .
Modellvariante E (Vollgepacktes Modell mit Autokorrelation

der Messfehler)
Bislang wurde eine in diesem Skript oftmals angeschnittene Eigenheit von
Paneldaten ignoriert: Autokorrelation der Fehler inhaltlich gleicher Variablen
von gleichen linearen Modellen zu verschiedenen Zeitpunkten.
Es ist nämlich wahrscheinlicher, dass die Residuen einer Person in einem
linearen Modell sich ähneln, als die Residuen zweier Personen, welche zu-
fällig in einem Datensatz nebeneinander liegen (und als die Residuen einer
107
Person, welche sich aus verschiedenen linearen Submodellen eines überge-
ordneten Modells ergeben). Auf Aggregatebene manifestiert sich eine solche
tendenzielle Ähnlichkeit in der Autokorrelation von Residuen.
Diese Autokorrelation soll nun im vollgepackten Modell implementiert
werden. Es werden dabei nur die Fehler in der Ladungsmatrix Λx betrach-
tet, da die y -Variablen in der Matrix Λy durch die Gleichsetzung mit den
Indikatoren nicht mit Residualtermen behaftet sind. Folgende Abbildung ist
erweitert um die Residuen δ und die korrelativen Beziehungen zwischen ih-
nen:
„Vollgepacktes“ Modell mit Autokorrelation der Fehler

V13
V24
d1 Schr 2001 Schr 2003 d3
SP - 2001 SP - 2003
d2 Spre 2001 Spre 2003 d4
p1
p3 p4
p2
s.a.D.f. 2001 IDT - 2001 IDT - 2003 s.a.D.f. 2003
Abbildung 2.12: Modellvariante E
Der Buchstabe d steht hierbei für den Fehler δ, so dass z.B. d3 δ3
entspricht. Der Buchstabe V steht für υ , das ein Element der Varianz-
Kovarianzmatrix der Messfehler von x, also Θδ , repräsentiert. So sei deniert:
V 13 = υ13 und V 24 = υ24 .

Die Varianz-Kovarianzmatrix Θδ ist somit unter Berücksichtigung der Kor-
relation der Fehler inhaltlich gleicher Variablen zu verschiedenen Zeit-

punkten gegeben durch:
 
υ11
 0 υ22
 
Θδ = 

υ13 0 υ33


0 υ24 0 υ44
Alle Modelle wurden in LISREL implementiert und gerechnet. Im Anhang
108
4.6 benden sich die Zeilen der jeweiligen Modellspezikationen.
Hier sollen tabellarisch die wichtigsten LISREL-Schätzer und χ2 für die
jeweiligen Modellvarianten ausgegeben werden:
Modellvarianten p1 p2 p3 p4 λ1 λ2 λ3 λ4 r2 χ2
Mod. A 0, 44 − − − 1, 05 0, 84 − − ID03 : 0, 19 0
Mod. B − − 0, 5 0, 5 1, 08 0, 82 1, 09 0, 86 ID01 : 0, 21 214, 2
ID03 : 0, 22
Mod. C 0, 17 0, 52 − − 1, 01 0, 88 − − ID03 : 0, 44 2, 65
Mod. D −0, 27 0, 56 0, 48 0, 48 1, 09 0, 82 1, 09 0, 86 ID01 : 0, 2 68, 58
ID03 : 0, 46
Mod. E −0, 28 0, 54 0, 49 0, 49 0, 99 0, 83 1, 02 0, 91 ID01 : 0, 21 5, 03
ID03 : 0, 46
Insgesamt lässt sich sagen, dass sich im Wesentlichen ein Zusammenhang
zwischen Sprachkompetenzen und Identikation an den Daten bestätigt.
Alle in den verschiedenen Modellvarianten geschätzten Koezienten sind
auf dem 5%-Niveau signikant von Null verschieden. Diese Koezienten sind
unstandardisiert, aber dadurch, dass die Maÿeinheiten für alle Variablen und
in allen Modellen gleich sind (5-stuge Rangskalen), sind Vergleiche zwischen
den Modellen möglich.
Zunächst einmal lässt sich feststellen, dass die sich im Messmodell der
Sprachvariablen bendlichen Ladungen sich als relativ stabil über verschie-
dene Modellvarianten und über die beiden Zeitpunkte hin erwiesen haben.
Auch die hier nicht aufgelisteten Determinationskoezienten der Gleichun-

2
gen in den Messmodellen waren meist sehr hoch angesiedelt (r > 0, 7). Die
gröÿte Veränderung zeigte sich im Modell mit implementierter Autokorrela-
tion der Messfehler was nicht weiter verwunderlich sein dürfte, da dieser
Eingri speziell die Ladungsmatrix Λx betrit.
109
An dieser Stelle sei kurz auf die Maÿzahl χ2 eingegangen. In jedem Struk-
turgleichungsmodell wird durch die Modellvorgaben und die Konstellationen
zwischen Variablen eine theoretische Kovarianzmatrix erzeugt. In dieser Ma-
trix werden die Kovarianzen der manifesten Variablen reproduziert.
Schlieÿlich wird diese theoretisch reproduzierte Kovarianzmatrix mit der
empirischen Ausgangsmatrix verglichen. Je ähnlicher sich beide sind, umso
eher ist das Modell in der Lage, sich der in der Empirie gewonnene Daten-
struktur, also pathetisch ausgedrückt: der Realität anpassen.

2
Die Maÿzahl χ basiert auf dem Vergleich zwischen theoretischer und em-
pirischer Kovarianzmatrix. Je niedriger der Wert, umso ähnlicher sind sich
beide Matrizen und somit umso besser ist das Modell geeignet, die Realität
zu beschreiben.
Dies sollte an dieser Stelle an Ausführungen reichen. Vertiefende Notationen
zur Modellbeurteilung sind zu nden in Arminger (2005: 115-129).
Angewendet auf die Statistiken der hier aufgeführten einzelnen Modell-
varianten ist zunächst festzustellen, dass im einfachen Modell (Mod. A) mit

2
kreuzverzögertem Eekt die Anpassung perfekt ist mit χ = 0. Das liegt aller-
dings nicht daran, dass das Modell perfekt im Sinne der Erklärungskraft ist,
was an dem Determinationskoezienten zu sehen ist. Es ist lediglich durch
sein Einfachheit so gestrickt, dass sich rein mathematisch die Kovarianzma-

47 2
trix perfekt reproduzieren lässt . Der χ -Wert wird also erst für komplexere
Modelle relevant.
Interessant ist dieser Wert für das Zwei-Querschnittsmodell, der mit χ2 =

214, 2 enorm hoch ist. Anscheinend sind die beiden Querschnitts-Modelle
nicht wirklich kompatibel.
Aber auch nachträgliche Berechnungen des Autors, in denen von der Gleich-
heitsrestriktion p3 = p4 abgesehen wurde und somit

als eigenständiger p4
2
Koezient zur Schätzung freigegeben wurde, ändern an dem hohen χ -Wert
nichts. Generell hat dieses Modell eher schlecht abgeschnitten auch von der
Erklärungskraft her.
Ein weiterer eindrucksvoller Befund manifestiert sind in dem Vergleich zwi-

2
schen dem χ -Wert des vollgepackten Modells ohne Autokorrelation der Feh-
ler (Mod. D) und dem des vollgepackten Modells mit Autokorrelation der
2 2
Fehler (Mod. E): χ = 68, 58 vs. χ = 5, 03. Auch wenn sonstige Koezienten
sich nicht wesentlich verändert haben, so ist die Einführung der korrelativen
47 Dies trit auch auf einfache Regressions- und Pfadmodelle zu
110
Beziehung zwischen Fehlern zu verschiedenen Zeitpunkten in der Lage, das
Modell wesentlich besser an die empirischen Daten anzupassen. Es wird so-
mit der Panelstruktur gerechter.
Am besten scheint das einfache dynamische Modell (Mod. C) abzuschnei-

2 2
den: Ein geringer χ -Wert, ein relativ hoher r -Wert und inhaltlich gesehen
ein plausibles Modell.
Auallend ist, dass der kreuzverzögerte Eekt durch die Einführung der
endogenen Dynamik deutlich kleiner geworden ist ein Hinweis für Fehlspe-
zikation im kreuzverzögerten Modell (Mod. A).
In dem vollgepackten Modell (Mod. D und E) kehrt sich sogar die Rich-
tung des Zusammenhangs des kreuzverzögerten Eekts um dieser wird
negativ. Es wäre zu diskutieren, ob dies eher den kreuzverzögerten Eekt in
Frage stellt oder eher auf ein zu vollgepacktes Modell hinweist, indem die
einzelnen Koezienten nicht mehr ezient, mit minimaler Varianz, geschätzt
werden.
Dieses Kapitel sollte einen kleinen Auszug darstellen, wie man sich an die
Verknüpfung dieser beiden komplexen Ebenen:
• Ebene der Paneldatenstruktur und
• Ebene von Strukturgleichungsmodellen
herantasten kann.
Natürlich sind verschiedene Erweiterungen und die Modellierung komplexe-
rer Modelle möglich. Es sei z.B. auf die Möglichkeit der Implementierung ei-
nes REM (s. Kap. 2.5.1) oder eines Dierenzenmodells (s. Kap. 2.5.2) auf der
Ebene von Strukturgleichungen verwiesen, nachzulesen bei Arminger (1990).
2.7 Anwendung von LISREL auf Paneldaten

Es sei an dieser Stelle noch etwas zu LISREL, also der Software, in der kom-
plexe lineare Modelle zur Berechnung implementiert werden können, gesagt:

48
48 Der Autor arbeitet mit LISREL 8.53
111
Zum ersten Mal in diesem Skript tauchte eine Anwendung in Kap. 2.5.2, al-
so im Zuge der Berechnung eines Dierenzenmodells auf. Von LISREL wurde
im weiteren Verlauf des Skripts Gebrauch gemacht im Zusammenhang mit
immer komplexer werdenden Modellen.
Dies soll nicht den Eindruck erwecken, als sei LISREL nur in der Lage,
komplexe Strukturgleichungsmodelle zu berechnen. Ebenso lassen sich mit
diesem Programm einfache Regressions- und pfadanalytische Gleichungen
modellieren, welche keine latenten Variablen beinhalten.
Zwei oensichtliche Gründe gibt es, warum dieses Programm im Kontext
verhältnismäÿig einfacher Modelle eher selten zur Anwendung kommt:
Erstens liegt dies an der Umständlichkeit der Implementierung solcher Mo-
delle. Eine lineare Regression lässt sich mit STATA oder SPSS ohne viel
Aufwand berechnen. In LISREL hingegen muss getrickst werden. Denn es
wird immer auf der Ebene von Strukturgleichungen modelliert und sol-
che Strukturgleichungen sehen eine Spezikation latenter Variablen vor. Um
nun einfache Modelle ohne latente Variablen zu implementieren, müssen die
beobachteten Variablen aus einem Regressionsmodell als latente Variablen
deniert und mit sich selbst als Indikatoren gleichgesetzt werden. Dies er-
fordert Kenntnisse in Hinblick auf Strukturgleichungsmodelle und auf die
Matrizenrechnung (welche nicht zwingend gegeben sind, wenn man sich mit
der Regressionsanalyse auskennt) und bringt einen gewissen Aufwand mit
sich.
Zweitens liegt es daran, dass in vielen einfachen Modellen eine eindeutige
arithmetische Lösung bei der Schätzung von Koezienten errechenbar ist. In
solchen Fällen ist es sicherlich nicht begründbar, eine eindeutige Lösung gegen
eine einzutauschen, welche über die Annäherung durch iterativ arbeitende
Algorithmen, wie im Falle der Maximum-Likelihood-Schätzung bei LISREL,
bestimmt wird (auch wenn sich hierbei die Schätzungen der beiden Methoden
z.T. nur minimal um Nachkomma-Stellen unterscheiden).
Nichtsdestotrotz schadet es nicht, sich bei der Aneignung des Umgangs
mit LISREL auch mal an einfachen Modellen zu versuchen. Denn ein in
LISREL eingepegtes bi- oder multivariates Regressionsmodell lässt sich auf
seine Richtigkeit hin mit anderen Standard-Statistik-Programmen prüfen. Es
kann somit für das Vorankommen beim Erlernen von LISREL förderlich sein,
die ersten Schritte auf einer solch einfachen Ebene zu tätigen.
112
Ein Nachweis für die Anwendbarkeit von LISREL auf einfache Modelle soll
an dieser Stelle geliefert werden. Hierzu wird das Pfadmodell aus Kap. 2.3
betrachtet.
Wie bereits mehrmals erwähnt, müssen zuerst die beobachteten Variablen
mit Bezeichnungen für latente Variablen versehen werden.
Auf der Seite der endogenen Variablen wird deniert:
x2 = η1
y 2 = η2
Die exogenen Variablen sind gegeben durch:
x1 = ξ1
y1 = ξ2
Die Messmodelle müssen so konstruiert sein, dass die Indikatoren den la-
tenten Variablen entsprechen. Diese Forderung ist erfüllt, wenn die Ladungs-
matrizen Einheitsmatrizen entsprechen. So kann für die endogenen Variablen
formuliert werden:

η1 1 0 x2
= (2.104)
η2 0 1 y2
Das Äquivalent für die exogenen Variablen sieht wie folgt aus:

ξ1 1 0 x1
= (2.105)
ξ2 0 1 y1
Nun lässt sich das Strukturgleichungsmodell in Matrizenschreibweise de-
nieren:

η1 0 0 η1 px2 x1 px2 y1 ξ1 ζ
= + + 1 (2.106)
η2 0 0 η2 p y2 x1 p y2 y1 ξ2 ζ2
Die Schreibweise der zu schätzenden Stabilitätskoezienten und kreuzver-
zögerten Eekte ist hierbei mit der aus Kap. 2.3 identisch. Die Matrix, welche
nur Nullen enthält (i.d.R. symbolisiert mit B ), hat die Funktion, gerichtete
oder ungerichtete Beziehungen zwischen endogenen Variablen zu formulieren.
113
Da solche Beziehungen hier nicht modelliert werden, entspricht B einer Null-
matrix, so dass dieser Block wegfällt und keine η -Variablen auf der rechten
Seite der Strukturgleichung auftauchen. Kompakt geschrieben nimmt deshalb
diese Gleichung diese Form an:

η1 px2 x1 px2 y1 ξ1 ζ
= + 1 (2.107)
η2 py2 x1 py2 y1 ξ2 ζ2
An dieser Stelle muss elementares Wissen bzgl. der LISREL-Syntaxsprache
vorausgesetzt werden. Weiter unten benden sich diesbezüglich Verweise auf
nützliche Quellen im Internet. Auÿerdem sei das an mehreren Stellen be-
reits zitierte Buch von Arminger (1990) empfohlen, in welchem verschiedene
panelanalytische Modelle in LISREL berechnet und ausführlich dargestellt
werden. Hier wird nur die Zeile der Modellspezikation wiedergegeben. Zu-
erst die ausführliche Variante:
MO NY=2 NX=2 NE=2 LY=FU,FI GA=FU,FR PS=DI TE=DI,FI
ST 1 LY(1,1) LY(2,2)
In der Modellformulierung wird explizit gesagt, dass es 2 η -Variablen gibt
und das Messmodell aus Gl. 2.104 wird speziziert. Diese Angaben sind nicht
einmal nötig, da beim ihrem Weglassen LISREL diese Zusammenhänge au-
tomatisch annimmt.
Solange die Anzahl der endogenen latenten Variablen der Anzahl ihrer In-
dikatoren entspricht wie in diesem Falle , ist der Ausdruck NE=2 redun-
dant. Solange ferner die Ladungsmatrix aus Gl. 2.104 eine Einheitsmatrix ist,
braucht sie nicht in LISREL speziziert zu werden (wie hier durch: LY=FU;
ST 1 LY(1,1) LY(2,2)). Man beachte allerdings: Wenn die Anzahl NE an-
gegeben wird, dann muss auch LY deniert werden.
Nun kann man dieses Modell gekürzt wie folgt darstellen:
MO NY=2 NX=2 GA=FU,FR PS=DI TE=DI,FI
Die Schätzung der Koezienten nach der Maximum-Likelihood-Methode
ergibt:
114
Stabilitätskoezienten px2 x1 = 0, 88
py2 y1 = 0, 68
Kreuzverzögerte Eekte px2 y1 = −0, 03
py2 x1 = 0, 28
Der Querschnittseekt px1 y1 = 0, 742 wurde hier nicht explizit aufgeführt,

da dieser der Korrelation rx1 y1 entspricht und nicht mit LISREL geschätzt
wurde.
Es ist festzustellen, dass hier die maximum-likelihood-basierten Schätzer
der eindeutigen arithmetischen Lösungen aus Kap. 2.3 sehr ähnlich sind. Die
gröÿte Diskrepanz taucht bei py2 y1 auf. Die Dierenz beider Koezienten
liegt bei |0, 09|. Sonst sind die LISREL-Schätzungen viel näher an der arith-
metischen Lösung. Insgesamt lässt sich somit dieses Vorgehen als akzeptabel
einstufen.
Ein weiterer Vorteil beim Arbeiten mit LISREL liegt darin, dass der simple
Befehl PD ein Pfaddiagramm ausgibt, und zwar inkl. der mit Koezienten-
werten beschrifteten Pfeile. Dieser Befehl sollte einmalig zwischen zwei der
vier typischen Komponenten der LISREL-Syntax stehen, also zwischen
1. der Kopfzeile mit Labels der Indikatoren,
2. der Kovarianz- oder Korrelationsmatrix der Indikatoren,
3. der Modellspezikation,
4. oder der Output-Anforderungen.
In diesem Beispiel sieht das Pfaddiagramm, vom Autor etwas bearbeitet,
wie folgt aus:
115
Abbildung 2.13: Pfaddiagramm zum Beispiel
Soviel sei zu dem Pfadmodell gesagt.
Ferner soll kurz gezeigt werden, wie sich das Dierenzenmodell aus Kap.
2.5.2, speziziert in Gl. 2.92, in LISREL implementieren lässt.
Hierzu soll der Datensatz aus Appendix 4.3 (s. Abb. 4.3.2) der Analyse
unterzogen werden. Wie bereits im Kontext der Bildung von Regressionsmo-
dellen mit Dierenzenvariablen gesagt worden ist, hat dieser ktive Daten-
satz einen ziemlich unrealistischen Charakter. Dies äuÿert sich darin, dass
2
die Varianz der abhängigen Variablen zu 100% erklärt wird (r = 1) und
alle Regressionskoezienten den Wert 1 betragen. Insofern reduziert sich die
Gleichung 2.91 auf:
y 2 = y 1 + x 2 − x1 (2.108)
Nichtsdestotrotz ist es interessant, ein solches Modell in LISREL zu imple-
mentieren und die aus dem künstlichen Datensatz resultierenden Parameter-
schätzungen mit den vermuteten Koezienten (b1 , b2 = 1) zu vergleichen.
Die Modellspezikation nimmt die folgende Form an:
MO NY=1 NX=3 GA=FU,FI PS=DI TE=DI,FI
ST 1.0 GA(1,1)
FR GA(1,2) GA(1,3)
Mit ST 1.0 GA(1,1) wird der Schätzer der unechten abhängigen Va-
riablen y1 auf Eins xiert (s. Gl. 2.92 und 2.91 und ferner Erläuterungen im
116
Text an dieser Stelle).
Mit FR GA(1,2) GA(1,3) werden b1 und b2 zur Schätzung frei gegeben.

Es bestätigt sich mit LISREL: b1 , b2 = 1.
Diese Ausführungen sollten einen Einblick in die vielfältigen Möglichkeiten
von LISREL verschaen. Durch die Option, viele Schätzer in komplexen Mo-
dellen auf bestimmte Werte zu xieren, freizugeben oder mit anderen Schät-
zern gleichzusetzen, hat der Forscher einen weiten Spielraum, seine Modelle
zu testen und durch kleine Variationen zu versuchen, ihre Anpassung an reale
Daten zu verbessern.
Zum Schluss des Kapitels noch ein paar Verweise auf Quellen im Internet,
welche für LISREL-Einsteiger nützlich sind:
Download der LISREL-Studentenversion
http://www.ssicentral.com/lisrel/student.html
LISREL-Hilfen für Einsteiger
http://user.uni-frankfurt.de/~cswerner/sem/free_fix.pdf
http://www.soziologie.uni-halle.de/langer/lisrel/skripten/lisrel83.pdf
http://www.ssicentral.com/lisrel/techdocs/SIMPLISSyntax.pdf
117
Kapitel 3
Fazit
Dieses Skript zeigte einen kleinen Ausschnitt aus einem riesigen Statistik-
Subuniversum: dem der linearen Analyse von Paneldaten. Gewiss ist das
Hantieren mit Daten, welche sich zusätzlich zu herkömmlichen Querschnitts-
daten noch an der Zeitachse entlang dierenzieren, kein einfaches Unterfan-
gen. Vor allem nicht, wenn diese Daten für voraussetzungsvolle statistisch-
theoretische Überprüfungen genutzt oder mit der abstrakten Analyse latenter
Gröÿen konfrontiert werden.
Aber aus eigener Erfahrung lässt sich sagen, dass man sich Schritt für
Schritt in dieses Statistik-Paradigma hineindenken kann und damit merkt,
wie wertvoll die Panelanalyse für (sozial-)wissenschaftliche Fragestellungen
ist.
Somit sei gehot, dass dieses Skript einen leichten, aber dennoch fundier-
ten Einstieg in diese Thematik erlaubt und die Idee der Wichtigkeit solcher
Analysen ein Stück weit fördert trotz hohen Aufwands auf der Ebene der
Datenerhebung und relativ hoher Komplexität auf der Ebene der Datenana-
lyse.
118
Kapitel 4
Appendix
4.1 Appendix A - Fiktiver Datensatz mit vari-

ierender x2-Variable
X1 X2WENIG X2MITTEL X2VIEL X1X2WENI X1X2MITT X1X2VIEL

1 1 5 25 0 4 24
2 2 10 50 0 8 48
3 3 15 75 0 12 72
4 5 22 100 1 18 96
5 5 25 125 0 20 120
6 6 30 150 0 24 144
7 7 35 172 0 28 165
8 8 40 200 0 32 192
9 9 50 225 0 41 216
10 10 50 250 0 40 240
11 9 55 275 -2 44 264
12 12 60 300 0 48 288
13 13 65 325 0 52 312
14 14 66 350 0 52 336
15 15 75 375 0 60 360
16 19 80 400 3 64 384
17 17 86 411 0 69 394
18 18 90 450 0 72 432
19 22 95 475 3 76 456
20 20 100 515 0 80 495
Abbildung 4.1: Fiktiver Datensatz 1
119
4.2 Appendix B - Fiktiver Datensatz zur Pfa-
danalyse mit Paneldaten
x1y1x2y2
1 4 2 4
2 2 2 2
3 3 3 3
4 2 4 1
5 5 5 5
6 4 6 6
7 7 7 7
1 1 1 2
2 2 2 2
3 3 3 3
4 4 3 4
5 5 5 4
5 6 5 4
7 4 7 7
1 1 1 1
2 4 2 5
3 3 3 3
4 4 4 4
5 5 5 5
6 3 7 2
7 7 7 7
1 1 1 1
2 2 7 2
1 3 3 3
4 4 4 5
5 5 5 5
6 5 6 4
7 4 7 7
120
4.3 Appendix C - Fiktive Datensätze für eine
Regression mit Dierenzenvariablen
4.3.1 Datensatz mit einer eher realistischen Struktur
y1 y2 x1 x2 z
-1,65190 -1,48008 -,35277 -1,53310 1,30319

-1,51470 -1,34354 -1,65398 -1,39523 -1,58728
-1,37750 -1,07046 -1,50940 -1,25736 -1,44964
-1,24030 -1,07046 1,23759 -1,11949 -1,31200
-1,10310 -1,20700 -1,22024 -,98163 -1,31200
-,96590 -,79739 -1,07567 -,98163 -1,03672
-,82869 -,66085 -,93109 -,70589 -,21087
-,69149 -,52431 -,78651 -,56802 -,76143
-,55429 -,38777 -1,36482 -,43015 -,62379
-,41709 -,25123 -,49735 -,29228 -,48615
-,27989 -,11469 -,35277 -,15441 -,34851
,40612 ,02185 -,20819 -,01654 -,21087
,54332 -,38777 -,06361 ,12132 -,34851
,13171 -,93392 ,08096 ,25919 -1,17436
,26891 ,43146 ,22554 ,39706 ,20206
,40612 ,56800 ,37012 ,53493 ,33970
,54332 ,70454 ,51470 ,67280 ,47734
,68052 ,84108 ,65928 -1,25736 ,61498
,81772 ,97762 ,80386 ,94854 ,75262
-,00549 1,11416 ,94844 1,08641 ,89026
1,09212 1,25069 1,09302 1,22427 1,02791
1,22932 1,38723 -,49735 1,36214 1,16555
1,36652 -,52431 1,38217 1,50001 1,06920
1,50372 1,66031 1,52675 1,63788 1,44083
1,64092 1,79685 1,67133 ,94854 1,57847
Abbildung 4.2: Fiktiver Datensatz 2
Die Zahlen 1 und 2 hinter x und y stehen für 1. und 2. Zeitpunkt.
121
4.3.2 Datensatz mit einer eher unrealistischen Struktur
y1 x1 z y2 x2
1,00 1,00 ,00 3,00 3,00
2,00 1,00 1,00 6,00 5,00
3,00 4,00 -1,00 9,00 10,00
4,00 4,00 ,00 12,00 12,00
5,00 3,00 2,00 15,00 13,00
6,00 5,00 1,00 18,00 17,00
7,00 10,00 -3,00 21,00 24,00
8,00 11,00 -3,00 24,00 27,00
9,00 8,00 1,00 27,00 26,00
10,00 7,00 3,00 30,00 27,00
11,00 6,00 5,00 33,00 28,00
12,00 7,00 5,00 36,00 31,00
13,00 8,00 5,00 39,00 34,00
14,00 8,00 6,00 42,00 36,00
15,00 9,00 6,00 45,00 39,00
16,00 11,00 5,00 48,00 43,00
17,00 10,00 7,00 51,00 44,00
18,00 10,00 8,00 54,00 46,00
19,00 9,00 10,00 57,00 47,00
20,00 17,00 3,00 60,00 57,00
Auch hier stehen die Zahlen hinter den

Variablen für den 1. bzw. 2. Zeitpunkt
Abbildung 4.3: Fiktiver Datensatz zum selber Rechnen
122
4.4 Appendix D - Datensatz zur Berechnung
eines FEM
4.4.1 Ursprungsdatensatz
Person Zeitpunkt Variable Y Variable X

A 1 60 53
A 2 61 51
A 3 62 50
B 1 71 55
B 2 73 54
B 3 70 57
C 1 86 64
C 2 84 69
C 3 83 70
D 1 95 66
D 2 97 64
D 3 100 63
Tabelle 4.1: Ursprungsdatensatz für ein FEM
Variable X ist gemessen in Kilogramm, die Werte von Variable Y basieren
auf einer vom Autor erfundenen metrischen Skala von 0=Tagesration des
Essens enthielt kein Fett bis 100=Tagesration des Essens bestand nur aus
Fett.
123
4.4.2 Datensatz mit Dummy-Variablen
P Z Y X D1 D2 D3
A 1 60 53 1 0 0
A 2 61 51 1 0 0
A 3 62 50 1 0 0
B 1 71 55 0 1 0
B 2 73 54 0 1 0
B 3 70 57 0 1 0
C 1 86 64 0 0 1
C 2 84 69 0 0 1
C 3 83 70 0 0 1
D 1 95 66 0 0 0
D 2 97 64 0 0 0
D 3 100 63 0 0 0
Tabelle 4.2: Datensatz für ein FEM inkl. Dummy-Variablen
mit
P=Person
Z=Zeitpunkt
Y, X stehen für die inhaltlichen Variablen
D1-D3 stehen für die drei Dummy-Variablen
124
4.5 Appendix E - Korrelations- und Kovarianz-
matrix der Indikatoren für ein Struktur-
gleichungsmodell
KORRELATIONSMATRIX
schr2001 spre2001 schr2003 spre2003 s.a.D.f.2001 s.a.D.f.2003
schr2001 1
spre2001 0.771 1
schr2003 0.81 0.67 1
spre2003 0.734 0.76 0.79 1
s.a.D.f.2001 0.38 0.43 0.36 0.4 1
t s.a.D.f.2003 0.38 0.38 0.38 0.4 0.65 1
Abbildung 4.4: Die Korrelationsmatrix der sechs Indikatoren
KOVARIANZMATRIX
schr2001 1.436
spre2001 0.888 .922
schr2003 1.178 .7878 1.47
spre2003 0.847 .7043 .9365 .9274
s.a.D.f.2001 0.49 .445 .471 .4193 1.15
t s.a.D.f.2003 0.49 .390 .494 .4262 .733 1.12
Abbildung 4.5: Die Kovarianzmatrix der sechs Indikatoren
125
4.6 Appendix F - Modellzeilen in LISREL für
verschiedene Varianten von Strukturgleichungs-
modellen
Die Reihenfolge der manifesten Variablen in LISREL wurde wie folgt festge-
legt:
Modellvariante A
SE
6 1 2/
MO NY=1 NX=2 NE=1 NK=1 BE=FU,FI GA=FU,FR LX=FU,FR
LY=FU,FR TE=FU,FI TD=DI
ST 1.0 LY(1,1)
Modellvariante B
SE
5 6 1 2 3 4/
MO NY=2 NX=4 NE=2 NK=2 BE=FU,FI GA=FU,FI LX=FU,FI
LY=FU,FI TE=FU,FI TD=DI
ST 1.0 LY(1,1) LY(2,2)
FR LX(1,1) LX(2,1) LX(3,2) LX(4,2)
FR GA(1,1)
EQ GA(1,1) GA(2,2)
Modellvariante C
SE
6 1 2 5/
MO NY=1 NX=3 NE=1 NK=2 BE=FU,FI GA=FU,FR LX=FU,FI
LY=FU,FR TE=FU,FI TD=DI
ST 1.0 LY(1,1)
126
FR LX(1,1) LX(2,1)
ST 1.0 LX(3,2)
Modellvariante D
SE
5 6 1 2 3 4/
LY=FU,FI TE=FU,FI TD=DI
ST 1.0 LY(1,1) LY(2,2)
FR LX(1,1) LX(2,1) LX(3,2) LX(4,2)
FR GA(1,1) GA(2,1)
EQ GA(1,1) GA(2,2)
FR BE(2,1)
Modellvariante E
SE
5 6 1 2 3 4/
LY=FU,FI TE=FU,FI TD=FU,FI
ST 1.0 LY(1,1) LY(2,2)
FR LX(1,1) LX(2,1) LX(3,2) LX(4,2)
FR GA(1,1) GA(2,1)
EQ GA(1,1) GA(2,2)
FR BE(2,1)
FR TD(1,1) TD(2,2) TD(3,3) TD(4,4) TD(3,1) TD(4,2)
FR TE(1,1) TE(2,2) TD(1,2)
127
4.7 Kurzer Verweis auf Grundlagen der linea-
ren (Regressions-)Analyse
In einführenden Statistik-Veranstaltungen wird im Kontext der Einführung
in die Regressionsanalyse oft der Schwerpunkt auf die Berechnung von

Koezienten einer einfachen Regressionsgleichung gelegt. Dies ist
schlieÿlich der erste Schritt zum dierenzierten Verständnis von statistischen
linearen Modellen. Allerdings sollte man nicht nach diesem Schritt stehen
bleiben.
Die Errechnung von Regressionsgleichung erfolgt i.d.R. mit moderner Soft-
ware augenblicklich. Dies ist komfortabel. Aber die eigentlich wesentliche Ar-
beit des Forschers beginnt erst an dieser Stelle. Es muss nämlich geprüft
werden, inwieweit das Modell gelungen ist.
Hierzu wird sowohl das Modell als Ganzes, als auch einzelne Koezienten,
auf deskriptiver und inferenzstatistischer Ebene, auf ihre Güte (Unverzerrt-
heit, Ezienz, Erwartungstreue etc.) untersucht.
Ferner sind in linearen Modellen einige Annahmen / Voraussetzungen im-
plizit eingebaut, deren Kenntnis oftmals stillschweigend vorausgesetzt wird.
An dieser Stelle sollen einige solcher Voraussetzungen kurz aufgelistet werden
denn nur ihre Kenntnis erlaubt dem Forscher die Überprüfung, ob diese für
sein Modell auch erfüllt sind.
Zuerst sei die allgemeine Formel einer multivariaten Regressionsgleichung
mit J unabhängigen Variablen gegeben:
J
X
yi = a + bj xji + ei (4.1)
j=1
mit
i = Index einzelner Objekte

j = Index einzelner unabhängiger Variablen
y = abhängige Variable
xj = unabhängige Variable
a = Regressionskonstante
bj = Regressionskoezient der j -ten Variablen
e = Residual- bzw. Fehlervariable
128
Folgende Annahmen müssen u.a. erfüllt werden:
1. Linearität in den Parametern: In linearen Modellen müssen die
Parameter rein additiv verknüpft sein; nicht-lineare Zusammenhänge
zwischen den Variablen hingegen lassen sich oft durch geeignete Trans-
formationen linearisieren
2. Erwartungswert der Residuen µ =0: Sonst können systematische
Messfehler vorliegen oder wichtige Einussgröÿen im Modell nicht be-
rücksichtigt worden sein
3. Normalverteilung der Residuen: Wird für inferenzstatistische Tech-
niken vorausgesetzt
4. Homoskedastizität: Residuen müssen eine konstante Varianz (z.B.
in Teilgruppen) aufweisen; diese Annahme kann vor allem bei Längs-
schnittdaten gefährdet sein, wenn Varianzen der Residuen zu verschie-
denen Zeitpunkten verglichen werden
5. Keine Autokorrelation der Residuen: Ebenfalls ein groÿes Pro-
blem von Längsschnittdaten, da eine korrelative Beziehung von Resi-
duen gleicher Objekte zu verschiedenen Zeitpunkten wahrscheinlich ist
6. Keine Korrelation zwischen Residuen und unabhängigen Va-

riablen: Eine Verletzung dieser Annahme deutet auf das Vorhanden-
sein wichtiger nicht-modellierter Einussgröÿen (also auf eine Modell-
Fehlspezikation) hin, welche mit in das Modell aufgenommenen Va-
riablen korrelieren
7. Keine zu hohe Multikollinearität: Unabhängige Variablen dürfen
untereinander nicht zu starke korrelative Beziehungen erster und wei-
terer Ordnung aufweisen
129
Diese Auistung erhebt nicht den Anspruch, erschöpfend zu sein und in die
Tiefe zu gehen. Sie dient lediglich einer ersten Orientierung.
Für eine Vertiefung in diese Thematik sowohl bezogen auf die Theorie
als auch auf Techniken zur Aufdeckung und Behebung von Voraussetzungs-
Verletzungen sei der Leser auf wertvolle Literaturhinweise verwiesen: von

Auer (2007) / Kohler (2008: Kap. 8.3) / Backhaus (2006: 78-94).
Einem Leser, welcher noch vor dem ersten Schritt steht, also keine Vor-
kenntnisse zur Regressionsanalyse mit sich bringt, sei einführend Benning-

haus (2005: Kap. 7) und Backhaus (2006: 46-78) empfohlen.
130
Abbildungsverzeichnis
2.1 Korrelationsmatrix . . . . . . . . . . . . . . . . . . . . . . . . 13
2.2 Kovarianzmatrix . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.3 Beispiel für ein Pfaddiagramm . . . . . . . . . . . . . . . . . . 20
2.4 Pfaddiagramm des Beispiels . . . . . . . . . . . . . . . . . . . 21
2.5 Pfaddiagramm eines Ein-Indikatoren-Modells . . . . . . . . . . 34
2.6 Veranschaulichung eines Strukturgleichungsmodells . . . . . . 99
2.7 Grundgerüst . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
2.8 Modellvariante A . . . . . . . . . . . . . . . . . . . . . . . . . 103
2.9 Modellvariante B . . . . . . . . . . . . . . . . . . . . . . . . . 104
2.10 Modellvariante C . . . . . . . . . . . . . . . . . . . . . . . . . 105
2.11 Modellvariante D . . . . . . . . . . . . . . . . . . . . . . . . . 107
2.12 Modellvariante E . . . . . . . . . . . . . . . . . . . . . . . . . 108
2.13 Pfaddiagramm zum Beispiel . . . . . . . . . . . . . . . . . . . 116
4.1 Fiktiver Datensatz 1 . . . . . . . . . . . . . . . . . . . . . . . 119
4.2 Fiktiver Datensatz 2 . . . . . . . . . . . . . . . . . . . . . . . 121
4.3 Fiktiver Datensatz zum selber Rechnen . . . . . . . . . . . . . 122
4.4 Die Korrelationsmatrix der sechs Indikatoren . . . . . . . . . . 125
4.5 Die Kovarianzmatrix der sechs Indikatoren . . . . . . . . . . . 125
131
Tabellenverzeichnis
2.1 Verschiedene Korrelationsstrukturen . . . . . . . . . . . . . . . 25
2.2 Korrelationsmatrix für eine Pfadanalyse . . . . . . . . . . . . 28
2.3 Ergebnisse Pfadanalyse . . . . . . . . . . . . . . . . . . . . . . 29
2.4 Übersicht über die Eigenschaften vorgestellter Modelle . . . . 37
2.5 Werte einer Variablen von Objekten zu verschiedenen Zeit-
punkten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
2.6 Verbindung zwischen Indikatoren und latenten Variablen . . . 101
4.1 Ursprungsdatensatz für ein FEM . . . . . . . . . . . . . . . . 123
4.2 Datensatz für ein FEM inkl. Dummy-Variablen . . . . . . . . 124
132
Literaturverzeichnis
[1] Arminger, G. ; Müller, F. : Lineare Modelle zur Analyse von Panel-

daten. Westdeutscher Verlag, 1990
[2] Auer, L. v.: Ökonometrie. Eine Einführung. Springer Verlag, 2007
[3] Backhaus, K. ; al. et: Multivariate Analysemethoden. Eine anwen-

dungsorientierte Einführung. 11. Auage. Springer Verlag, 2006
[4] Benninghaus, H. : Deskriptive Statistik. Eine Einführung für Sozial-

wissenschaftler. 10. Auage. VS Verlag, 2005
[5] Engel, U. ; Reinecke, J. : Panelanalyse. Grundlagen - Techniken -

Beispiele. Walter de Gruyter Verlag, 1994
[6] Esser, H. : Inklusion, Integration und ethnische Schichtung. In: Journal

für Konikt- und Gewaltforschung (1999), Nr. 1, S. 534
[7] Faulbaum, F. : Panelanalyse im Überblick. In: ZUMA-Nachrichten

(1988), Nr. 23, S. 2644
[8] Frees, W. : Longitudinal and Panel Data. University Press, 2004
[9] Hsiao, C. : Analysis of Panel Data. Second Edition. University Press,

2003
[10] Jöreskog, K. ; Sörbom, D. : Structural Equation Modeling with the
SIMPLIS Command Language. SSI, 1993
[11] Kessler, R. ; Greenberg, D. : Linear Panel Analysis. Models of

Quantitative Change. Academic Press, 1981
133
[12] Kohler, U. ; Kreuter, F. : Datenanalyse mit STATA. Allgemeine
Konzepte der Datenanalyse und ihre praktische Anwendung. Oldenbourg
Verlag, 2008
[13] Long, J. : Covariance Structure Models. An Introduction to LISREL.
Sage Publications, 1983
[14] Opp, K. ; Schmidt, P. : Einführung in die Mehrvariablenanaly-

se. Grundlagen der Formulierung und Prüfung komplexer sozialwissen-
schaftlicher Aussagen. Rowohlt, 1976
[15] Pfeifer, R. ; Schmidt, A. : LISREL. Die Analyse komplexer Struk-
turgleichungsmodelle. Gustav Fischer Verlag, 1987
[16] Rabe-Hesketh, S. : Multilevel and longitudinal modeling using Stata.
StataCorp LP, 2008
[17] Reinecke, J. : Strukturgleichungsmodelle in den Sozialwissenschaften.
Oldenbourg Verlag, 2005
[18] Schnell, R. ; Hill, P. ; Esser, E. : Methoden der empirischen Sozi-
alforschung. 7. Auage. Oldenbourg, 2005
[19] Weede, E. ; Jagodzinski, W. : Einführung in die konrmatorische
Faktorenanalyse. In: Zeitschrift für Soziologie 6 (1977), Nr. 3, S. 315
333
134

Panel Analyse

Hochgeladen von

Copyright:

Verfügbare Formate

Panel Analyse

Hochgeladen von

Dokumentinformationen

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Panel Analyse

Hochgeladen von

Copyright:

Verfügbare Formate

Analyse von Paneldaten - Ein Abriss

Petra Stein, Dawid Bekalarczyk

22. Juli 2010

2 Ausgewählte Analyseverfahren für Paneldaten 9

2.1.1 Der Korrelationskoezient als Indikator für Stabilität

2.1.2 Die einfache Regression einer zeitlich vorangestellten

inhaltlich gleichen Variablen auf die Variable zum spä-

2.2 Eine kurze Einführung in die Pfadanalyse . . . . . . . . . . . . 18

2.3 Eine einfache Pfadanalyse mit Paneldaten . . . . . . . . . . . 27

2.4 Das Ein-Indikatoren-Modell als Ansatz zur Unterscheidung

zwischen Veränderung und mangelnder Reliabilität . . . . . . 31

2.5 Regressionsmodelle für Paneldaten . . . . . . . . . . . . . . . 37

2.5.1 Modelle mit variablen Regressionskostanten: Fixed- und

2.5.2 Regressionsmodelle mit Dierenzenvariablen . . . . . . 83

2.5.3 Modelle mit endogener Dynamik . . . . . . . . . . . . 91

2.6 Lineare Panelmodelle mit latenten Variablen . . . . . . . . . . 98

2.7 Anwendung von LISREL auf Paneldaten . . . . . . . . . . . . 111

4.2 Appendix B - Fiktiver Datensatz zur Pfadanalyse mit Panel-

4.3.1 Datensatz mit einer eher realistischen Struktur . . . . . 121

4.3.2 Datensatz mit einer eher unrealistischen Struktur . . . 122

4.4 Appendix D - Datensatz zur Berechnung eines FEM . . . . . . 123

4.4.1 Ursprungsdatensatz . . . . . . . . . . . . . . . . . . . . 123

4.4.2 Datensatz mit Dummy-Variablen . . . . . . . . . . . . 124

4.5 Appendix E - Korrelations- und Kovarianzmatrix der Indika-

toren für ein Strukturgleichungsmodell . . . . . . . . . . . . . 125

4.6 Appendix F - Modellzeilen in LISREL für verschiedene Vari-

anten von Strukturgleichungsmodellen . . . . . . . . . . . . . 126

4.7 Kurzer Verweis auf Grundlagen der linearen (Regressions-)Analyse128

Dieses Skript umreiÿt einige Möglichkeiten, sog. Paneldaten zu analysieren.

tarere Begrie geklärt werden:

Man redet von Paneldaten, als Spezialfall von Längsschnittdaten, wenn

dieselben Messungen an den gleichen Objekten vornehmen. Diese drei Aspek-

Untersuchungseinheiten beziehen, charakterisieren Panelstudien. Die Mess-

zeitpunkte werden üblicherweise als sog. Wellen bezeichnet. Eine Panelstudie

mit z.B. 4 Wellen würde bedeuten, dass zu vier Zeitpunkten Messungen an

denselben Objekten vorgenommen worden sind. Hat eine Panelstudie m Wel-

mester immer zu Semesterbeginn derselbe Fragebogen zum Thema Zufrie-

immer um dieselben Personen, dann spricht man von einer Panelstudie.

Streng genommen sind die oben eingeführten Kriterien zu hart formuliert,

denn kleine Abweichungen z.B. der Items im Fragebogen von Zeitpunkt zu

zu, den Begri Panelstudie zu verwenden. In der Umfragepraxis hat es sich

kere Verbreitung von sog. (Online-)Access-Panels, meist in der Marktfor-

schung, zurückzuführen. Der Betreiber eines Access-Panels rekrutiert einen

und Incentive-Systeme zu zukünftigen Teilnahmen an diversen Befragungen

motiviert werden. Verschiedene Auftraggeber können nun an den Betreiber

herantreten, um Befragungen mit einer (meist nach Merkmalen gezielt ausge-

wählten) Teilmenge der Probanden des Access-Panels durchzuführen. Diese

studien, welche nicht gerade zahlreich in der Forschungslandschaft vertreten

• Sozio-Ökonomisches Panel (DIW Berlin)

• Migrationsentscheidungen im Lebensverlauf und die Relevanz lokaler

Bedingungen (Uni Bremen)

• Kriminalität in der modernen Stadt  Jugenddelinquenz und -devianz

im Wandel von urbanen Sozialmilieus, Lebens-, Freizeit- und Konsum-

stilen, ethnisch-kulturellen Orientierungen und sozialer Kontrolle (Uni

• Panelstudien innerhalb des DFG-Projektes Survey Methodology 

Kooperation mehrerer Universitäten, die sich methodischen Fragen in

gröÿte Paneldatensatz, welcher in Deutschland erhoben wurde und wird. Ge-

riablen zu sozialen, ökonomischen und demographischen Themengebieten.

Survey Methodology) stellen eher verhältnismäÿig kleine Erhebungen dar,

die auf eine bestimmte spezielle Fragestellung ausgerichtet sind (Jugenddeli-

2.1.1 Der Korrelationskoezient als Indikator für Stabilität

2.5.2 Regressionsmodelle mit Dierenzenvariablen . . . . . . 83

tarere Begrie geklärt werden:

mester immer zu Semesterbeginn derselbe Fragebogen zum Thema Zufrie-

zu, den Begri Panelstudie zu verwenden. In der Umfragepraxis hat es sich

kere Verbreitung von sog. (Online-)Access-Panels, meist in der Marktfor-

• Kriminalität in der modernen Stadt Jugenddelinquenz und -devianz

• Panelstudien innerhalb des DFG-Projektes Survey Methodology

Survey Methodology) stellen eher verhältnismäÿig kleine Erhebungen dar,

Der Begri Panelanalyse impliziert, dass es eine einheitliche Form der

Sammelbegri zu verstehen ist. Darüber hinaus muss die eben angesprochene

se gängiger statistischer Techniken z.B. aus dem Bereich der multivariaten

den. So nden im Zuge der Analyse bekannte Analyseformen und -modelle

wie Regressions- und Pfadanalyse, Strukturgleichungsmodelle, Analyse

latenter Klassen etc. ihren Platz.

Es müssen im Vorfeld also die gängigen Vorüberlegungen stattnden, welche

Intraindividuelle Veränderungen sind somit nicht identizierbar. Dies kann

Grundgesamtheit an. Zum zweiten Zeitpunkt ndet man dasselbe Verhältnis

auf intra-individueller Ebene betrachtet werden. Denn es ist im obigen Bei-

An diesem Beispiel wird auch deutlich, dass wenn von intra-individuellen

wäre (Paneleekte). Daraus könnten verzerrte, invalide Messungen resultie-