Suchen und Finden
Vorwort
5
Inhaltsverzeichnis
6
Teil I Einführung
10
1 Einführung: Sozialwissenschaftliche Datenanalyse
11
1 Moderne Sozialwissenschaft und die Bedeutung der Statistik
11
2 Ziele und Zielgruppe des Handbuchs
12
3 Themenauswahl
13
4 Gliederung und Inhal
14
5 Ausblick
14
Literaturverzeichnis
15
2 Kausalität als Gegenstand der Sozialwissenschaften und der multivariaten Statistik
16
1 Einführung
16
2 Was heißt Kausalität?
17
2.1 Zeitliche Reihenfolge von Ereignissen als grundlegende Bedingung für Kausalität
18
2.2 Kausalität als „innerer Zusammenhang“ von Ereignissen
18
2.3 Die Veränderung von Ereignissen nach der Manipulierung anderer Ereignisse: Die Kontroll-Definition von Kausalität
18
2.4 Kausalität als „Mechanismus“
19
2.5 Die kontrafaktische Definition von Kausalität: Was wäre wenn?
19
2.6 Exkurs: Die Logik der Erklärung
20
2.7 Ursachen als Anfangsbedingungen oder als Wenn-Komponente von Gesetzen: Die Gesetzes-Definition von Kausalität
21
2.8 Zum Vergleich der Kausalitäts-Definitionen
23
3 Kausalität in sozialwissenschaftlichen Experimenten
24
4 Kausalität in multivariaten Analyseverfahren: Das Beispiel der Regression
27
4.1 Enthalten Kausalmodelle Kausalaussagen?
27
4.2 Regressionsanalyse und kausale Schlüsse
28
4.3 Kausalität in anderen multivariaten Verfahren
33
4.4 Gibt es Algorithmen für die Ermittlung von Kausalität?
34
5 Einzelfallanalysen, historische Daten und die Prüfung von Kausalaussagen
36
6 Kausalität in Messmodellen
38
7 Resümee
41
8 Literaturempfehlungen
41
Literaturverzeichnis
42
Teil II Grundlagen der Datenanalyse
46
3 Datengewinnung und Datenaufbereitung
47
1 Daten
47
2 Formen der Datenerhebung
49
2.1 Befragung
49
Persönlich-Mündliches Interview
53
Schriftliche Befragung
54
Telefonbefragung
56
Onlinebefragungen
57
Entscheidung für eine Befragungsform
60
2.2 Beobachtung
61
3 Stichprobenziehung
63
4 Datenaufbereitung
66
4.1 Transkription
66
4.2 Kodierung
66
4.3 Plausibilisierung
67
4.4 Gewichtung
68
4.5 Archivierung
68
5 Literaturempfehlungen
69
Literaturverzeichnis
69
4 Uni- und bivariate deskriptive Statistik
71
1 Univariate Statistik
71
1.1 Lagemaße
71
Arithmetische Mittel
71
Median (Zentralwert)
72
Modalwert
74
1.2 Streuungsmaße
74
Varianz, Standardabweichung und Variationskoeffizient
75
Spannweite, Quartilabstand und 5-Punkte-Zusammenfassung einer Verteilung
77
Index qualitativer Variation
78
1.3 Schiefe
78
2 Bivariate Statistik
79
2.1 Tabellenanalyse
81
Spalten-, Zeilen- und Gesamtprozente
81
Prozentuierung und statistische Unabhängigkeit
82
Prozentsatzdifferenz
83
Odds und Odds-Ratio
84
Nominalskalierte Maße: Cramérs V
85
Ordinalskalierte Merkmale
87
2.2 Metrische Merkmale: Kovarianz und Korrelation
91
3 Ausblick
94
4 Literaturempfehlungen
94
Literaturverzeichnis
94
5 Graphische Datenexploration
96
1 Einführung
96
2 Graphische Methoden für die Datenexploration
98
2.1 Einteilungskriterien für graphische Darstellungen
98
2.2 Univariate Analysen
99
Untersuchung der empirischen Häufigkeitsverteilung
99
Vergleich von Verteilungen
108
Die Darstellung von Zeitreihen
112
2.3 Bivariate Analysen
113
Das Anscombe-Quartett
114
Streudiagramm
115
2.4 Multivariate Analysen
117
3 Fehlervermeidung und Hinweise zum praktischen Vorgehen
119
4 Literaturempfehlungen
120
Anhang
120
Literaturverzeichnis
121
6 Der Umgang mit fehlenden Werten
122
1 Einführung in Techniken zur Kompensation fehlender Werte
122
1.1 Klassifikation fehlender Werte, Missingmechanismus und Ignorierbarkeit
122
1.2 Gewichtung
125
Schätzung der Responsewahrscheinlichkeiten
126
Gewichten oder nicht?
127
Ergänzungen
128
1.3 Multiple Imputation
129
Voraussetzungen
129
Erzeugung multipler Imputationen
130
Auswertung multipel imputierter Datensätze
132
Ergänzungen
133
2 Mathematisch-statistische Grundlagen
134
2.1 Klassifikation fehlender Werte, Missingmechanismus und Ignorierbarkeit
134
2.2 Gewichtung
135
2.3 Multiple Imputation
137
3 Beispiel: Einkommensgleichung mit fehlenden Werten
140
4 Häufige Fehler
144
5 Literaturempfehlungen
146
Literaturverzeichnis
147
7 Gewichtung
148
1 Einführung in das Verfahren
148
2 Mathematisch-statistische Grundlagen
150
2.1 Designgewichtung in komplexen Stichprobenerhebungen
152
Schichtung
153
Proportionale Aufteilung
154
Disproportionale Schichtung
154
Klumpenauswahl
155
Auswahl mit ungleichen Wahrscheinlichkeiten
156
2.2 Kombination von Anpassungs- und Designgewichtung
158
3 Gewichtung am Beispiel des ESS
163
4 Häufige Fehler
168
5 Literaturempfehlungen
168
Literaturverzeichnis
168
8 Grundlagen des statistischen Schließens
170
1 Einführung in die Fragestellung
170
2 Statistisches Schätzen
171
2.1 Eigenschaften von Schätzern
172
2.2 Intervallschätzung
175
3 Statistisches Testen
179
3.1 Hypothesentests über Konfidenzintervalle
179
3.2 Signifikanztests
180
3.3 Berücksichtigung der Trennschärfe von Tests
183
3.4 Wald-Tests, Score-Tests und Chiquadrat-Differenzen-Tests
185
4 Anwendungsfehler und Anwendungsprobleme
187
4.1 Fallzahlabhängigkeit
188
4.2 Spezifikation der statistischen Fragestellung
189
4.3 Fehlinterpretation von Ergebnissen statistischer Schlüsse
190
Interpretation von Konfidenzintervallen
190
Interpretation von Signifikanzen
190
Formulierung der Forschungshypothese als Alternativhypothese
191
Multiples Testen
191
Modell-Fitting
192
Stichprobenpläne als Quelle von Interpretationsfehlern
193
5 Literaturhinweise
193
Literaturverzeichnis
194
9 Einführung in die Inferenz durch den nichtparametrischen Bootstrap
195
1 Einführung in das Verfahren
195
2 Mathematisch-statistische Grundlagen
199
2.1 Standardfehler und Konfidenzintervall von ˆ?
199
Normale Approximationsmethode
200
Perzentil-Methode
200
Bias-corrected and accelerated Methode (BCa)
200
2.2 Besonderheiten bei der Anwendung des Bootstraps auf Umfragedaten
202
3 Ein Beispiel
203
3.1 Ermittlung des Standardfehlers und des Konfidenzintervalls mit Imputation
205
4 Häufige Fehler
206
5 Literaturempfehlungen
208
Literaturverzeichnis
208
10 Maximum-Likelihood Schätztheorie
209
1 Einführung in das Verfahren
210
2 Die Mechanik des Maximum-Likelihood Verfahrens
212
2.1 Das ML-Verfahren zur Bestimmung eines Parameters
213
2.2 Das ML-Verfahren zur Bestimmung mehrerer Parameter
218
3 Statistische Eigenschaften der ML-Schätzer
223
4 Inferenzstatistik und Modellanpassung
226
4.1 Test auf Signifikanz individueller Parameter
227
4.2 Test auf Signifikanz mehrerer Parameter
228
Likelihood Ratio Test
228
Wald-Test
229
Lagrange Multiplikatortest
230
4.3 Modellgüte
231
McFadden R2
232
Wald- und LM-basierte R2
233
AIC und BIC
234
5 Numerische Optimierungsverfahren
235
6 Literaturempfehlungen
237
Literaturverzeichnis
238
Teil III Messen und Skalieren
240
11 Reliabilität, Validität, Objektivität
241
1 Einführung
241
2 Objektivität
242
2.1 Durchführungsobjektivität
242
2.2 Auswertungsobjektivität
243
2.3 Interpretationsobjektivität
244
3 Reliabilität
244
3.1 Retest-Reliabilität
246
Beispiel zur Bestimmung der Retest-Reliabilität
247
3.2 Die Paralleltest-Reliabilität
247
3.3 Die Split-Half-Reliabilität
248
Beispiel zur Bestimmung der Split-Half-Reliabilität
249
3.4 Konsistenzanalysen
250
Beispiel zur Bestimmung der internen Konsistenz
250
3.5 Die Beurteilung der Höhe von Reliabilitätskoeffizienten
251
4 Validität
252
4.1 Die Inhaltsvalidität
252
4.2 Kriteriumsvalidität
253
4.3 Konstruktvalidität
255
Konstruktvalidierung mittels Dimensionalitätsüberprüfung (Prüfung auf formaleValidität)
255
Konstruktvalidierung mittels eines empirischen Vergleichs mit anderen, dasselbeKonstrukt messenden Instrumenten
256
Konstruktvalidierung mittels der Überprüfung des Zusammenhangs zwischen Selbstund Fremdurteil
257
5 Vorgehen zur Güteüberprüfung von Skalen
258
6 Häufige Fehler
259
7 Literaturempfehlungen
259
Literaturverzeichnis
260
12 Thurstone- und Likertskalierung
261
1 Einleitung
261
2 Thurstone Skalierung
262
2.1 Die Methode der Paarweisen Vergleiche (Law of Comparative Judgement, LCJ)
262
Grundlagen des Verfahrens
262
Vorgehensweise bei der Skalierung
264
Anwendungsbeispiel
266
2.2 Die Methode der gleich erscheinenden Intervalle
270
2.3 Die Methode der sukzessiven Intervalle (MSI)
272
Grundlagen des Verfahrens
272
Anwendungsbeispiel
273
2.4 Häufige Fehler bei der Thurstone Skalierung
277
3 Likertskalierung
277
3.1 Grundlagen des Verfahrens
277
3.2 Anwendungsbeispiel
279
3.3 Häufige Fehler bei der Likert Skalierung
282
4 Literaturempfehlungen
282
Literaturverzeichnis
282
13 Guttman- und Mokkenskalierung
284
1 Einleitung
284
2 Guttmanskalierung
286
2.1 Grundlagen des Verfahrens
286
Modellannahmen
288
Schätzung von Item- und Personenparametern
289
Stichprobenabhängigkeit der Schätzung von Item- und Personenparametern
290
Modellprüfung
291
2.2 Anwendungsbeispiel
297
2.3 Häufige Fehler bei der Guttmanskalierung
299
3 Mokkenskalierung
300
3.1 Grundlagen des Verfahrens
300
Modellprüfung
302
3.2 Anwendungsbeispiel
306
3.3 Häufige Fehler bei der Mokkenskalierung
308
4 Literaturempfehlungen
308
Literaturverzeichnis
309
14 Item-Response-Theorie
311
1 Einführung
312
2 Modelle für dichotome Items
313
2.1 Das Rasch-Modell
313
2.2 Das Birnbaum-Modell
316
2.3 Das Modell mit Rateparameter
317
3 Modelle für mehrstufig geordnete Items
318
3.1 Das ordinale Rasch-Modell (Partial-Credit-Modell)
318
3.2 Weitere IRT-Modelle für ordinale Items
320
4 Weitere IRT-Modelle
321
4.1 Mischverteilungs-IRT-Modelle: Das Mixed-Rasch-Modell
321
5 Modelltestung und Modellvergleiche
322
6 Beispielanwendung
324
6.1 Anwendung 1: Kompetenzmessung
324
6.2 Anwendung 2: Surveyforschung
326
7 Häufige Fehler
330
8 Literaturempfehlungen
331
Literaturverzeichnis
331
15 Hauptkomponentenanalyse und explorative Faktorenanalyse
333
1 Einführung in das Verfahren
333
1.1 Einsatzmöglichkeiten
333
1.2 Die Hauptkomponentenanalyse
336
Eine geometrische Perspektive
336
Die konkreten Schritte der PCA
340
Bestimmung der Komponentenzahl
341
Die unrotierte Lösung
343
Rotation
344
Berechnung von Komponentenwerten
347
1.3 Das Modell mehrerer gemeinsamer Faktoren: Faktorenanalyse im engeren Sinne
348
2 Mathematisch-statistische Grundlagen
350
3 Ein Anwendungsbeispiel: Vertrauen in Institutionen
354
4 Probleme und Erweiterungen
360
5 Literaturempfehlungen
363
Anhang
364
Literaturverzeichnis
364
16 Korrespondenzanalyse
366
1 Einleitung
366
2 Mathematisch-statistische Grundlagen
368
3 Ein Beispiel
370
3.1 Graphische Darstellung
370
3.2 Numerische Darstellung
373
4 Erweiterungen der Korrespondenzanalyse
376
4.1 Zusammengesetzte Tabellen
376
4.2 Multiple Korrespondenzanalyse
378
4.3 Aktive und passive Merkmale
382
4.4 Andere Datenformate
384
5 Häufige Fehler
385
6 Diskussion
386
7 Literaturempfehlungen
386
Literaturverzeichnis
387
17 Multidimensionale Skalierung
389
1 Einführung in die MDS
389
1.1 Die MDS als psychologisches Modell
390
1.2 Die MDS zur Exploration von Datenstrukturen
392
2 Mathematische Grundlagen der MDS
393
2.1 Güte einer MDS-Lösung
393
2.2 Bewertung des Stress
395
2.3 MDS-Modelle
397
2.4 MDS-Algorithmen
400
2.5 Konfirmatorische MDS
400
3 Häufige Fehler
403
3.1 Degenerierte Lösungen in der ordinalen MDS
403
3.2 Falsche Polung der Proximitäten
405
3.3 Fehlbewertung von Stress
406
3.4 Fehler beim Vergleich verschiedener MDS-Lösungen
407
3.5 Mechanische Interpretation „der“ Dimensionen
409
3.6 Behandlung störender Punkte
412
3.7 Überinterpretation von Dimensionsgewichten
413
4 Literaturempfehlungen
413
Anhang
414
Literaturverzeichnis
415
Teil IV Analyse von Häufigkeiten, Gruppen und Beziehungen
417
18 Analyse kategorialer Daten
418
1 Einführung in das Verfahren
418
2 Mathematisch-statistische Grundlagen
430
3 Ein Beispiel
440
4 Häufige Fehler
448
5 Literaturempfehlungen
450
Literaturverzeichnis
450
19 Varianz- und Kovarianzanalyse
452
1 Einführung in das Verfahren
452
1.1 Vergleich von zwei Gruppen
454
Modellgleichung
455
Hypothesen
455
Quadratsummen
456
Freiheitsgrade
457
Allgemeine Teststatistik
457
Annahmen
459
Exkurs: Mittlere Quadratsummen
460
1.2 Vergleich von mehr als zwei Gruppen: Die einfaktorielle Varianzanalyse
461
1.3 Mehrfaktorielle Varianzanalyse
462
Modellgleichung
462
Hypothesen
463
Quadratsummen
463
Freiheitsgrade
464
Teststatistik
465
Annahmen
465
1.4 Kovarianzanalyse
466
Modellgleichung
467
ANOVA versus ANCOVA
467
1.5 Effektstärke
468
1.6 Teststärke
471
2 Mathematisch-statistische Grundlagen
472
2.1 ANOVA und ANCOVA als Spezialfälle des ALM
473
2.2 Jenseits von ANOVA und ANCOVA: Kreative Modellierung im Rahmen des ALM
477
3 Ein Beispiel
480
3.1 Vergleich von zwei Gruppen
480
3.2 Vergleich von mehr als zwei Gruppen
481
3.3 Mehrfaktorielle ANOVA
482
3.4 Kovarianzanalyse
484
3.5 Annahmen der Varianz- und Kovarianzanalyse
484
3.6 Teststärke
488
4 Häufige Fehler – eine Checkliste
488
5 Literaturempfehlungen
489
Literaturverzeichnis
489
20 Diskriminanzanalyse
491
1 Einführung in das Verfahren
491
1.1 Zielsetzung und Anwendungsmöglichkeiten
491
1.2 Problemstellung und Prämissen
493
1.3 Arten der Diskriminanzanalyse und ihre Abgrenzung gegenüber anderen multivariaten Verfahren
495
1.4 Vorgehensweise
497
Festlegung des Untersuchungsdesigns
497
Extraktion der Diskriminanzfunktion(en)
498
Evaluation der Diskriminanzfunktion(en)
500
Merkmalsselektion und Klassifikation neuer Objekte
502
2 Mathematisch-statistische Grundlagen
503
2.1 Ermittlung der Diskriminanzfunktion (en)
503
2.2 Prüfkriterien der Diskriminanz
507
2.3 Klassifikationskonzepte
508
Distanzkonzept
509
Wahrscheinlichkeitskonzept
510
Konzept der Klassifikationsfunktionen nach Fisher
510
3 Anwendungsbeispiel
511
4 Häufige Fehler
515
5 Literaturempfehlungen
517
Literaturverzeichnis
518
21 Clusteranalyse
520
1 Einführung in das Verfahren
520
1.1 Was ist Clusteranalyse und was sind überhaupt Cluster?
521
1.2 Clusterstruktur
522
1.3 Algorithmen
522
1.4 Variablenräume
523
1.5 Agglomerative Verfahren
524
Ähnlichkeitsmaß, Distanz und Index
524
Fusionswerte und Dendrogramme
525
1.6 Wahl der Metriken und Agglomerationsverfahren
526
1.7 K-Means (Clusterzentrenanalyse)
527
1.8 TwoStep-Clusteranalyse
529
2 Mathematisch-statistische Grundlagen
530
2.1 Hierarchisch-agglomerative Verfahren
530
Ähnlichkeitsmaße und Distanzen
530
Gewichtung und Standardisierung von Variablen
532
Erweiterung der Abstandsmaße auf Abstände zwischen Aggregaten
532
Dendrogramm und Ultrametrik
533
2.2 K-Means
534
2.3 TwoStep-Verfahren
534
Die beiden Stufen der Clusterung
534
Anzahl der Cluster
535
Tabellen und Graphiken zur Beschreibung der Cluster
536
3 Beispiel
536
3.1 Daten- und Variablenauswahl
536
3.2 Analyse
537
3.3 Verbesserung der Clusterlösung
540
Variablenauswahl
540
Eliminieren von „Ausreißern“
540
Optimierung der Lösung durch eine K-Means-Analyse
541
3.4 Überprüfen der Clusterlösung
542
3.5 TwoStep-Clusteranalyse
543
4 Häufige Fehler
545
5 Literaturempfehlungen
546
Literaturverzeichnis
547
22 Analyse latenter Klassen
548
1 Einführung in das Verfahren
548
2 Mathematisch-statistische Grundlagen
550
2.1 Modellansatz
550
2.2 Parameterschätzung
551
2.3 Computerprogramme
553
3 Ein Beispiel
555
3.1 Daten
555
3.2 Zahl der latenten Klassen
555
3.3 Lokale Unabhängigkeit
559
3.4 Inhaltliche Interpretierbarkeit
560
3.5 Stabilität
562
3.6 Formale Validitätsprüfung durch Validitätsindizes
564
3.7 Kriterienbezogene Validitätsprüfung
564
4 Häufige Fehler
566
5 Alternativen
567
6 Literaturempfehlungen
568
Literaturverzeichnis
569
23 Netzwerkanalyse
570
1 Einführung
570
2 Darstellung der Verfahren
575
2.1 Konzepte zur Beschreibung der Netzstruktur in Dyaden und Triaden
576
Dyaden
577
Triaden
578
Triadische Umgebungen einzelner Knoten
579
2.2 „Positionen“: Die Klassierung von Knoten aufgrund ähnlicher Muster ihrer strukturellen Einbettung
582
2.3 Teilgruppen: Die Identifikation von Teilnetzen intern eng bzw. stark verbundener Knoten
586
Cliquen und Clans
587
k-Plexe und k-Cores
588
Zusammenhangs-Komponenten
588
Modifikation der Teilgruppenkonzepte für gerichtete Beziehungen
589
3 Ein Beispiel
589
3.1 Daten
589
3.2 Zielsetzungen
591
3.3 Erstellung des Datensatzes
592
4 Literaturempfehlungen
596
Literaturverzeichnis
597
Teil V Regressionsverfahren für Querschnittsdaten
599
24 Lineare Regressionsanalyse
600
1 Einführung
600
2 Mathematisch-statistische Grundlagen
605
2.1 Das allgemeine Modell
605
2.2 Die Identifikation der Regressionskoeffizienten
606
2.3 Annahmen der Kleinst-Quadrat-Methode
608
2.4 Die Bestimmung der Modellgüte
610
2.5 Die statistische Absicherung der Regressionsergebnisse
612
2.6 Die Interpretation der Regressionskoeffizienten
616
2.7 Standardisierte Regressionskoeffizienten und ihre Probleme
618
3 Ein Beispiel
621
3.1 Zur Operationalisierung
621
3.2 Ergebnisse
622
4 Häufige Fehler
628
5 Literaturhinweise
630
Literaturverzeichnis
630
25 Lineare Regression: Modellannahmen und Regressionsdiagnostik
632
1 Einführung
632
1.1 Lineares Regressionsmodell: Systematischer Teil, Störgrößen und Residuen
633
1.2 Regressionsdiagnostik: ein erster Einblick
635
2 Mathematisch-statistische Grundlagen
638
2.1 Annahmen der linearen Regressionsanalyse
638
2.2 Grundlagen und Instrumente der Regressionsdiagnostik
645
Stichprobenresiduen und „Leverage“-Werte als Bausteine der Regressionsdiagnostik
645
Diagnostik zu den Annahmen des klassischen linearen Regressionsmodells
646
Diagnostik zu potenziell einflussreichen Untersuchungseinheiten
652
3 Regressionsdiagnostik am Beispiel
655
3.1 Datengrundlage und Regressionsmodell
655
3.2 Regressionsdiagnostik zu den Annahmen des linearen Regressionsmodells am Beispiel
656
3.3 Regressionsdiagnostik zu einflussreichen Beobachtungen am Beispiel
661
4 Regressionsdiagnostik: Umfang, Probleme und Empfehlungen
665
5 Literaturempfehlungen
666
Anhang
667
Literaturverzeichnis
667
26 Nicht-Linearität und Nicht-Additivität in der multiplen Regression: Interaktionseffekte, Polynome und Splines
669
1 Einführung
669
2 Interaktionseffekte, Polynome und Splines
670
2.1 Nicht-Additivität: Interaktionseffekte
670
2.2 Nichtberücksichtigung von Interaktionen als Fehlspezifikation
673
2.3 Nicht-Linearität: Polynome und Splines
674
2.4 Polynome
675
2.5 Splines
677
3 Tests auf Gruppenunterschiede und Nicht-Linearität
681
4 Anwendungsbeispiel I: Interaktionseffekte
683
5 Anwendungsbeispiel II: Polynome und Slopes
689
6 Häufige Fehler
696
7 Literaturempfehlungen
697
Literaturverzeichnis
697
27 Robuste Regression
699
1 Einführung in das Verfahren
699
2 Mathematisch-statistische Grundlagen
709
2.1 Der Kleinste-Quadrate-Schätzer
709
2.2 Grundlegende Konzepte zur Bewertung robuster Schätzer
710
Erwartungstreue, Konsistenz und Effizienz
710
Relative Effizienz
711
Einfluss-Funktion, Bruchpunkt und maximale Verzerrung
712
Zusammenfassung
713
2.3 M-Schätzer
713
Berechnung von M-Schätzern
717
Bruchpunkt von M-Schätzern
719
Bounded-Influence-Schätzer
719
2.4 High-Breakdown-Schätzer
720
LMS- und LTS-Schätzer
720
S-Schätzer
721
MM-Schätzer
722
3 Ein Beispiel
723
4 Literaturempfehlungen
729
Literaturverzeichnis
730
28 Mehrebenenanalyse mit Querschnittsdaten
733
1 Einführung in das Verfahren
733
2 Mathematisch-statistische Grundlagen
741
2.1 Die Modellklassen der Mehrebenenanalyse
743
Das Random-Intercept-Only-Modell (R-I-O-M)
743
Das Random-Intercept-Modell (R-I-M)
744
Random-Intercept-Random-Slope-Modell (R-I-R-S-M)
744
Das Intercept-as-Outcome-Modell (I-as-O-M)
745
Das Random-Coefficient-Modell (R-C-M)
746
2.2 Beurteilung der Anpassung des Mehrebenenmodells
747
2.3 Zentrierung metrischer Prädiktoren und ihre Bedeutung für die Interpretation
749
Grand-Mean-Zentrierung
749
Group-Mean-Zentrierung
750
2.4 Standardisierung der kontextspezifischen und Populationsschätzer
752
2.5 Besonderheiten des Erhebungsdesigns
754
3 Ein Beispiel – Die deutsche PISA 2006 Studie
755
4 Häufige Fehler
763
5 Literaturempfehlungen
764
Literaturverzeichnis
765
29 Strukturgleichungsmodelle
767
1 Einführung in das Verfahren
767
1.1 Ausgangspunkt: Regressions- und Pfadmodell
768
1.2 Das Messmodell: Die Diffenzierung zwischen manifesten und latenten Variablen
769
1.3 Die konfirmatorische Faktorenanalyse: Die simultane Prüfung mehrerer Messmodelle
771
1.4 Das allgemeine Strukturgleichungsmodell
773
Modellevaluation
775
Modellvergleich
776
Modellsparsamkeit
777
1.5 Spezielle Modellvarianten
778
Modelle für mehrere Gruppen (Multiple Gruppenvergleiche)
778
Längsschnittmodelle
778
Modelle mit Interaktionstermen
778
Die Behandlung fehlender Werte
779
2 Mathematisch-statistische Grundlagen
779
2.1 Ableitung der Elemente der Kovarianzmatrix ?
779
2.2 Schätzung der Parameter
780
3 Ein Beispiel
783
3.1 Messung der latenten Konstrukte
785
3.2 Messmodell der latenten endogenen Variablen
785
3.3 Messmodell der latenten exogenen Variablen
785
3.4 Überprüfung der Messmodelle
786
3.5 Intervenierende Variablen
788
3.6 Strukturgleichungsmodell
788
4 Häufige Fehler
790
5 Literaturempfehlungen
792
Anhang
793
Literaturverzeichnis
794
30 Regression mit unbekannten Subpopulationen
797
1 Einführung in das Verfahren
797
2 Mathematisch-statistische Grundlagen
799
2.1 Spezifikation
800
2.2 Schätzung
805
2.3 Test auf die Anzahl der Komponenten
807
2.4 Anpassungsindizes
808
3 Ein Beispiel
808
4 Häufige Fehler
816
5 Literaturempfehlungen
816
Literaturverzeichnis
817
31 Logistische Regression
818
1 Einführung in das Verfahren
818
1.1 Das lineare Wahrscheinlichkeitsmodell
819
1.2 Die logistische Regression
820
1.3 Interpretation der Koeffizienten
822
2 Mathematisch-statistische Grundlagen
825
2.1 Herleitung als nichtlineares Modell mit latenter abhängiger Variable
825
Logit-Regression
825
Probit-Regression
827
2.2 Schätzung
827
2.3 Vergleich von Koeffizienten und unbeobachtete Heterogenität
828
Standardisierte Koeffizienten
829
Durchschnittliche marginale Effekte
830
2.4 Interaktionseffekte
831
2.5 Statistische Inferenz
833
2.6 Goodness of fit und Modellvergleich
834
3 Ein Beispiel
835
4 Häufige Fehler
843
5 Literaturempfehlungen
844
Literaturverzeichnis
845
32 Multinomiale und ordinale Regression
846
1 Einführung in das Verfahren
846
1.1 Von der binären zur multinomialen logistischen Regression
847
1.2 Wahrscheinlichkeiten, Odds und Logits
848
1.3 Modellschätzung und statistische Tests
852
Besteht ein Zusammenhang?
853
Wie stark ist ein Zusammenhang?
853
Wie stark sind die relativen Effekte der erklärenden Variablen?
854
1.4 Logistische Regression bei einer ordinalen abhängigen Variablen
855
1.5 Interpretation des Modells der kumulierten Logits als vorgelagertes Schwellenwertmodell in einer linearen Regression
857
2 Mathematisch-Statistische Grundlagen
859
2.1 Schätzung
859
2.2 Statistische Inferenz
860
2.3 Modellanpassung
861
2.4 Weiterführendes zu Regressionskoeffizienten
862
Standardisierte Koeffizienten im ordinalen Regressionsmodell
862
Umrechnen der Referenzkategorie im multinomialen Regressionsmodell
862
3 Anwendungsbeispiel
863
3.1 Einfluss der Bildungsabschlüsse von Vater und Mutter auf die Bildung der Befragten in der multinomialen logistischen Regression
863
3.2 Bildungsabschluss im ordinalen Logitmodell
870
4 Häufige Fehler
873
5 Literaturempfehlungen
877
Literaturverzeichnis
877
33 Regression für Zählvariablen
878
1 Einführung in das Verfahren
878
1.1 Poisson und negative Binomialverteilung
879
1.2 Regressionsmodellierung
880
Strukturkomponente
880
Strukturkomponente: lineare und nichtlineare Prädiktoren
881
Verteilungskomponente
883
Inferenz
883
2 Mathematisch-statistische Grundlagen
884
2.1 Poissonmodell
884
Maximum-Likelihood-Schätzung
884
Parameter-Tests
885
Devianz und Anpassungstests
887
2.2 Quasi-Poissonmodell
888
2.3 Modell der negativen Binomialverteilung
889
3 Ein Beispiel
889
4 Häufige Fehler
893
5 Literaturempfehlungen
894
Literaturverzeichnis
894
34 Graphische Darstellung regressionsanalytischer Ergebnisse
896
1 Einführung in das Verfahren
896
2 Grundlagen der graphischen Darstellung
897
3 Beispiele
900
3.1 Streudiagramm- bzw. Scatterplot-Matrix
900
3.2 Median- und Mean-Regression
902
3.3 Lineare Regression: Graphische Darstellung der Koeffizienten
903
3.4 Lineare Regression: Die Darstellung vorhergesagter Werte (Conditional-Effect-Plots)
905
3.5 Logistische Regression: Conditional-Effect-Plots
908
3.6 Multinomiale Regression: Odds Ratio-Plots, Discrete-Change und Conditional-Effect-Plots
911
4 Häufige Fehler
915
5 Rückblick
916
6 Literaturempfehlungen
917
Literaturverzeichnis
918
Teil VI Analyse von zeitbezogenen Daten
919
35 Nichtparametrische Schätzung kausaler Effekte mittels Matchingverfahren
920
1 Einführung in das Verfahren
920
1.1 Grundannahmen kausaler Inferenz in Matchingverfahren
921
1.2 Treatmenteffekte als Schätzgrößen der empirischen Analyse
924
1.3 Durchführung der empirischen Analyse
925
1.4 Varianten von Matchingverfahren bei Vorliegen unterschiedlicher Datenstrukturen
930
2 Mathematisch-statistische Grundlagen
931
3 Ein Anwendungsbeispiel: der Einkommenseffekt eines Arbeitsplatzverlustes
937
3.1 Zuweisungsmodell
938
3.2 Matching und Balancierungstests
940
3.3 Parameterschätzung
944
4 Häufige Fehler
947
5 Literaturempfehlungen
949
Literaturverzeichnis
949
36 Kausalanalyse mit Paneldaten
951
1 Einführung in die Paneldatenanalyse
951
1.1 Kontrafaktische Kausalanalyse und Paneldaten
952
1.2 Eine intuitive Einführung in Panelregressionsmodelle
954
1.3 Ein didaktisches Beispiel
956
2 Eine präzisere Einführung in die Panelregression
959
2.1 Das Fehlerkomponenten-Modell
960
2.2 Die Schätzverfahren
960
2.3 RE- oder FE-Modell?
963
2.4 Ein Hybrid-Modell
964
2.5 Panel-robuste Standardfehler
965
3 Ein Beispiel: Der Effekt der Heirat auf die Zufriedenheit
966
3.1 Datenaufbereitung
966
3.2 Schätzergebnisse
968
3.3 Ein Modell mit Periodeneffekten
970
3.4 Ein Hybrid-Modell
971
3.5 Ein Wachstumskurven-Modell
972
4 Nicht-lineare FE-Modelle
973
4.1 Nicht-lineare Panelregressionsmodelle
974
4.2 Das FE-Logit Modell
974
4.3 FE-Modelle für Ereignisdaten
976
5 Häufige Fehler
978
5.1 Suboptimale Panelregressionsmodelle
978
5.2 Grenzen von FE-Modellen
979
6 Literaturempfehlungen
981
Literaturverzeichnis
981
37 Survival- und Ereignisanalyse
983
1 Einführung in das Verfahren
983
1.1 Spezifische Problemstellungen
984
1.2 Erhebung von Ereignisdaten
986
1.3 Zensierung von Beobachtungen
987
2 Theoretische Modelle, mathematisch-statistische Grundlagen und Notation
988
2.1 Verschiedene Ratenmodelle und ihre Schätzung
991
Sterbetafelmethode und Kaplan-Meier-Schätzung
991
Das Exponentialmodell
992
Das Cox-Modell
992
Das Piecewise-Constant-Modell
993
Parametrische Modelle der Zeitabhängigkeit
994
2.2 Ein Beispiel
994
3 Modellierung von parallelen und interdependenten Prozessen
996
3.1 Ursachen und zeitabhängige Kovariablen
997
3.2 Zeit und kausale Wirkungen
998
3.3 Zeitachse und Ereignisse
998
3.4 Zeitfolge, Zeitintervalle und scheinbare Gleichzeitigkeit
998
3.5 Zeitliche Form der Entfaltung von Wirkungen
999
3.6 Das Prinzip der konditionalen Unabhängigkeit
999
3.7 Ein Anwendungsbeispiel
1000
4 Häufige Fehler
1001
5 Literaturempfehlungen
1002
Literaturverzeichnis
1003
38 Latente Wachstumskurvenmodelle
1005
1 Einführung in das Verfahren
1005
2 Mathematisch-statistische Grundlagen
1009
3 Beispiel: Entwicklung von Lebenszufriedenheit nach Arbeitsplatzverlust
1012
4 Häufige Fehler
1014
5 Literaturempfehlungen
1016
Literaturverzeichnis
1016
39 Sequenzdatenanalyse
1018
1 Einführung in die Sequenzdatenanalyse
1018
1.1 Was ist Sequenzdatenanalyse?
1019
1.2 Grundlegende Konzepte
1020
2 Mathematisch-statistische Grundlagen: Algorithmen zur Distanzberechnung
1024
2.1 Der Optimal Matching Algorithmus
1024
2.2 Der zweite Schritt: Die Weiterverarbeitung der Distanzen
1026
2.3 Die Diskussion um OM und neuere Entwicklungen
1026
3 Beispiel: Der Arbeitsmarkteintritt westdeutscher Männer und Frauen
1028
3.1 Datenaufbereitung
1028
3.2 Datenauswertung
1030
4 Häufige Fehler
1035
5 Literaturempfehlungen
1037
Literaturverzeichnis
1037
40 Zeitreihenanalyse
1039
1 Einführung
1039
2 Deskription und statistisches Modell
1041
3 Stochastische Prozesse
1042
4 Nichtstationäre (stochastische) Prozesse
1047
5 Tests auf „Random Walk“
1049
6 Zerlegung von Zeitreihen
1053
7 Interventionsanalyse
1059
8 Ausreißer-Analyse
1061
9 Transferfunktions-Modelle
1064
10 Vektorielle stochastische Prozesse
1068
11 Schluss
1073
12 Literaturempfehlungen
1074
Literaturverzeichnis
1074
Anhang
1077
Autorenverzeichnis
1078
Alle Preise verstehen sich inklusive der gesetzlichen MwSt.