pfeil_rechts

Suchen und Finden

Service

Handbuch der sozialwissenschaftlichen Datenanalyse

von: Christof Wolf, Henning Best

VS Verlag für Sozialwissenschaften (GWV), 2011

ISBN: 9783531920382 , 1083 Seiten

Format: PDF, OL

Kopierschutz: DRM

Online-Lesen für: Windows PC,Mac OSX,Linux

Preis: 129,99 EUR

Mehr zum Inhalt

Handbuch der sozialwissenschaftlichen Datenanalyse

Vorwort: 5
Inhaltsverzeichnis: 6
Teil I Einführung: 10
1 Einführung: Sozialwissenschaftliche Datenanalyse: 11
1 Moderne Sozialwissenschaft und die Bedeutung der Statistik: 11
2 Ziele und Zielgruppe des Handbuchs: 12
3 Themenauswahl: 13
4 Gliederung und Inhal: 14
5 Ausblick: 14
Literaturverzeichnis: 15
2 Kausalität als Gegenstand der Sozialwissenschaften und der multivariaten Statistik: 16
1 Einführung: 16
2 Was heißt Kausalität?: 17
2.1 Zeitliche Reihenfolge von Ereignissen als grundlegende Bedingung für Kausalität: 18
2.2 Kausalität als „innerer Zusammenhang“ von Ereignissen: 18
2.3 Die Veränderung von Ereignissen nach der Manipulierung anderer Ereignisse: Die Kontroll-Definition von Kausalität: 18
2.4 Kausalität als „Mechanismus“: 19
2.5 Die kontrafaktische Definition von Kausalität: Was wäre wenn?: 19
2.6 Exkurs: Die Logik der Erklärung: 20
2.7 Ursachen als Anfangsbedingungen oder als Wenn-Komponente von Gesetzen: Die Gesetzes-Definition von Kausalität: 21
2.8 Zum Vergleich der Kausalitäts-Definitionen: 23
3 Kausalität in sozialwissenschaftlichen Experimenten: 24
4 Kausalität in multivariaten Analyseverfahren: Das Beispiel der Regression: 27
4.1 Enthalten Kausalmodelle Kausalaussagen?: 27
4.2 Regressionsanalyse und kausale Schlüsse: 28
4.3 Kausalität in anderen multivariaten Verfahren: 33
4.4 Gibt es Algorithmen für die Ermittlung von Kausalität?: 34
5 Einzelfallanalysen, historische Daten und die Prüfung von Kausalaussagen: 36
6 Kausalität in Messmodellen: 38
7 Resümee: 41
8 Literaturempfehlungen: 41
Literaturverzeichnis: 42
Teil II Grundlagen der Datenanalyse: 46
3 Datengewinnung und Datenaufbereitung: 47
1 Daten: 47
2 Formen der Datenerhebung: 49
2.1 Befragung: 49
Persönlich-Mündliches Interview: 53
Schriftliche Befragung: 54
Telefonbefragung: 56
Onlinebefragungen: 57
Entscheidung für eine Befragungsform: 60
2.2 Beobachtung: 61
3 Stichprobenziehung: 63
4 Datenaufbereitung: 66
4.1 Transkription: 66
4.2 Kodierung: 66
4.3 Plausibilisierung: 67
4.4 Gewichtung: 68
4.5 Archivierung: 68
5 Literaturempfehlungen: 69
Literaturverzeichnis: 69
4 Uni- und bivariate deskriptive Statistik: 71
1 Univariate Statistik: 71
1.1 Lagemaße: 71
Arithmetische Mittel: 71
Median (Zentralwert): 72
Modalwert: 74
1.2 Streuungsmaße: 74
Varianz, Standardabweichung und Variationskoeffizient: 75
Spannweite, Quartilabstand und 5-Punkte-Zusammenfassung einer Verteilung: 77
Index qualitativer Variation: 78
1.3 Schiefe: 78
2 Bivariate Statistik: 79
2.1 Tabellenanalyse: 81
Spalten-, Zeilen- und Gesamtprozente: 81
Prozentuierung und statistische Unabhängigkeit: 82
Prozentsatzdifferenz: 83
Odds und Odds-Ratio: 84
Nominalskalierte Maße: Cramérs V: 85
Ordinalskalierte Merkmale: 87
2.2 Metrische Merkmale: Kovarianz und Korrelation: 91
3 Ausblick: 94
4 Literaturempfehlungen: 94
Literaturverzeichnis: 94
5 Graphische Datenexploration: 96
1 Einführung: 96
2 Graphische Methoden für die Datenexploration: 98
2.1 Einteilungskriterien für graphische Darstellungen: 98
2.2 Univariate Analysen: 99
Untersuchung der empirischen Häufigkeitsverteilung: 99
Vergleich von Verteilungen: 108
Die Darstellung von Zeitreihen: 112
2.3 Bivariate Analysen: 113
Das Anscombe-Quartett: 114
Streudiagramm: 115
2.4 Multivariate Analysen: 117
3 Fehlervermeidung und Hinweise zum praktischen Vorgehen: 119
4 Literaturempfehlungen: 120
Anhang: 120
Literaturverzeichnis: 121
6 Der Umgang mit fehlenden Werten: 122
1 Einführung in Techniken zur Kompensation fehlender Werte: 122
1.1 Klassifikation fehlender Werte, Missingmechanismus und Ignorierbarkeit: 122
1.2 Gewichtung: 125
Schätzung der Responsewahrscheinlichkeiten: 126
Gewichten oder nicht?: 127
Ergänzungen: 128
1.3 Multiple Imputation: 129
Voraussetzungen: 129
Erzeugung multipler Imputationen: 130
Auswertung multipel imputierter Datensätze: 132
Ergänzungen: 133
2 Mathematisch-statistische Grundlagen: 134
2.1 Klassifikation fehlender Werte, Missingmechanismus und Ignorierbarkeit: 134
2.2 Gewichtung: 135
2.3 Multiple Imputation: 137
3 Beispiel: Einkommensgleichung mit fehlenden Werten: 140
4 Häufige Fehler: 144
5 Literaturempfehlungen: 146
Literaturverzeichnis: 147
7 Gewichtung: 148
1 Einführung in das Verfahren: 148
2 Mathematisch-statistische Grundlagen: 150
2.1 Designgewichtung in komplexen Stichprobenerhebungen: 152
Schichtung: 153
Proportionale Aufteilung: 154
Disproportionale Schichtung: 154
Klumpenauswahl: 155
Auswahl mit ungleichen Wahrscheinlichkeiten: 156
2.2 Kombination von Anpassungs- und Designgewichtung: 158
3 Gewichtung am Beispiel des ESS: 163
4 Häufige Fehler: 168
5 Literaturempfehlungen: 168
Literaturverzeichnis: 168
8 Grundlagen des statistischen Schließens: 170
1 Einführung in die Fragestellung: 170
2 Statistisches Schätzen: 171
2.1 Eigenschaften von Schätzern: 172
2.2 Intervallschätzung: 175
3 Statistisches Testen: 179
3.1 Hypothesentests über Konfidenzintervalle: 179
3.2 Signifikanztests: 180
3.3 Berücksichtigung der Trennschärfe von Tests: 183
3.4 Wald-Tests, Score-Tests und Chiquadrat-Differenzen-Tests: 185
4 Anwendungsfehler und Anwendungsprobleme: 187
4.1 Fallzahlabhängigkeit: 188
4.2 Spezifikation der statistischen Fragestellung: 189
4.3 Fehlinterpretation von Ergebnissen statistischer Schlüsse: 190
Interpretation von Konfidenzintervallen: 190
Interpretation von Signifikanzen: 190
Formulierung der Forschungshypothese als Alternativhypothese: 191
Multiples Testen: 191
Modell-Fitting: 192
Stichprobenpläne als Quelle von Interpretationsfehlern: 193
5 Literaturhinweise: 193
Literaturverzeichnis: 194
9 Einführung in die Inferenz durch den nichtparametrischen Bootstrap: 195
1 Einführung in das Verfahren: 195
2 Mathematisch-statistische Grundlagen: 199
2.1 Standardfehler und Konfidenzintervall von ˆ?: 199
Normale Approximationsmethode: 200
Perzentil-Methode: 200
Bias-corrected and accelerated Methode (BCa): 200
2.2 Besonderheiten bei der Anwendung des Bootstraps auf Umfragedaten: 202
3 Ein Beispiel: 203
3.1 Ermittlung des Standardfehlers und des Konfidenzintervalls mit Imputation: 205
4 Häufige Fehler: 206
5 Literaturempfehlungen: 208
Literaturverzeichnis: 208
10 Maximum-Likelihood Schätztheorie: 209
1 Einführung in das Verfahren: 210
2 Die Mechanik des Maximum-Likelihood Verfahrens: 212
2.1 Das ML-Verfahren zur Bestimmung eines Parameters: 213
2.2 Das ML-Verfahren zur Bestimmung mehrerer Parameter: 218
3 Statistische Eigenschaften der ML-Schätzer: 223
4 Inferenzstatistik und Modellanpassung: 226
4.1 Test auf Signifikanz individueller Parameter: 227
4.2 Test auf Signifikanz mehrerer Parameter: 228
Likelihood Ratio Test: 228
Wald-Test: 229
Lagrange Multiplikatortest: 230
4.3 Modellgüte: 231
McFadden R2: 232
Wald- und LM-basierte R2: 233
AIC und BIC: 234
5 Numerische Optimierungsverfahren: 235
6 Literaturempfehlungen: 237
Literaturverzeichnis: 238
Teil III Messen und Skalieren: 240
11 Reliabilität, Validität, Objektivität: 241
1 Einführung: 241
2 Objektivität: 242
2.1 Durchführungsobjektivität: 242
2.2 Auswertungsobjektivität: 243
2.3 Interpretationsobjektivität: 244
3 Reliabilität: 244
3.1 Retest-Reliabilität: 246
Beispiel zur Bestimmung der Retest-Reliabilität: 247
3.2 Die Paralleltest-Reliabilität: 247
3.3 Die Split-Half-Reliabilität: 248
Beispiel zur Bestimmung der Split-Half-Reliabilität: 249
3.4 Konsistenzanalysen: 250
Beispiel zur Bestimmung der internen Konsistenz: 250
3.5 Die Beurteilung der Höhe von Reliabilitätskoeffizienten: 251
4 Validität: 252
4.1 Die Inhaltsvalidität: 252
4.2 Kriteriumsvalidität: 253
4.3 Konstruktvalidität: 255
Konstruktvalidierung mittels Dimensionalitätsüberprüfung (Prüfung auf formaleValidität): 255
Konstruktvalidierung mittels eines empirischen Vergleichs mit anderen, dasselbeKonstrukt messenden Instrumenten: 256
Konstruktvalidierung mittels der Überprüfung des Zusammenhangs zwischen Selbstund Fremdurteil: 257
5 Vorgehen zur Güteüberprüfung von Skalen: 258
6 Häufige Fehler: 259
7 Literaturempfehlungen: 259
Literaturverzeichnis: 260
12 Thurstone- und Likertskalierung: 261
1 Einleitung: 261
2 Thurstone Skalierung: 262
2.1 Die Methode der Paarweisen Vergleiche (Law of Comparative Judgement, LCJ): 262
Grundlagen des Verfahrens: 262
Vorgehensweise bei der Skalierung: 264
Anwendungsbeispiel: 266
2.2 Die Methode der gleich erscheinenden Intervalle: 270
2.3 Die Methode der sukzessiven Intervalle (MSI): 272
Grundlagen des Verfahrens: 272
Anwendungsbeispiel: 273
2.4 Häufige Fehler bei der Thurstone Skalierung: 277
3 Likertskalierung: 277
3.1 Grundlagen des Verfahrens: 277
3.2 Anwendungsbeispiel: 279
3.3 Häufige Fehler bei der Likert Skalierung: 282
4 Literaturempfehlungen: 282
Literaturverzeichnis: 282
13 Guttman- und Mokkenskalierung: 284
1 Einleitung: 284
2 Guttmanskalierung: 286
2.1 Grundlagen des Verfahrens: 286
Modellannahmen: 288
Schätzung von Item- und Personenparametern: 289
Stichprobenabhängigkeit der Schätzung von Item- und Personenparametern: 290
Modellprüfung: 291
2.2 Anwendungsbeispiel: 297
2.3 Häufige Fehler bei der Guttmanskalierung: 299
3 Mokkenskalierung: 300
3.1 Grundlagen des Verfahrens: 300
Modellprüfung: 302
3.2 Anwendungsbeispiel: 306
3.3 Häufige Fehler bei der Mokkenskalierung: 308
4 Literaturempfehlungen: 308
Literaturverzeichnis: 309
14 Item-Response-Theorie: 311
1 Einführung: 312
2 Modelle für dichotome Items: 313
2.1 Das Rasch-Modell: 313
2.2 Das Birnbaum-Modell: 316
2.3 Das Modell mit Rateparameter: 317
3 Modelle für mehrstufig geordnete Items: 318
3.1 Das ordinale Rasch-Modell (Partial-Credit-Modell): 318
3.2 Weitere IRT-Modelle für ordinale Items: 320
4 Weitere IRT-Modelle: 321
4.1 Mischverteilungs-IRT-Modelle: Das Mixed-Rasch-Modell: 321
5 Modelltestung und Modellvergleiche: 322
6 Beispielanwendung: 324
6.1 Anwendung 1: Kompetenzmessung: 324
6.2 Anwendung 2: Surveyforschung: 326
7 Häufige Fehler: 330
8 Literaturempfehlungen: 331
Literaturverzeichnis: 331
15 Hauptkomponentenanalyse und explorative Faktorenanalyse: 333
1 Einführung in das Verfahren: 333
1.1 Einsatzmöglichkeiten: 333
1.2 Die Hauptkomponentenanalyse: 336
Eine geometrische Perspektive: 336
Die konkreten Schritte der PCA: 340
Bestimmung der Komponentenzahl: 341
Die unrotierte Lösung: 343
Rotation: 344
Berechnung von Komponentenwerten: 347
1.3 Das Modell mehrerer gemeinsamer Faktoren: Faktorenanalyse im engeren Sinne: 348
2 Mathematisch-statistische Grundlagen: 350
3 Ein Anwendungsbeispiel: Vertrauen in Institutionen: 354
4 Probleme und Erweiterungen: 360
5 Literaturempfehlungen: 363
Anhang: 364
Literaturverzeichnis: 364
16 Korrespondenzanalyse: 366
1 Einleitung: 366
2 Mathematisch-statistische Grundlagen: 368
3 Ein Beispiel: 370
3.1 Graphische Darstellung: 370
3.2 Numerische Darstellung: 373
4 Erweiterungen der Korrespondenzanalyse: 376
4.1 Zusammengesetzte Tabellen: 376
4.2 Multiple Korrespondenzanalyse: 378
4.3 Aktive und passive Merkmale: 382
4.4 Andere Datenformate: 384
5 Häufige Fehler: 385
6 Diskussion: 386
7 Literaturempfehlungen: 386
Literaturverzeichnis: 387
17 Multidimensionale Skalierung: 389
1 Einführung in die MDS: 389
1.1 Die MDS als psychologisches Modell: 390
1.2 Die MDS zur Exploration von Datenstrukturen: 392
2 Mathematische Grundlagen der MDS: 393
2.1 Güte einer MDS-Lösung: 393
2.2 Bewertung des Stress: 395
2.3 MDS-Modelle: 397
2.4 MDS-Algorithmen: 400
2.5 Konfirmatorische MDS: 400
3 Häufige Fehler: 403
3.1 Degenerierte Lösungen in der ordinalen MDS: 403
3.2 Falsche Polung der Proximitäten: 405
3.3 Fehlbewertung von Stress: 406
3.4 Fehler beim Vergleich verschiedener MDS-Lösungen: 407
3.5 Mechanische Interpretation „der“ Dimensionen: 409
3.6 Behandlung störender Punkte: 412
3.7 Überinterpretation von Dimensionsgewichten: 413
4 Literaturempfehlungen: 413
Anhang: 414
Literaturverzeichnis: 415
Teil IV Analyse von Häufigkeiten, Gruppen und Beziehungen: 417
18 Analyse kategorialer Daten: 418
1 Einführung in das Verfahren: 418
2 Mathematisch-statistische Grundlagen: 430
3 Ein Beispiel: 440
4 Häufige Fehler: 448
5 Literaturempfehlungen: 450
Literaturverzeichnis: 450
19 Varianz- und Kovarianzanalyse: 452
1 Einführung in das Verfahren: 452
1.1 Vergleich von zwei Gruppen: 454
Modellgleichung: 455
Hypothesen: 455
Quadratsummen: 456
Freiheitsgrade: 457
Allgemeine Teststatistik: 457
Annahmen: 459
Exkurs: Mittlere Quadratsummen: 460
1.2 Vergleich von mehr als zwei Gruppen: Die einfaktorielle Varianzanalyse: 461
1.3 Mehrfaktorielle Varianzanalyse: 462
Modellgleichung: 462
Hypothesen: 463
Quadratsummen: 463
Freiheitsgrade: 464
Teststatistik: 465
Annahmen: 465
1.4 Kovarianzanalyse: 466
Modellgleichung: 467
ANOVA versus ANCOVA: 467
1.5 Effektstärke: 468
1.6 Teststärke: 471
2 Mathematisch-statistische Grundlagen: 472
2.1 ANOVA und ANCOVA als Spezialfälle des ALM: 473
2.2 Jenseits von ANOVA und ANCOVA: Kreative Modellierung im Rahmen des ALM: 477
3 Ein Beispiel: 480
3.1 Vergleich von zwei Gruppen: 480
3.2 Vergleich von mehr als zwei Gruppen: 481
3.3 Mehrfaktorielle ANOVA: 482
3.4 Kovarianzanalyse: 484
3.5 Annahmen der Varianz- und Kovarianzanalyse: 484
3.6 Teststärke: 488
4 Häufige Fehler – eine Checkliste: 488
5 Literaturempfehlungen: 489
Literaturverzeichnis: 489
20 Diskriminanzanalyse: 491
1 Einführung in das Verfahren: 491
1.1 Zielsetzung und Anwendungsmöglichkeiten: 491
1.2 Problemstellung und Prämissen: 493
1.3 Arten der Diskriminanzanalyse und ihre Abgrenzung gegenüber anderen multivariaten Verfahren: 495
1.4 Vorgehensweise: 497
Festlegung des Untersuchungsdesigns: 497
Extraktion der Diskriminanzfunktion(en): 498
Evaluation der Diskriminanzfunktion(en): 500
Merkmalsselektion und Klassifikation neuer Objekte: 502
2 Mathematisch-statistische Grundlagen: 503
2.1 Ermittlung der Diskriminanzfunktion (en): 503
2.2 Prüfkriterien der Diskriminanz: 507
2.3 Klassifikationskonzepte: 508
Distanzkonzept: 509
Wahrscheinlichkeitskonzept: 510
Konzept der Klassifikationsfunktionen nach Fisher: 510
3 Anwendungsbeispiel: 511
4 Häufige Fehler: 515
5 Literaturempfehlungen: 517
Literaturverzeichnis: 518
21 Clusteranalyse: 520
1 Einführung in das Verfahren: 520
1.1 Was ist Clusteranalyse und was sind überhaupt Cluster?: 521
1.2 Clusterstruktur: 522
1.3 Algorithmen: 522
1.4 Variablenräume: 523
1.5 Agglomerative Verfahren: 524
Ähnlichkeitsmaß, Distanz und Index: 524
Fusionswerte und Dendrogramme: 525
1.6 Wahl der Metriken und Agglomerationsverfahren: 526
1.7 K-Means (Clusterzentrenanalyse): 527
1.8 TwoStep-Clusteranalyse: 529
2 Mathematisch-statistische Grundlagen: 530
2.1 Hierarchisch-agglomerative Verfahren: 530
Ähnlichkeitsmaße und Distanzen: 530
Gewichtung und Standardisierung von Variablen: 532
Erweiterung der Abstandsmaße auf Abstände zwischen Aggregaten: 532
Dendrogramm und Ultrametrik: 533
2.2 K-Means: 534
2.3 TwoStep-Verfahren: 534
Die beiden Stufen der Clusterung: 534
Anzahl der Cluster: 535
Tabellen und Graphiken zur Beschreibung der Cluster: 536
3 Beispiel: 536
3.1 Daten- und Variablenauswahl: 536
3.2 Analyse: 537
3.3 Verbesserung der Clusterlösung: 540
Variablenauswahl: 540
Eliminieren von „Ausreißern“: 540
Optimierung der Lösung durch eine K-Means-Analyse: 541
3.4 Überprüfen der Clusterlösung: 542
3.5 TwoStep-Clusteranalyse: 543
4 Häufige Fehler: 545
5 Literaturempfehlungen: 546
Literaturverzeichnis: 547
22 Analyse latenter Klassen: 548
1 Einführung in das Verfahren: 548
2 Mathematisch-statistische Grundlagen: 550
2.1 Modellansatz: 550
2.2 Parameterschätzung: 551
2.3 Computerprogramme: 553
3 Ein Beispiel: 555
3.1 Daten: 555
3.2 Zahl der latenten Klassen: 555
3.3 Lokale Unabhängigkeit: 559
3.4 Inhaltliche Interpretierbarkeit: 560
3.5 Stabilität: 562
3.6 Formale Validitätsprüfung durch Validitätsindizes: 564
3.7 Kriterienbezogene Validitätsprüfung: 564
4 Häufige Fehler: 566
5 Alternativen: 567
6 Literaturempfehlungen: 568
Literaturverzeichnis: 569
23 Netzwerkanalyse: 570
1 Einführung: 570
2 Darstellung der Verfahren: 575
2.1 Konzepte zur Beschreibung der Netzstruktur in Dyaden und Triaden: 576
Dyaden: 577
Triaden: 578
Triadische Umgebungen einzelner Knoten: 579
2.2 „Positionen“: Die Klassierung von Knoten aufgrund ähnlicher Muster ihrer strukturellen Einbettung: 582
2.3 Teilgruppen: Die Identifikation von Teilnetzen intern eng bzw. stark verbundener Knoten: 586
Cliquen und Clans: 587
k-Plexe und k-Cores: 588
Zusammenhangs-Komponenten: 588
Modifikation der Teilgruppenkonzepte für gerichtete Beziehungen: 589
3 Ein Beispiel: 589
3.1 Daten: 589
3.2 Zielsetzungen: 591
3.3 Erstellung des Datensatzes: 592
4 Literaturempfehlungen: 596
Literaturverzeichnis: 597
Teil V Regressionsverfahren für Querschnittsdaten: 599
24 Lineare Regressionsanalyse: 600
1 Einführung: 600
2 Mathematisch-statistische Grundlagen: 605
2.1 Das allgemeine Modell: 605
2.2 Die Identifikation der Regressionskoeffizienten: 606
2.3 Annahmen der Kleinst-Quadrat-Methode: 608
2.4 Die Bestimmung der Modellgüte: 610
2.5 Die statistische Absicherung der Regressionsergebnisse: 612
2.6 Die Interpretation der Regressionskoeffizienten: 616
2.7 Standardisierte Regressionskoeffizienten und ihre Probleme: 618
3 Ein Beispiel: 621
3.1 Zur Operationalisierung: 621
3.2 Ergebnisse: 622
4 Häufige Fehler: 628
5 Literaturhinweise: 630
Literaturverzeichnis: 630
25 Lineare Regression: Modellannahmen und Regressionsdiagnostik: 632
1 Einführung: 632
1.1 Lineares Regressionsmodell: Systematischer Teil, Störgrößen und Residuen: 633
1.2 Regressionsdiagnostik: ein erster Einblick: 635
2 Mathematisch-statistische Grundlagen: 638
2.1 Annahmen der linearen Regressionsanalyse: 638
2.2 Grundlagen und Instrumente der Regressionsdiagnostik: 645
Stichprobenresiduen und „Leverage“-Werte als Bausteine der Regressionsdiagnostik: 645
Diagnostik zu den Annahmen des klassischen linearen Regressionsmodells: 646
Diagnostik zu potenziell einflussreichen Untersuchungseinheiten: 652
3 Regressionsdiagnostik am Beispiel: 655
3.1 Datengrundlage und Regressionsmodell: 655
3.2 Regressionsdiagnostik zu den Annahmen des linearen Regressionsmodells am Beispiel: 656
3.3 Regressionsdiagnostik zu einflussreichen Beobachtungen am Beispiel: 661
4 Regressionsdiagnostik: Umfang, Probleme und Empfehlungen: 665
5 Literaturempfehlungen: 666
Anhang: 667
Literaturverzeichnis: 667
26 Nicht-Linearität und Nicht-Additivität in der multiplen Regression: Interaktionseffekte, Polynome und Splines: 669
1 Einführung: 669
2 Interaktionseffekte, Polynome und Splines: 670
2.1 Nicht-Additivität: Interaktionseffekte: 670
2.2 Nichtberücksichtigung von Interaktionen als Fehlspezifikation: 673
2.3 Nicht-Linearität: Polynome und Splines: 674
2.4 Polynome: 675
2.5 Splines: 677
3 Tests auf Gruppenunterschiede und Nicht-Linearität: 681
4 Anwendungsbeispiel I: Interaktionseffekte: 683
5 Anwendungsbeispiel II: Polynome und Slopes: 689
6 Häufige Fehler: 696
7 Literaturempfehlungen: 697
Literaturverzeichnis: 697
27 Robuste Regression: 699
1 Einführung in das Verfahren: 699
2 Mathematisch-statistische Grundlagen: 709
2.1 Der Kleinste-Quadrate-Schätzer: 709
2.2 Grundlegende Konzepte zur Bewertung robuster Schätzer: 710
Erwartungstreue, Konsistenz und Effizienz: 710
Relative Effizienz: 711
Einfluss-Funktion, Bruchpunkt und maximale Verzerrung: 712
Zusammenfassung: 713
2.3 M-Schätzer: 713
Berechnung von M-Schätzern: 717
Bruchpunkt von M-Schätzern: 719
Bounded-Influence-Schätzer: 719
2.4 High-Breakdown-Schätzer: 720
LMS- und LTS-Schätzer: 720
S-Schätzer: 721
MM-Schätzer: 722
3 Ein Beispiel: 723
4 Literaturempfehlungen: 729
Literaturverzeichnis: 730
28 Mehrebenenanalyse mit Querschnittsdaten: 733
1 Einführung in das Verfahren: 733
2 Mathematisch-statistische Grundlagen: 741
2.1 Die Modellklassen der Mehrebenenanalyse: 743
Das Random-Intercept-Only-Modell (R-I-O-M): 743
Das Random-Intercept-Modell (R-I-M): 744
Random-Intercept-Random-Slope-Modell (R-I-R-S-M): 744
Das Intercept-as-Outcome-Modell (I-as-O-M): 745
Das Random-Coefficient-Modell (R-C-M): 746
2.2 Beurteilung der Anpassung des Mehrebenenmodells: 747
2.3 Zentrierung metrischer Prädiktoren und ihre Bedeutung für die Interpretation: 749
Grand-Mean-Zentrierung: 749
Group-Mean-Zentrierung: 750
2.4 Standardisierung der kontextspezifischen und Populationsschätzer: 752
2.5 Besonderheiten des Erhebungsdesigns: 754
3 Ein Beispiel – Die deutsche PISA 2006 Studie: 755
4 Häufige Fehler: 763
5 Literaturempfehlungen: 764
Literaturverzeichnis: 765
29 Strukturgleichungsmodelle: 767
1 Einführung in das Verfahren: 767
1.1 Ausgangspunkt: Regressions- und Pfadmodell: 768
1.2 Das Messmodell: Die Diffenzierung zwischen manifesten und latenten Variablen: 769
1.3 Die konfirmatorische Faktorenanalyse: Die simultane Prüfung mehrerer Messmodelle: 771
1.4 Das allgemeine Strukturgleichungsmodell: 773
Modellevaluation: 775
Modellvergleich: 776
Modellsparsamkeit: 777
1.5 Spezielle Modellvarianten: 778
Modelle für mehrere Gruppen (Multiple Gruppenvergleiche): 778
Längsschnittmodelle: 778
Modelle mit Interaktionstermen: 778
Die Behandlung fehlender Werte: 779
2 Mathematisch-statistische Grundlagen: 779
2.1 Ableitung der Elemente der Kovarianzmatrix ?: 779
2.2 Schätzung der Parameter: 780
3 Ein Beispiel: 783
3.1 Messung der latenten Konstrukte: 785
3.2 Messmodell der latenten endogenen Variablen: 785
3.3 Messmodell der latenten exogenen Variablen: 785
3.4 Überprüfung der Messmodelle: 786
3.5 Intervenierende Variablen: 788
3.6 Strukturgleichungsmodell: 788
4 Häufige Fehler: 790
5 Literaturempfehlungen: 792
Anhang: 793
Literaturverzeichnis: 794
30 Regression mit unbekannten Subpopulationen: 797
1 Einführung in das Verfahren: 797
2 Mathematisch-statistische Grundlagen: 799
2.1 Spezifikation: 800
2.2 Schätzung: 805
2.3 Test auf die Anzahl der Komponenten: 807
2.4 Anpassungsindizes: 808
3 Ein Beispiel: 808
4 Häufige Fehler: 816
5 Literaturempfehlungen: 816
Literaturverzeichnis: 817
31 Logistische Regression: 818
1 Einführung in das Verfahren: 818
1.1 Das lineare Wahrscheinlichkeitsmodell: 819
1.2 Die logistische Regression: 820
1.3 Interpretation der Koeffizienten: 822
2 Mathematisch-statistische Grundlagen: 825
2.1 Herleitung als nichtlineares Modell mit latenter abhängiger Variable: 825
Logit-Regression: 825
Probit-Regression: 827
2.2 Schätzung: 827
2.3 Vergleich von Koeffizienten und unbeobachtete Heterogenität: 828
Standardisierte Koeffizienten: 829
Durchschnittliche marginale Effekte: 830
2.4 Interaktionseffekte: 831
2.5 Statistische Inferenz: 833
2.6 Goodness of fit und Modellvergleich: 834
3 Ein Beispiel: 835
4 Häufige Fehler: 843
5 Literaturempfehlungen: 844
Literaturverzeichnis: 845
32 Multinomiale und ordinale Regression: 846
1 Einführung in das Verfahren: 846
1.1 Von der binären zur multinomialen logistischen Regression: 847
1.2 Wahrscheinlichkeiten, Odds und Logits: 848
1.3 Modellschätzung und statistische Tests: 852
Besteht ein Zusammenhang?: 853
Wie stark ist ein Zusammenhang?: 853
Wie stark sind die relativen Effekte der erklärenden Variablen?: 854
1.4 Logistische Regression bei einer ordinalen abhängigen Variablen: 855
1.5 Interpretation des Modells der kumulierten Logits als vorgelagertes Schwellenwertmodell in einer linearen Regression: 857
2 Mathematisch-Statistische Grundlagen: 859
2.1 Schätzung: 859
2.2 Statistische Inferenz: 860
2.3 Modellanpassung: 861
2.4 Weiterführendes zu Regressionskoeffizienten: 862
Standardisierte Koeffizienten im ordinalen Regressionsmodell: 862
Umrechnen der Referenzkategorie im multinomialen Regressionsmodell: 862
3 Anwendungsbeispiel: 863
3.1 Einfluss der Bildungsabschlüsse von Vater und Mutter auf die Bildung der Befragten in der multinomialen logistischen Regression: 863
3.2 Bildungsabschluss im ordinalen Logitmodell: 870
4 Häufige Fehler: 873
5 Literaturempfehlungen: 877
Literaturverzeichnis: 877
33 Regression für Zählvariablen: 878
1 Einführung in das Verfahren: 878
1.1 Poisson und negative Binomialverteilung: 879
1.2 Regressionsmodellierung: 880
Strukturkomponente: 880
Strukturkomponente: lineare und nichtlineare Prädiktoren: 881
Verteilungskomponente: 883
Inferenz: 883
2 Mathematisch-statistische Grundlagen: 884
2.1 Poissonmodell: 884
Maximum-Likelihood-Schätzung: 884
Parameter-Tests: 885
Devianz und Anpassungstests: 887
2.2 Quasi-Poissonmodell: 888
2.3 Modell der negativen Binomialverteilung: 889
3 Ein Beispiel: 889
4 Häufige Fehler: 893
5 Literaturempfehlungen: 894
Literaturverzeichnis: 894
34 Graphische Darstellung regressionsanalytischer Ergebnisse: 896
1 Einführung in das Verfahren: 896
2 Grundlagen der graphischen Darstellung: 897
3 Beispiele: 900
3.1 Streudiagramm- bzw. Scatterplot-Matrix: 900
3.2 Median- und Mean-Regression: 902
3.3 Lineare Regression: Graphische Darstellung der Koeffizienten: 903
3.4 Lineare Regression: Die Darstellung vorhergesagter Werte (Conditional-Effect-Plots): 905
3.5 Logistische Regression: Conditional-Effect-Plots: 908
3.6 Multinomiale Regression: Odds Ratio-Plots, Discrete-Change und Conditional-Effect-Plots: 911
4 Häufige Fehler: 915
5 Rückblick: 916
6 Literaturempfehlungen: 917
Literaturverzeichnis: 918
Teil VI Analyse von zeitbezogenen Daten: 919
35 Nichtparametrische Schätzung kausaler Effekte mittels Matchingverfahren: 920
1 Einführung in das Verfahren: 920
1.1 Grundannahmen kausaler Inferenz in Matchingverfahren: 921
1.2 Treatmenteffekte als Schätzgrößen der empirischen Analyse: 924
1.3 Durchführung der empirischen Analyse: 925
1.4 Varianten von Matchingverfahren bei Vorliegen unterschiedlicher Datenstrukturen: 930
2 Mathematisch-statistische Grundlagen: 931
3 Ein Anwendungsbeispiel: der Einkommenseffekt eines Arbeitsplatzverlustes: 937
3.1 Zuweisungsmodell: 938
3.2 Matching und Balancierungstests: 940
3.3 Parameterschätzung: 944
4 Häufige Fehler: 947
5 Literaturempfehlungen: 949
Literaturverzeichnis: 949
36 Kausalanalyse mit Paneldaten: 951
1 Einführung in die Paneldatenanalyse: 951
1.1 Kontrafaktische Kausalanalyse und Paneldaten: 952
1.2 Eine intuitive Einführung in Panelregressionsmodelle: 954
1.3 Ein didaktisches Beispiel: 956
2 Eine präzisere Einführung in die Panelregression: 959
2.1 Das Fehlerkomponenten-Modell: 960
2.2 Die Schätzverfahren: 960
2.3 RE- oder FE-Modell?: 963
2.4 Ein Hybrid-Modell: 964
2.5 Panel-robuste Standardfehler: 965
3 Ein Beispiel: Der Effekt der Heirat auf die Zufriedenheit: 966
3.1 Datenaufbereitung: 966
3.2 Schätzergebnisse: 968
3.3 Ein Modell mit Periodeneffekten: 970
3.4 Ein Hybrid-Modell: 971
3.5 Ein Wachstumskurven-Modell: 972
4 Nicht-lineare FE-Modelle: 973
4.1 Nicht-lineare Panelregressionsmodelle: 974
4.2 Das FE-Logit Modell: 974
4.3 FE-Modelle für Ereignisdaten: 976
5 Häufige Fehler: 978
5.1 Suboptimale Panelregressionsmodelle: 978
5.2 Grenzen von FE-Modellen: 979
6 Literaturempfehlungen: 981
Literaturverzeichnis: 981
37 Survival- und Ereignisanalyse: 983
1 Einführung in das Verfahren: 983
1.1 Spezifische Problemstellungen: 984
1.2 Erhebung von Ereignisdaten: 986
1.3 Zensierung von Beobachtungen: 987
2 Theoretische Modelle, mathematisch-statistische Grundlagen und Notation: 988
2.1 Verschiedene Ratenmodelle und ihre Schätzung: 991
Sterbetafelmethode und Kaplan-Meier-Schätzung: 991
Das Exponentialmodell: 992
Das Cox-Modell: 992
Das Piecewise-Constant-Modell: 993
Parametrische Modelle der Zeitabhängigkeit: 994
2.2 Ein Beispiel: 994
3 Modellierung von parallelen und interdependenten Prozessen: 996
3.1 Ursachen und zeitabhängige Kovariablen: 997
3.2 Zeit und kausale Wirkungen: 998
3.3 Zeitachse und Ereignisse: 998
3.4 Zeitfolge, Zeitintervalle und scheinbare Gleichzeitigkeit: 998
3.5 Zeitliche Form der Entfaltung von Wirkungen: 999
3.6 Das Prinzip der konditionalen Unabhängigkeit: 999
3.7 Ein Anwendungsbeispiel: 1000
4 Häufige Fehler: 1001
5 Literaturempfehlungen: 1002
Literaturverzeichnis: 1003
38 Latente Wachstumskurvenmodelle: 1005
1 Einführung in das Verfahren: 1005
2 Mathematisch-statistische Grundlagen: 1009
3 Beispiel: Entwicklung von Lebenszufriedenheit nach Arbeitsplatzverlust: 1012
4 Häufige Fehler: 1014
5 Literaturempfehlungen: 1016
Literaturverzeichnis: 1016
39 Sequenzdatenanalyse: 1018
1 Einführung in die Sequenzdatenanalyse: 1018
1.1 Was ist Sequenzdatenanalyse?: 1019
1.2 Grundlegende Konzepte: 1020
2 Mathematisch-statistische Grundlagen: Algorithmen zur Distanzberechnung: 1024
2.1 Der Optimal Matching Algorithmus: 1024
2.2 Der zweite Schritt: Die Weiterverarbeitung der Distanzen: 1026
2.3 Die Diskussion um OM und neuere Entwicklungen: 1026
3 Beispiel: Der Arbeitsmarkteintritt westdeutscher Männer und Frauen: 1028
3.1 Datenaufbereitung: 1028
3.2 Datenauswertung: 1030
4 Häufige Fehler: 1035
5 Literaturempfehlungen: 1037
Literaturverzeichnis: 1037
40 Zeitreihenanalyse: 1039
1 Einführung: 1039
2 Deskription und statistisches Modell: 1041
3 Stochastische Prozesse: 1042
4 Nichtstationäre (stochastische) Prozesse: 1047
5 Tests auf „Random Walk“: 1049
6 Zerlegung von Zeitreihen: 1053
7 Interventionsanalyse: 1059
8 Ausreißer-Analyse: 1061
9 Transferfunktions-Modelle: 1064
10 Vektorielle stochastische Prozesse: 1068
11 Schluss: 1073
12 Literaturempfehlungen: 1074
Literaturverzeichnis: 1074
Anhang: 1077
Autorenverzeichnis: 1078

AGB
Datenschutz
Impressum
Kontakt
F.A.Q
Widerruf

Alle Preise verstehen sich inklusive der gesetzlichen MwSt.

Handbuch der sozialwissenschaftlichen Datenanalyse

von: Christof Wolf, Henning Best

Handbuch der sozialwissenschaftlichen Datenanalyse

Vorwort

Inhaltsverzeichnis

Teil I Einführung

1 Einführung: Sozialwissenschaftliche Datenanalyse

1 Moderne Sozialwissenschaft und die Bedeutung der Statistik

2 Ziele und Zielgruppe des Handbuchs

3 Themenauswahl

4 Gliederung und Inhal

5 Ausblick

Literaturverzeichnis

2 Kausalität als Gegenstand der Sozialwissenschaften und der multivariaten Statistik

1 Einführung

2 Was heißt Kausalität?

2.1 Zeitliche Reihenfolge von Ereignissen als grundlegende Bedingung für Kausalität

2.2 Kausalität als „innerer Zusammenhang“ von Ereignissen

2.3 Die Veränderung von Ereignissen nach der Manipulierung anderer Ereignisse: Die Kontroll-Definition von Kausalität

2.4 Kausalität als „Mechanismus“

2.5 Die kontrafaktische Definition von Kausalität: Was wäre wenn?

2.6 Exkurs: Die Logik der Erklärung

2.7 Ursachen als Anfangsbedingungen oder als Wenn-Komponente von Gesetzen: Die Gesetzes-Definition von Kausalität

2.8 Zum Vergleich der Kausalitäts-Definitionen

3 Kausalität in sozialwissenschaftlichen Experimenten

4 Kausalität in multivariaten Analyseverfahren: Das Beispiel der Regression

4.1 Enthalten Kausalmodelle Kausalaussagen?

4.2 Regressionsanalyse und kausale Schlüsse

4.3 Kausalität in anderen multivariaten Verfahren

4.4 Gibt es Algorithmen für die Ermittlung von Kausalität?

5 Einzelfallanalysen, historische Daten und die Prüfung von Kausalaussagen

6 Kausalität in Messmodellen

7 Resümee

8 Literaturempfehlungen

Literaturverzeichnis

Teil II Grundlagen der Datenanalyse

3 Datengewinnung und Datenaufbereitung

1 Daten

2 Formen der Datenerhebung

2.1 Befragung

Persönlich-Mündliches Interview

Schriftliche Befragung

Telefonbefragung

Onlinebefragungen

Entscheidung für eine Befragungsform

2.2 Beobachtung

3 Stichprobenziehung

4 Datenaufbereitung

4.1 Transkription

4.2 Kodierung

4.3 Plausibilisierung

4.4 Gewichtung

4.5 Archivierung

5 Literaturempfehlungen

Literaturverzeichnis

4 Uni- und bivariate deskriptive Statistik

1 Univariate Statistik

1.1 Lagemaße

Arithmetische Mittel

Median (Zentralwert)

Modalwert

1.2 Streuungsmaße

Varianz, Standardabweichung und Variationskoeffizient

Spannweite, Quartilabstand und 5-Punkte-Zusammenfassung einer Verteilung

Index qualitativer Variation

1.3 Schiefe

2 Bivariate Statistik

2.1 Tabellenanalyse

Spalten-, Zeilen- und Gesamtprozente

Prozentuierung und statistische Unabhängigkeit

Prozentsatzdifferenz

Odds und Odds-Ratio

Nominalskalierte Maße: Cramérs V

Ordinalskalierte Merkmale

2.2 Metrische Merkmale: Kovarianz und Korrelation

3 Ausblick

4 Literaturempfehlungen

Literaturverzeichnis

5 Graphische Datenexploration

1 Einführung