Handbuch der sozialwissenschaftlichen Datenanalyse

von: Christof Wolf, Henning Best

VS Verlag für Sozialwissenschaften (GWV), 2011

ISBN: 9783531920382 , 1083 Seiten

Format: PDF, OL

Kopierschutz: DRM

Windows PC,Mac OSX für alle DRM-fähigen eReader Apple iPad, Android Tablet PC's Online-Lesen für: Windows PC,Mac OSX,Linux

Preis: 129,99 EUR

  • Kooperation als gelebte Praxis - Steuerungshandeln in Sozialraumteams der Kinder- und Jugendhilfe
    Nachhaltige Gesellschaft - Welche Rolle für Partizipation und Kooperation?
    Kinderschutz in gemeinsamer Verantwortung von Jugendhilfe und Schule
    Jugendhilfeforschung - Kontroversen - Transformationen - Adressierungen
    Jahrbuch Jugendforschung - 10. Ausgabe 2010
    Islamfeindlichkeit - Wenn die Grenzen der Kritik verschwimmen
  • Evolution der Informationsgesellschaft - Markenkommunikation im Spannungsfeld der neuen Medien
    Securitainment - Medien als Akteure der Inneren Sicherheit
    Werbung statt Waffen - Wie Strategische Außenkommunikation die Außenpolitik verändert
    Journalistik und Journalismen im Wandel - Eine kommunikationswissenschaftliche Perspektive
    StudiVZ - Diffusion, Nutzung und Wirkung eines sozialen Netzwerks im Internet
    'Richtige' Kinder - Von heimlichen und folgenlosen Vaterschaftstests
 

Mehr zum Inhalt

Handbuch der sozialwissenschaftlichen Datenanalyse


 

Vorwort

5

Inhaltsverzeichnis

6

Teil I Einführung

10

1 Einführung: Sozialwissenschaftliche Datenanalyse

11

1 Moderne Sozialwissenschaft und die Bedeutung der Statistik

11

2 Ziele und Zielgruppe des Handbuchs

12

3 Themenauswahl

13

4 Gliederung und Inhal

14

5 Ausblick

14

Literaturverzeichnis

15

2 Kausalität als Gegenstand der Sozialwissenschaften und der multivariaten Statistik

16

1 Einführung

16

2 Was heißt Kausalität?

17

2.1 Zeitliche Reihenfolge von Ereignissen als grundlegende Bedingung für Kausalität

18

2.2 Kausalität als „innerer Zusammenhang“ von Ereignissen

18

2.3 Die Veränderung von Ereignissen nach der Manipulierung anderer Ereignisse: Die Kontroll-Definition von Kausalität

18

2.4 Kausalität als „Mechanismus“

19

2.5 Die kontrafaktische Definition von Kausalität: Was wäre wenn?

19

2.6 Exkurs: Die Logik der Erklärung

20

2.7 Ursachen als Anfangsbedingungen oder als Wenn-Komponente von Gesetzen: Die Gesetzes-Definition von Kausalität

21

2.8 Zum Vergleich der Kausalitäts-Definitionen

23

3 Kausalität in sozialwissenschaftlichen Experimenten

24

4 Kausalität in multivariaten Analyseverfahren: Das Beispiel der Regression

27

4.1 Enthalten Kausalmodelle Kausalaussagen?

27

4.2 Regressionsanalyse und kausale Schlüsse

28

4.3 Kausalität in anderen multivariaten Verfahren

33

4.4 Gibt es Algorithmen für die Ermittlung von Kausalität?

34

5 Einzelfallanalysen, historische Daten und die Prüfung von Kausalaussagen

36

6 Kausalität in Messmodellen

38

7 Resümee

41

8 Literaturempfehlungen

41

Literaturverzeichnis

42

Teil II Grundlagen der Datenanalyse

46

3 Datengewinnung und Datenaufbereitung

47

1 Daten

47

2 Formen der Datenerhebung

49

2.1 Befragung

49

Persönlich-Mündliches Interview

53

Schriftliche Befragung

54

Telefonbefragung

56

Onlinebefragungen

57

Entscheidung für eine Befragungsform

60

2.2 Beobachtung

61

3 Stichprobenziehung

63

4 Datenaufbereitung

66

4.1 Transkription

66

4.2 Kodierung

66

4.3 Plausibilisierung

67

4.4 Gewichtung

68

4.5 Archivierung

68

5 Literaturempfehlungen

69

Literaturverzeichnis

69

4 Uni- und bivariate deskriptive Statistik

71

1 Univariate Statistik

71

1.1 Lagemaße

71

Arithmetische Mittel

71

Median (Zentralwert)

72

Modalwert

74

1.2 Streuungsmaße

74

Varianz, Standardabweichung und Variationskoeffizient

75

Spannweite, Quartilabstand und 5-Punkte-Zusammenfassung einer Verteilung

77

Index qualitativer Variation

78

1.3 Schiefe

78

2 Bivariate Statistik

79

2.1 Tabellenanalyse

81

Spalten-, Zeilen- und Gesamtprozente

81

Prozentuierung und statistische Unabhängigkeit

82

Prozentsatzdifferenz

83

Odds und Odds-Ratio

84

Nominalskalierte Maße: Cramérs V

85

Ordinalskalierte Merkmale

87

2.2 Metrische Merkmale: Kovarianz und Korrelation

91

3 Ausblick

94

4 Literaturempfehlungen

94

Literaturverzeichnis

94

5 Graphische Datenexploration

96

1 Einführung

96

2 Graphische Methoden für die Datenexploration

98

2.1 Einteilungskriterien für graphische Darstellungen

98

2.2 Univariate Analysen

99

Untersuchung der empirischen Häufigkeitsverteilung

99

Vergleich von Verteilungen

108

Die Darstellung von Zeitreihen

112

2.3 Bivariate Analysen

113

Das Anscombe-Quartett

114

Streudiagramm

115

2.4 Multivariate Analysen

117

3 Fehlervermeidung und Hinweise zum praktischen Vorgehen

119

4 Literaturempfehlungen

120

Anhang

120

Literaturverzeichnis

121

6 Der Umgang mit fehlenden Werten

122

1 Einführung in Techniken zur Kompensation fehlender Werte

122

1.1 Klassifikation fehlender Werte, Missingmechanismus und Ignorierbarkeit

122

1.2 Gewichtung

125

Schätzung der Responsewahrscheinlichkeiten

126

Gewichten oder nicht?

127

Ergänzungen

128

1.3 Multiple Imputation

129

Voraussetzungen

129

Erzeugung multipler Imputationen

130

Auswertung multipel imputierter Datensätze

132

Ergänzungen

133

2 Mathematisch-statistische Grundlagen

134

2.1 Klassifikation fehlender Werte, Missingmechanismus und Ignorierbarkeit

134

2.2 Gewichtung

135

2.3 Multiple Imputation

137

3 Beispiel: Einkommensgleichung mit fehlenden Werten

140

4 Häufige Fehler

144

5 Literaturempfehlungen

146

Literaturverzeichnis

147

7 Gewichtung

148

1 Einführung in das Verfahren

148

2 Mathematisch-statistische Grundlagen

150

2.1 Designgewichtung in komplexen Stichprobenerhebungen

152

Schichtung

153

Proportionale Aufteilung

154

Disproportionale Schichtung

154

Klumpenauswahl

155

Auswahl mit ungleichen Wahrscheinlichkeiten

156

2.2 Kombination von Anpassungs- und Designgewichtung

158

3 Gewichtung am Beispiel des ESS

163

4 Häufige Fehler

168

5 Literaturempfehlungen

168

Literaturverzeichnis

168

8 Grundlagen des statistischen Schließens

170

1 Einführung in die Fragestellung

170

2 Statistisches Schätzen

171

2.1 Eigenschaften von Schätzern

172

2.2 Intervallschätzung

175

3 Statistisches Testen

179

3.1 Hypothesentests über Konfidenzintervalle

179

3.2 Signifikanztests

180

3.3 Berücksichtigung der Trennschärfe von Tests

183

3.4 Wald-Tests, Score-Tests und Chiquadrat-Differenzen-Tests

185

4 Anwendungsfehler und Anwendungsprobleme

187

4.1 Fallzahlabhängigkeit

188

4.2 Spezifikation der statistischen Fragestellung

189

4.3 Fehlinterpretation von Ergebnissen statistischer Schlüsse

190

Interpretation von Konfidenzintervallen

190

Interpretation von Signifikanzen

190

Formulierung der Forschungshypothese als Alternativhypothese

191

Multiples Testen

191

Modell-Fitting

192

Stichprobenpläne als Quelle von Interpretationsfehlern

193

5 Literaturhinweise

193

Literaturverzeichnis

194

9 Einführung in die Inferenz durch den nichtparametrischen Bootstrap

195

1 Einführung in das Verfahren

195

2 Mathematisch-statistische Grundlagen

199

2.1 Standardfehler und Konfidenzintervall von ˆ?

199

Normale Approximationsmethode

200

Perzentil-Methode

200

Bias-corrected and accelerated Methode (BCa)

200

2.2 Besonderheiten bei der Anwendung des Bootstraps auf Umfragedaten

202

3 Ein Beispiel

203

3.1 Ermittlung des Standardfehlers und des Konfidenzintervalls mit Imputation

205

4 Häufige Fehler

206

5 Literaturempfehlungen

208

Literaturverzeichnis

208

10 Maximum-Likelihood Schätztheorie

209

1 Einführung in das Verfahren

210

2 Die Mechanik des Maximum-Likelihood Verfahrens

212

2.1 Das ML-Verfahren zur Bestimmung eines Parameters

213

2.2 Das ML-Verfahren zur Bestimmung mehrerer Parameter

218

3 Statistische Eigenschaften der ML-Schätzer

223

4 Inferenzstatistik und Modellanpassung

226

4.1 Test auf Signifikanz individueller Parameter

227

4.2 Test auf Signifikanz mehrerer Parameter

228

Likelihood Ratio Test

228

Wald-Test

229

Lagrange Multiplikatortest

230

4.3 Modellgüte

231

McFadden R2

232

Wald- und LM-basierte R2

233

AIC und BIC

234

5 Numerische Optimierungsverfahren

235

6 Literaturempfehlungen

237

Literaturverzeichnis

238

Teil III Messen und Skalieren

240

11 Reliabilität, Validität, Objektivität

241

1 Einführung

241

2 Objektivität

242

2.1 Durchführungsobjektivität

242

2.2 Auswertungsobjektivität

243

2.3 Interpretationsobjektivität

244

3 Reliabilität

244

3.1 Retest-Reliabilität

246

Beispiel zur Bestimmung der Retest-Reliabilität

247

3.2 Die Paralleltest-Reliabilität

247

3.3 Die Split-Half-Reliabilität

248

Beispiel zur Bestimmung der Split-Half-Reliabilität

249

3.4 Konsistenzanalysen

250

Beispiel zur Bestimmung der internen Konsistenz

250

3.5 Die Beurteilung der Höhe von Reliabilitätskoeffizienten

251

4 Validität

252

4.1 Die Inhaltsvalidität

252

4.2 Kriteriumsvalidität

253

4.3 Konstruktvalidität

255

Konstruktvalidierung mittels Dimensionalitätsüberprüfung (Prüfung auf formaleValidität)

255

Konstruktvalidierung mittels eines empirischen Vergleichs mit anderen, dasselbeKonstrukt messenden Instrumenten

256

Konstruktvalidierung mittels der Überprüfung des Zusammenhangs zwischen Selbstund Fremdurteil

257

5 Vorgehen zur Güteüberprüfung von Skalen

258

6 Häufige Fehler

259

7 Literaturempfehlungen

259

Literaturverzeichnis

260

12 Thurstone- und Likertskalierung

261

1 Einleitung

261

2 Thurstone Skalierung

262

2.1 Die Methode der Paarweisen Vergleiche (Law of Comparative Judgement, LCJ)

262

Grundlagen des Verfahrens

262

Vorgehensweise bei der Skalierung

264

Anwendungsbeispiel

266

2.2 Die Methode der gleich erscheinenden Intervalle

270

2.3 Die Methode der sukzessiven Intervalle (MSI)

272

Grundlagen des Verfahrens

272

Anwendungsbeispiel

273

2.4 Häufige Fehler bei der Thurstone Skalierung

277

3 Likertskalierung

277

3.1 Grundlagen des Verfahrens

277

3.2 Anwendungsbeispiel

279

3.3 Häufige Fehler bei der Likert Skalierung

282

4 Literaturempfehlungen

282

Literaturverzeichnis

282

13 Guttman- und Mokkenskalierung

284

1 Einleitung

284

2 Guttmanskalierung

286

2.1 Grundlagen des Verfahrens

286

Modellannahmen

288

Schätzung von Item- und Personenparametern

289

Stichprobenabhängigkeit der Schätzung von Item- und Personenparametern

290

Modellprüfung

291

2.2 Anwendungsbeispiel

297

2.3 Häufige Fehler bei der Guttmanskalierung

299

3 Mokkenskalierung

300

3.1 Grundlagen des Verfahrens

300

Modellprüfung

302

3.2 Anwendungsbeispiel

306

3.3 Häufige Fehler bei der Mokkenskalierung

308

4 Literaturempfehlungen

308

Literaturverzeichnis

309

14 Item-Response-Theorie

311

1 Einführung

312

2 Modelle für dichotome Items

313

2.1 Das Rasch-Modell

313

2.2 Das Birnbaum-Modell

316

2.3 Das Modell mit Rateparameter

317

3 Modelle für mehrstufig geordnete Items

318

3.1 Das ordinale Rasch-Modell (Partial-Credit-Modell)

318

3.2 Weitere IRT-Modelle für ordinale Items

320

4 Weitere IRT-Modelle

321

4.1 Mischverteilungs-IRT-Modelle: Das Mixed-Rasch-Modell

321

5 Modelltestung und Modellvergleiche

322

6 Beispielanwendung

324

6.1 Anwendung 1: Kompetenzmessung

324

6.2 Anwendung 2: Surveyforschung

326

7 Häufige Fehler

330

8 Literaturempfehlungen

331

Literaturverzeichnis

331

15 Hauptkomponentenanalyse und explorative Faktorenanalyse

333

1 Einführung in das Verfahren

333

1.1 Einsatzmöglichkeiten

333

1.2 Die Hauptkomponentenanalyse

336

Eine geometrische Perspektive

336

Die konkreten Schritte der PCA

340

Bestimmung der Komponentenzahl

341

Die unrotierte Lösung

343

Rotation

344

Berechnung von Komponentenwerten

347

1.3 Das Modell mehrerer gemeinsamer Faktoren: Faktorenanalyse im engeren Sinne

348

2 Mathematisch-statistische Grundlagen

350

3 Ein Anwendungsbeispiel: Vertrauen in Institutionen

354

4 Probleme und Erweiterungen

360

5 Literaturempfehlungen

363

Anhang

364

Literaturverzeichnis

364

16 Korrespondenzanalyse

366

1 Einleitung

366

2 Mathematisch-statistische Grundlagen

368

3 Ein Beispiel

370

3.1 Graphische Darstellung

370

3.2 Numerische Darstellung

373

4 Erweiterungen der Korrespondenzanalyse

376

4.1 Zusammengesetzte Tabellen

376

4.2 Multiple Korrespondenzanalyse

378

4.3 Aktive und passive Merkmale

382

4.4 Andere Datenformate

384

5 Häufige Fehler

385

6 Diskussion

386

7 Literaturempfehlungen

386

Literaturverzeichnis

387

17 Multidimensionale Skalierung

389

1 Einführung in die MDS

389

1.1 Die MDS als psychologisches Modell

390

1.2 Die MDS zur Exploration von Datenstrukturen

392

2 Mathematische Grundlagen der MDS

393

2.1 Güte einer MDS-Lösung

393

2.2 Bewertung des Stress

395

2.3 MDS-Modelle

397

2.4 MDS-Algorithmen

400

2.5 Konfirmatorische MDS

400

3 Häufige Fehler

403

3.1 Degenerierte Lösungen in der ordinalen MDS

403

3.2 Falsche Polung der Proximitäten

405

3.3 Fehlbewertung von Stress

406

3.4 Fehler beim Vergleich verschiedener MDS-Lösungen

407

3.5 Mechanische Interpretation „der“ Dimensionen

409

3.6 Behandlung störender Punkte

412

3.7 Überinterpretation von Dimensionsgewichten

413

4 Literaturempfehlungen

413

Anhang

414

Literaturverzeichnis

415

Teil IV Analyse von Häufigkeiten, Gruppen und Beziehungen

417

18 Analyse kategorialer Daten

418

1 Einführung in das Verfahren

418

2 Mathematisch-statistische Grundlagen

430

3 Ein Beispiel

440

4 Häufige Fehler

448

5 Literaturempfehlungen

450

Literaturverzeichnis

450

19 Varianz- und Kovarianzanalyse

452

1 Einführung in das Verfahren

452

1.1 Vergleich von zwei Gruppen

454

Modellgleichung

455

Hypothesen

455

Quadratsummen

456

Freiheitsgrade

457

Allgemeine Teststatistik

457

Annahmen

459

Exkurs: Mittlere Quadratsummen

460

1.2 Vergleich von mehr als zwei Gruppen: Die einfaktorielle Varianzanalyse

461

1.3 Mehrfaktorielle Varianzanalyse

462

Modellgleichung

462

Hypothesen

463

Quadratsummen

463

Freiheitsgrade

464

Teststatistik

465

Annahmen

465

1.4 Kovarianzanalyse

466

Modellgleichung

467

ANOVA versus ANCOVA

467

1.5 Effektstärke

468

1.6 Teststärke

471

2 Mathematisch-statistische Grundlagen

472

2.1 ANOVA und ANCOVA als Spezialfälle des ALM

473

2.2 Jenseits von ANOVA und ANCOVA: Kreative Modellierung im Rahmen des ALM

477

3 Ein Beispiel

480

3.1 Vergleich von zwei Gruppen

480

3.2 Vergleich von mehr als zwei Gruppen

481

3.3 Mehrfaktorielle ANOVA

482

3.4 Kovarianzanalyse

484

3.5 Annahmen der Varianz- und Kovarianzanalyse

484

3.6 Teststärke

488

4 Häufige Fehler – eine Checkliste

488

5 Literaturempfehlungen

489

Literaturverzeichnis

489

20 Diskriminanzanalyse

491

1 Einführung in das Verfahren

491

1.1 Zielsetzung und Anwendungsmöglichkeiten

491

1.2 Problemstellung und Prämissen

493

1.3 Arten der Diskriminanzanalyse und ihre Abgrenzung gegenüber anderen multivariaten Verfahren

495

1.4 Vorgehensweise

497

Festlegung des Untersuchungsdesigns

497

Extraktion der Diskriminanzfunktion(en)

498

Evaluation der Diskriminanzfunktion(en)

500

Merkmalsselektion und Klassifikation neuer Objekte

502

2 Mathematisch-statistische Grundlagen

503

2.1 Ermittlung der Diskriminanzfunktion (en)

503

2.2 Prüfkriterien der Diskriminanz

507

2.3 Klassifikationskonzepte

508

Distanzkonzept

509

Wahrscheinlichkeitskonzept

510

Konzept der Klassifikationsfunktionen nach Fisher

510

3 Anwendungsbeispiel

511

4 Häufige Fehler

515

5 Literaturempfehlungen

517

Literaturverzeichnis

518

21 Clusteranalyse

520

1 Einführung in das Verfahren

520

1.1 Was ist Clusteranalyse und was sind überhaupt Cluster?

521

1.2 Clusterstruktur

522

1.3 Algorithmen

522

1.4 Variablenräume

523

1.5 Agglomerative Verfahren

524

Ähnlichkeitsmaß, Distanz und Index

524

Fusionswerte und Dendrogramme

525

1.6 Wahl der Metriken und Agglomerationsverfahren

526

1.7 K-Means (Clusterzentrenanalyse)

527

1.8 TwoStep-Clusteranalyse

529

2 Mathematisch-statistische Grundlagen

530

2.1 Hierarchisch-agglomerative Verfahren

530

Ähnlichkeitsmaße und Distanzen

530

Gewichtung und Standardisierung von Variablen

532

Erweiterung der Abstandsmaße auf Abstände zwischen Aggregaten

532

Dendrogramm und Ultrametrik

533

2.2 K-Means

534

2.3 TwoStep-Verfahren

534

Die beiden Stufen der Clusterung

534

Anzahl der Cluster

535

Tabellen und Graphiken zur Beschreibung der Cluster

536

3 Beispiel

536

3.1 Daten- und Variablenauswahl

536

3.2 Analyse

537

3.3 Verbesserung der Clusterlösung

540

Variablenauswahl

540

Eliminieren von „Ausreißern“

540

Optimierung der Lösung durch eine K-Means-Analyse

541

3.4 Überprüfen der Clusterlösung

542

3.5 TwoStep-Clusteranalyse

543

4 Häufige Fehler

545

5 Literaturempfehlungen

546

Literaturverzeichnis

547

22 Analyse latenter Klassen

548

1 Einführung in das Verfahren

548

2 Mathematisch-statistische Grundlagen

550

2.1 Modellansatz

550

2.2 Parameterschätzung

551

2.3 Computerprogramme

553

3 Ein Beispiel

555

3.1 Daten

555

3.2 Zahl der latenten Klassen

555

3.3 Lokale Unabhängigkeit

559

3.4 Inhaltliche Interpretierbarkeit

560

3.5 Stabilität

562

3.6 Formale Validitätsprüfung durch Validitätsindizes

564

3.7 Kriterienbezogene Validitätsprüfung

564

4 Häufige Fehler

566

5 Alternativen

567

6 Literaturempfehlungen

568

Literaturverzeichnis

569

23 Netzwerkanalyse

570

1 Einführung

570

2 Darstellung der Verfahren

575

2.1 Konzepte zur Beschreibung der Netzstruktur in Dyaden und Triaden

576

Dyaden

577

Triaden

578

Triadische Umgebungen einzelner Knoten

579

2.2 „Positionen“: Die Klassierung von Knoten aufgrund ähnlicher Muster ihrer strukturellen Einbettung

582

2.3 Teilgruppen: Die Identifikation von Teilnetzen intern eng bzw. stark verbundener Knoten

586

Cliquen und Clans

587

k-Plexe und k-Cores

588

Zusammenhangs-Komponenten

588

Modifikation der Teilgruppenkonzepte für gerichtete Beziehungen

589

3 Ein Beispiel

589

3.1 Daten

589

3.2 Zielsetzungen

591

3.3 Erstellung des Datensatzes

592

4 Literaturempfehlungen

596

Literaturverzeichnis

597

Teil V Regressionsverfahren für Querschnittsdaten

599

24 Lineare Regressionsanalyse

600

1 Einführung

600

2 Mathematisch-statistische Grundlagen

605

2.1 Das allgemeine Modell

605

2.2 Die Identifikation der Regressionskoeffizienten

606

2.3 Annahmen der Kleinst-Quadrat-Methode

608

2.4 Die Bestimmung der Modellgüte

610

2.5 Die statistische Absicherung der Regressionsergebnisse

612

2.6 Die Interpretation der Regressionskoeffizienten

616

2.7 Standardisierte Regressionskoeffizienten und ihre Probleme

618

3 Ein Beispiel

621

3.1 Zur Operationalisierung

621

3.2 Ergebnisse

622

4 Häufige Fehler

628

5 Literaturhinweise

630

Literaturverzeichnis

630

25 Lineare Regression: Modellannahmen und Regressionsdiagnostik

632

1 Einführung

632

1.1 Lineares Regressionsmodell: Systematischer Teil, Störgrößen und Residuen

633

1.2 Regressionsdiagnostik: ein erster Einblick

635

2 Mathematisch-statistische Grundlagen

638

2.1 Annahmen der linearen Regressionsanalyse

638

2.2 Grundlagen und Instrumente der Regressionsdiagnostik

645

Stichprobenresiduen und „Leverage“-Werte als Bausteine der Regressionsdiagnostik

645

Diagnostik zu den Annahmen des klassischen linearen Regressionsmodells

646

Diagnostik zu potenziell einflussreichen Untersuchungseinheiten

652

3 Regressionsdiagnostik am Beispiel

655

3.1 Datengrundlage und Regressionsmodell

655

3.2 Regressionsdiagnostik zu den Annahmen des linearen Regressionsmodells am Beispiel

656

3.3 Regressionsdiagnostik zu einflussreichen Beobachtungen am Beispiel

661

4 Regressionsdiagnostik: Umfang, Probleme und Empfehlungen

665

5 Literaturempfehlungen

666

Anhang

667

Literaturverzeichnis

667

26 Nicht-Linearität und Nicht-Additivität in der multiplen Regression: Interaktionseffekte, Polynome und Splines

669

1 Einführung

669

2 Interaktionseffekte, Polynome und Splines

670

2.1 Nicht-Additivität: Interaktionseffekte

670

2.2 Nichtberücksichtigung von Interaktionen als Fehlspezifikation

673

2.3 Nicht-Linearität: Polynome und Splines

674

2.4 Polynome

675

2.5 Splines

677

3 Tests auf Gruppenunterschiede und Nicht-Linearität

681

4 Anwendungsbeispiel I: Interaktionseffekte

683

5 Anwendungsbeispiel II: Polynome und Slopes

689

6 Häufige Fehler

696

7 Literaturempfehlungen

697

Literaturverzeichnis

697

27 Robuste Regression

699

1 Einführung in das Verfahren

699

2 Mathematisch-statistische Grundlagen

709

2.1 Der Kleinste-Quadrate-Schätzer

709

2.2 Grundlegende Konzepte zur Bewertung robuster Schätzer

710

Erwartungstreue, Konsistenz und Effizienz

710

Relative Effizienz

711

Einfluss-Funktion, Bruchpunkt und maximale Verzerrung

712

Zusammenfassung

713

2.3 M-Schätzer

713

Berechnung von M-Schätzern

717

Bruchpunkt von M-Schätzern

719

Bounded-Influence-Schätzer

719

2.4 High-Breakdown-Schätzer

720

LMS- und LTS-Schätzer

720

S-Schätzer

721

MM-Schätzer

722

3 Ein Beispiel

723

4 Literaturempfehlungen

729

Literaturverzeichnis

730

28 Mehrebenenanalyse mit Querschnittsdaten

733

1 Einführung in das Verfahren

733

2 Mathematisch-statistische Grundlagen

741

2.1 Die Modellklassen der Mehrebenenanalyse

743

Das Random-Intercept-Only-Modell (R-I-O-M)

743

Das Random-Intercept-Modell (R-I-M)

744

Random-Intercept-Random-Slope-Modell (R-I-R-S-M)

744

Das Intercept-as-Outcome-Modell (I-as-O-M)

745

Das Random-Coefficient-Modell (R-C-M)

746

2.2 Beurteilung der Anpassung des Mehrebenenmodells

747

2.3 Zentrierung metrischer Prädiktoren und ihre Bedeutung für die Interpretation

749

Grand-Mean-Zentrierung

749

Group-Mean-Zentrierung

750

2.4 Standardisierung der kontextspezifischen und Populationsschätzer

752

2.5 Besonderheiten des Erhebungsdesigns

754

3 Ein Beispiel – Die deutsche PISA 2006 Studie

755

4 Häufige Fehler

763

5 Literaturempfehlungen

764

Literaturverzeichnis

765

29 Strukturgleichungsmodelle

767

1 Einführung in das Verfahren

767

1.1 Ausgangspunkt: Regressions- und Pfadmodell

768

1.2 Das Messmodell: Die Diffenzierung zwischen manifesten und latenten Variablen

769

1.3 Die konfirmatorische Faktorenanalyse: Die simultane Prüfung mehrerer Messmodelle

771

1.4 Das allgemeine Strukturgleichungsmodell

773

Modellevaluation

775

Modellvergleich

776

Modellsparsamkeit

777

1.5 Spezielle Modellvarianten

778

Modelle für mehrere Gruppen (Multiple Gruppenvergleiche)

778

Längsschnittmodelle

778

Modelle mit Interaktionstermen

778

Die Behandlung fehlender Werte

779

2 Mathematisch-statistische Grundlagen

779

2.1 Ableitung der Elemente der Kovarianzmatrix ?

779

2.2 Schätzung der Parameter

780

3 Ein Beispiel

783

3.1 Messung der latenten Konstrukte

785

3.2 Messmodell der latenten endogenen Variablen

785

3.3 Messmodell der latenten exogenen Variablen

785

3.4 Überprüfung der Messmodelle

786

3.5 Intervenierende Variablen

788

3.6 Strukturgleichungsmodell

788

4 Häufige Fehler

790

5 Literaturempfehlungen

792

Anhang

793

Literaturverzeichnis

794

30 Regression mit unbekannten Subpopulationen

797

1 Einführung in das Verfahren

797

2 Mathematisch-statistische Grundlagen

799

2.1 Spezifikation

800

2.2 Schätzung

805

2.3 Test auf die Anzahl der Komponenten

807

2.4 Anpassungsindizes

808

3 Ein Beispiel

808

4 Häufige Fehler

816

5 Literaturempfehlungen

816

Literaturverzeichnis

817

31 Logistische Regression

818

1 Einführung in das Verfahren

818

1.1 Das lineare Wahrscheinlichkeitsmodell

819

1.2 Die logistische Regression

820

1.3 Interpretation der Koeffizienten

822

2 Mathematisch-statistische Grundlagen

825

2.1 Herleitung als nichtlineares Modell mit latenter abhängiger Variable

825

Logit-Regression

825

Probit-Regression

827

2.2 Schätzung

827

2.3 Vergleich von Koeffizienten und unbeobachtete Heterogenität

828

Standardisierte Koeffizienten

829

Durchschnittliche marginale Effekte

830

2.4 Interaktionseffekte

831

2.5 Statistische Inferenz

833

2.6 Goodness of fit und Modellvergleich

834

3 Ein Beispiel

835

4 Häufige Fehler

843

5 Literaturempfehlungen

844

Literaturverzeichnis

845

32 Multinomiale und ordinale Regression

846

1 Einführung in das Verfahren

846

1.1 Von der binären zur multinomialen logistischen Regression

847

1.2 Wahrscheinlichkeiten, Odds und Logits

848

1.3 Modellschätzung und statistische Tests

852

Besteht ein Zusammenhang?

853

Wie stark ist ein Zusammenhang?

853

Wie stark sind die relativen Effekte der erklärenden Variablen?

854

1.4 Logistische Regression bei einer ordinalen abhängigen Variablen

855

1.5 Interpretation des Modells der kumulierten Logits als vorgelagertes Schwellenwertmodell in einer linearen Regression

857

2 Mathematisch-Statistische Grundlagen

859

2.1 Schätzung

859

2.2 Statistische Inferenz

860

2.3 Modellanpassung

861

2.4 Weiterführendes zu Regressionskoeffizienten

862

Standardisierte Koeffizienten im ordinalen Regressionsmodell

862

Umrechnen der Referenzkategorie im multinomialen Regressionsmodell

862

3 Anwendungsbeispiel

863

3.1 Einfluss der Bildungsabschlüsse von Vater und Mutter auf die Bildung der Befragten in der multinomialen logistischen Regression

863

3.2 Bildungsabschluss im ordinalen Logitmodell

870

4 Häufige Fehler

873

5 Literaturempfehlungen

877

Literaturverzeichnis

877

33 Regression für Zählvariablen

878

1 Einführung in das Verfahren

878

1.1 Poisson und negative Binomialverteilung

879

1.2 Regressionsmodellierung

880

Strukturkomponente

880

Strukturkomponente: lineare und nichtlineare Prädiktoren

881

Verteilungskomponente

883

Inferenz

883

2 Mathematisch-statistische Grundlagen

884

2.1 Poissonmodell

884

Maximum-Likelihood-Schätzung

884

Parameter-Tests

885

Devianz und Anpassungstests

887

2.2 Quasi-Poissonmodell

888

2.3 Modell der negativen Binomialverteilung

889

3 Ein Beispiel

889

4 Häufige Fehler

893

5 Literaturempfehlungen

894

Literaturverzeichnis

894

34 Graphische Darstellung regressionsanalytischer Ergebnisse

896

1 Einführung in das Verfahren

896

2 Grundlagen der graphischen Darstellung

897

3 Beispiele

900

3.1 Streudiagramm- bzw. Scatterplot-Matrix

900

3.2 Median- und Mean-Regression

902

3.3 Lineare Regression: Graphische Darstellung der Koeffizienten

903

3.4 Lineare Regression: Die Darstellung vorhergesagter Werte (Conditional-Effect-Plots)

905

3.5 Logistische Regression: Conditional-Effect-Plots

908

3.6 Multinomiale Regression: Odds Ratio-Plots, Discrete-Change und Conditional-Effect-Plots

911

4 Häufige Fehler

915

5 Rückblick

916

6 Literaturempfehlungen

917

Literaturverzeichnis

918

Teil VI Analyse von zeitbezogenen Daten

919

35 Nichtparametrische Schätzung kausaler Effekte mittels Matchingverfahren

920

1 Einführung in das Verfahren

920

1.1 Grundannahmen kausaler Inferenz in Matchingverfahren

921

1.2 Treatmenteffekte als Schätzgrößen der empirischen Analyse

924

1.3 Durchführung der empirischen Analyse

925

1.4 Varianten von Matchingverfahren bei Vorliegen unterschiedlicher Datenstrukturen

930

2 Mathematisch-statistische Grundlagen

931

3 Ein Anwendungsbeispiel: der Einkommenseffekt eines Arbeitsplatzverlustes

937

3.1 Zuweisungsmodell

938

3.2 Matching und Balancierungstests

940

3.3 Parameterschätzung

944

4 Häufige Fehler

947

5 Literaturempfehlungen

949

Literaturverzeichnis

949

36 Kausalanalyse mit Paneldaten

951

1 Einführung in die Paneldatenanalyse

951

1.1 Kontrafaktische Kausalanalyse und Paneldaten

952

1.2 Eine intuitive Einführung in Panelregressionsmodelle

954

1.3 Ein didaktisches Beispiel

956

2 Eine präzisere Einführung in die Panelregression

959

2.1 Das Fehlerkomponenten-Modell

960

2.2 Die Schätzverfahren

960

2.3 RE- oder FE-Modell?

963

2.4 Ein Hybrid-Modell

964

2.5 Panel-robuste Standardfehler

965

3 Ein Beispiel: Der Effekt der Heirat auf die Zufriedenheit

966

3.1 Datenaufbereitung

966

3.2 Schätzergebnisse

968

3.3 Ein Modell mit Periodeneffekten

970

3.4 Ein Hybrid-Modell

971

3.5 Ein Wachstumskurven-Modell

972

4 Nicht-lineare FE-Modelle

973

4.1 Nicht-lineare Panelregressionsmodelle

974

4.2 Das FE-Logit Modell

974

4.3 FE-Modelle für Ereignisdaten

976

5 Häufige Fehler

978

5.1 Suboptimale Panelregressionsmodelle

978

5.2 Grenzen von FE-Modellen

979

6 Literaturempfehlungen

981

Literaturverzeichnis

981

37 Survival- und Ereignisanalyse

983

1 Einführung in das Verfahren

983

1.1 Spezifische Problemstellungen

984

1.2 Erhebung von Ereignisdaten

986

1.3 Zensierung von Beobachtungen

987

2 Theoretische Modelle, mathematisch-statistische Grundlagen und Notation

988

2.1 Verschiedene Ratenmodelle und ihre Schätzung

991

Sterbetafelmethode und Kaplan-Meier-Schätzung

991

Das Exponentialmodell

992

Das Cox-Modell

992

Das Piecewise-Constant-Modell

993

Parametrische Modelle der Zeitabhängigkeit

994

2.2 Ein Beispiel

994

3 Modellierung von parallelen und interdependenten Prozessen

996

3.1 Ursachen und zeitabhängige Kovariablen

997

3.2 Zeit und kausale Wirkungen

998

3.3 Zeitachse und Ereignisse

998

3.4 Zeitfolge, Zeitintervalle und scheinbare Gleichzeitigkeit

998

3.5 Zeitliche Form der Entfaltung von Wirkungen

999

3.6 Das Prinzip der konditionalen Unabhängigkeit

999

3.7 Ein Anwendungsbeispiel

1000

4 Häufige Fehler

1001

5 Literaturempfehlungen

1002

Literaturverzeichnis

1003

38 Latente Wachstumskurvenmodelle

1005

1 Einführung in das Verfahren

1005

2 Mathematisch-statistische Grundlagen

1009

3 Beispiel: Entwicklung von Lebenszufriedenheit nach Arbeitsplatzverlust

1012

4 Häufige Fehler

1014

5 Literaturempfehlungen

1016

Literaturverzeichnis

1016

39 Sequenzdatenanalyse

1018

1 Einführung in die Sequenzdatenanalyse

1018

1.1 Was ist Sequenzdatenanalyse?

1019

1.2 Grundlegende Konzepte

1020

2 Mathematisch-statistische Grundlagen: Algorithmen zur Distanzberechnung

1024

2.1 Der Optimal Matching Algorithmus

1024

2.2 Der zweite Schritt: Die Weiterverarbeitung der Distanzen

1026

2.3 Die Diskussion um OM und neuere Entwicklungen

1026

3 Beispiel: Der Arbeitsmarkteintritt westdeutscher Männer und Frauen

1028

3.1 Datenaufbereitung

1028

3.2 Datenauswertung

1030

4 Häufige Fehler

1035

5 Literaturempfehlungen

1037

Literaturverzeichnis

1037

40 Zeitreihenanalyse

1039

1 Einführung

1039

2 Deskription und statistisches Modell

1041

3 Stochastische Prozesse

1042

4 Nichtstationäre (stochastische) Prozesse

1047

5 Tests auf „Random Walk“

1049

6 Zerlegung von Zeitreihen

1053

7 Interventionsanalyse

1059

8 Ausreißer-Analyse

1061

9 Transferfunktions-Modelle

1064

10 Vektorielle stochastische Prozesse

1068

11 Schluss

1073

12 Literaturempfehlungen

1074

Literaturverzeichnis

1074

Anhang

1077

Autorenverzeichnis

1078