 NEWBIE

Anmeldung: 02 / 24 / 2011 Themen: 3 Beiträge: 0
 OFFLINE | Fragenkatalog Empirie II
1. Ist die Berechnung von Maßen der zentralen Tendenz nur zulässig bei Daten, die aus Zufallsstichproben stammen?
Nein (Deskriptive Statistik ist überall anwendbar).
- Arithm. Mittel (Mean, benötigt zur Berechnung mind. Intervallskalenniveau),
- Modus (auch Mode, Modalwert, ist Kennziffer der zentralen Tendenz für klassifikatorische, nominalskalierte Beobachtungen, zeigt die meisten Nennungen der Ausprägung des Merkmals bspw. Beruf- Verkäufer/in) und
- Median (Zentralwert, benötigt zur Berechnung mind. Ordinalskalenniveau) sind auf jede Art von Untersuchungsdesign anwendbar.
Sie (Maße der zentralen Tendenz) gehören zu den deskriptiven Maßzahlen der univariaten Analyse (Verteilung eines Merkmals). Weitere deskriptive Maßzahlen sind Streuungsmaße, wie Range (Spannbreite), Varianz (nicht interpretierbar) und Standardabweichungen (interpretierbar).
Bei schiefen Verteilungen gilt:
(i) Linksschief/ rechtssteile Verteilung: Modus > Median > Mean
(ii) Unimodal / symmetrische Verteilung: Modus = Median = Mean
(iii) Rechtsschiefe/ linksteile Verteilung: Modus < Median < Mean
1b) Ist die Berechnung von Maßen der Dispersion (Streuungsmaßen) nur zulässig bei Daten, die aus Zufallsstichproben stammen?
Nein.
Maßzahlen der Dispersion sind
- Range ( Spannweite der Merkmalsausprägung, max. und min. Wert einer Verteilung, äußerst sensibel reagiert er auf Ausreißer),
- Varianz (mind. Intervallskalierte Messwerte) und
- Standardabweichung (mind. Intervallskalierte Messwerte)
2. Können Signifikanzniveaus von exakt 0.0 in empirischen Untersuchungen vorkommen?
Nein.
Dies hängt mit der statistischen Hypothesenprüfung zusammen. Man prüft mit einem Signifikanzniveau von α= ,05 oder ,01 mit der Nullhypothese (Ho), ob eine AV von einer UV unabhängig ist.
Beispiel:
Prüfung auf Zusammenhang von Bildung (UV, hier 1) und Einkommen (AV, hier μ2)
Ho: μ1 = μ2
Ha: μ1 ≠ μ2
Um eine Wahl zwischen Ho und Ha treffen zu können, muss eine Wahrscheinlichkeit festgelegt werden, die als Entscheidungskriterium dient. Tritt ein Wert des Teststatistik bspw. Chi², Gamma oder z mit der Wahrscheinlichkeit < α auf, weisen wir Ho zurück und akzeptieren Ha. Man nimmt somit bewusst eine eventuellen Irrtum in Kauf, das Ho fälschlicherweise abgelehnt wurde, deswegen nennt man α auch Irrtumswahrscheinlichkeit. Tritt genau das ein, nennt man dies auch α-Fehler.
Nimmt man α = ,05 , so liegt mit 95%iger Wahrscheinlichkeit ein Wert im Bereich ± 1.96 (grün).
Die Vorgehensweise der Teststatistik von keinem Zusammenhang als Ho ausgehen lässt nur zu, dass bei keiner Abweichung, μ1=μ2, die Ho mit 100% zutreffen würde, also exakt von α =1,0 werden würde. Andersherum kann Ha aber keine 100% Sicherheit in Anspruch nehmen. Man kann also nicht exakt α = 0,0 erhalten, da man nicht mit 100% die Ho ablehnen kann bzw. g = ,0000 heißt nicht, dass die Wahrscheinlichkeit für Ho exakt 0,0 ist.
3. Welche Maße der zentralen Tendenz können für nominalskalierte Daten sinnvoll interpretiert werden?
Modus.
Der Modalwert ist diejenige Ausprägung einer Variable, die die maximale Häufigkeit aufweist.
4. Dürfen Suggestivfragen bei Befragungen verwendet werden?
Ja (z.B. bei sozial nicht wünschenswerten Themen)
5. Sind Modus, Median und Standardabweichung bei schiefverteilten Merkmalen identisch?
Nein (Jedoch Modus/ Median gleich).
(i) Linksschief/ rechtssteile Verteilung: Modus > Median > Mean
(ii) Unimodal / symmetrische Verteilung: Modus = Median = Mean
(iii) Rechtsschiefe/ linksteile Verteilung: Modus < Median < Mean
Standardabweichung ist keine Maßzahl der zentralen Tendenz, sonder eine Maßzahl der Dispersion (neben Rang und Varianz).
Skalenniveau Maßzahlen¹ Maßzahlen¹
Zentrale Tendenz Dispersion
Nominalskala Modalwert Simpson D
Ordinalskala Median Quartilabstand
Intervallskala Arithm. Mittel Standardabweichung, Varianz
Ratioskala, Verhältnisskala Geometr. Mittel Varianzkoeffizient, Gini-Koeffzient
¹für univariate Verfahren
6. Wenn ein Merkmal in der Grundgesamtheit schief verteilt ist, wie sind die entsprechenden Mittelwerte von 10.000 Zufallsstichproben aus dieser Grundgesamtheit?
= Shi-Verteilt (Parameter bei Stichproben sind nominal verteilt)
Die Parameter einer Verteilung sind nominalverteilt ( Gesetz der großen Zahlen), somit sind die Mittelwerte aus den 10.000 Zufallsstichproben normalverteilt, unabhängig von der Verteilungsstruktur des beobachteten Merkmals selbst. Ausnahme ist die Ein-Punkt-Verteilung, dort sind alle Werte exakt identisch.
7. Wenn die Körpergröße in einer bestimmten Population normalverteilt ist und das arithmetische Mittel 1,65cm beträgt, wie hoch sind Modus und Median?
Ebenfalls 1,65cm.
1.65 ( da identisch)
(i) Linksschief/ rechtssteile Verteilung: Modus > Median > Mean
(ii) Unimodal / symmetrische Verteilung: Modus = Median = Mean
(iii) Rechtsschiefe/ linksteile Verteilung: Modus < Median < Mean
7b) Wenn die Körpergröße in einer bestimmten Population rechtssteil ist und das arithmetische Mittel 1,65 cm beträgt, wie hoch sind Modus und Median?
Modus > Median > 1,65cm
8. Wenn das Einkommen in einer bestimmten Population normalverteilt ist und das arithmetische Mittel 40.000 Euro beträgt, wie ist dann eine Standartabweichung von 20.000 zu interpretieren?
Rund 2/3 der Population verdienen zwischen 20.000 und 60.000 Euro.
Arithm. Mittel = 40.000 ( Einkommenklassen waren 20.000 bis 60.000)
9. Was ist ein Proxy-Report?
Datenerhebung mit Fragen über Dritte (z.B. Mikrozensus: Fragen über alle Familienmitglieder)
Ist ein Report von Angaben über Dritte, bspw. Angaben, über Personen, die mit im Hasuhalt wohnen. Validität↓.
10. Welche der folgenden Datenerhebungstechniken gelten als nicht reaktiv?
a. Cati
b. Capi
c. Leitfadeninterviews
d. nicht teilnehmende, verdeckte Beobachtung
e. Hausmüllanalyse
d und e.
11. Eine Meinungsforschungsinstitut führt regelmäßig Umfragen in Bielefeld durch (2.000 Befragte, Zufallsauswahl aus der Kartei des Meldeamtes) und deklariert diese als repräsentativ für ganz Deutschland mit der Begründung, die Alters-, Geschlechts- und Bildungsstrukturen in Bielefeld seien mit der von ganz Deutschland identisch. Was ist aus methodischer Sicht dazu zu sagen?
Alters-, Geschlechts-, und Bildungsstruktur waren zu dem Zeitpunkt vergleichbar, jedoch ist eine Stadt ohne Landbevölkerung nicht repräsentativ für Deutschland. (Stadtleben kann man nicht auf Land beziehen)
12. Vervollständigen Sie die folgende Tabelle (ausgewiesen wurden die absoluten Häufigkeiten)!
BMI-Werte Geschlecht
Männer Frauen
Unter 20 30 90
20 bis 25 50 150
Über 25 40 120
Es fehlen Randverteilung und relative Häufigkeiten (Anteil sind jedoch nur pro Geschlecht zu treffen, nicht die Gesamtheit, weil sonst nicht interpretierbar)
Männer Männer Frauen Frauen
Nj pj nj pj
Unter 20 30 0,25 90 0,25 120
20 bis 25 50 0,42 150 0,42 200
Über 25 40 0,33 120 0,33 160
Σ/ Randverteilung 120 1 360 1 480
b) Welche der folgenden Aussagen sind richtig?
a. Es sind anteilig mehr Männer als Frauen übergewichtig.
b. Es sind anteilig mehr Frauen als Männer untergewichtig.
c. Es sind gleich viele Frauen wie Männer untergewichtig.
d. Das Merkmal Geschlecht hat keinen Einfluss auf die Ausprägung der BMI-Werte.
Richtig: c und d
In der nächsten Aufgabe ist die Fragestellung nicht überliefert. Ich hab mein Bestes gegeben alles zusammen zu suchen und die Aufgabe richtig zu formulieren. (Die Tabelle hab ich aus einer alten Arbeit eingefügt. Kann falsch sein)
13. Gestalten Sie den folgenden SPSS-Output gemäß der Konventionen zum Aufbau einer Tabelle um, und weisen Sie auch die entsprechenden statistischen Maßzahlen aus (nur diese!)!
Hinweis: Die Daten stammen aus einer Zufallsstichprobe.
Alter/Ort 5 5 bis unter 50 50 bis unter 100 Über 100 RV X
18 bis unter 30 75 184 46 229 534
30 bis unter 40 132 240 41 246 659
40 bis unter 50 116 190 28 174 508
50 bis unter 60 104 227 43 168 542
RV Y 202 373 53 285 913
629 1214 211 1102 3156
Antwort:
- Keine Abhängigkeit (keines der Merkmale ist direkt abhängig eines anderen)
- Beider Merkmale sind ordinal skaliert
- Altersstruktur ist die abhängige Variable = x
- Wohnort ist die unabhängige Variable = y
- Gamma- Korrelation oder Rangkorrelation von Sperman ( da ordinal skaliert)
14. Welche sind die 12 Gebote zur Fragebogengestaltung?
1. Einfache und geläufige Formulierungen
2. Einfache, aber vollständige Sätze
3. Reizwörter vermeiden
4. Suggestive Formulierungen vermeiden
5. Ausbalancierte und gleichwertige Anwortkategorien verwenden
6. Eindimensionale Fragen stellen
7. Kategorien müssen wechselseitig exklusiv sein
8. Merkmalsausprägungen sinnvoll zusammenfassen
9. Fragen müssen beantwortbar sein (zB keine mathematischen Rechnungen)
10. Doppelte Verneinungen vermeiden
11. Kausalkonstruktionen bei Statements vermeiden
12.Mehrdeutige und interpretationsfähige Begriffe vermeiden
15. Welche Einstellungsmessungen sind schlecht (mit Begründung)?
a. Viele Arbeitslose wollen gar nicht arbeiten
a. kein Problem.
b. Menschen ohne Arbeit haben ihr Schicksal nicht selbst verschuldet und sollten deshalb Arbeitslosengeld in Höhe ihres früheren Einkommens beziehen, bis sie eine adäquate neue Stelle gefunden haben
b. Verknüpfungen von Teilaussagen, doppelte Verneinung
c. wer arbeiten will, findet Arbeit
c. kein Problem
d. Die Gesellschaft sollte mehr für Arbeitslose tun
d. kein Problem
e. In Zeiten hoher Arbeitslosigkeit sollten Streiks verboten werden
e. kein Problem
f. Eigentlich ist das Arbeitslosengeld nicht zu hoch
f. doppelte Verneinung
f1. Zuständig für Arbeitslose ist die Bundesagentur für Arbeit
f1. Kein Problem
g. Es gibt wichtigere Dinge im Leben als die Arbeit
g. kein Problem
h. Arbeitslose verdienen Solidarität und Hilfe, denn unter den Arbeitsmarktbedingungen des Kapitalismus ist Arbeitslosigkeit immer unverschuldetes
Schicksal
h. Kausale Verknüpfung, Fremdwörter (Solidarität) und Reizwort (Kapitalismus)
16. Ab wann spricht man von einer approximativen Normalverteilung? Und welche Verteilung gibt es?
keine Antwort.
17. Wir wird eine Normalverteilung standardisiert?
Die Standardabweichung (s) beschreibt die Breite der Normalverteilung und hängt mit der Halbwertsbreite zusammen.
18. Warum werden bei mündlichen Befragungen so genannte Selbstausfüllbogen verwendet?
Um so, bei sensitiven Themen oder sozial nicht wünschenswerten Fragen das Risiko der Antwortverweigerung, Antwortverzerrung oder einer falschen Antwort zu reduzieren. Außerdem sind Selbstausfüllbogen nützlich, wenn dem Interviewer die Fragen unangenehm sind.
19. Mit welchen 2 Verfahren können Mitglieder für Kontroll- und Experimentalgruppen rekrutiert werden? Welches der beiden Verfahren ist das Bessere und warum?
- Matching (Bewusstes zuordnen auf der Basis bestimmter Merkmale, statistische Zwillinge (Namen, Alter)
- Randomisierung (zufällige Zuordnung in die Gruppe)
Das bessere ist Randomisierung. Die Fehler addieren sich in der Summe zu Null, also wird die verzerrende Wirkung vermieden (Fallzahlen min. 20 Personen pro Gruppe)
20. Was ist eine Intervallschätzung? Und wie definiert sich das Vertrauensintervall?
keine Antwort.
21. Wie analysiert man gemeinsam zwei Merkmale und zu welchem Ziel? An einem Beispiel konstruieren und interpretieren!
Kreuztabelle/ Korrelationsanalyse
Ziel: Prüfung Kausaler Hypothesen
Bsp.: Geschlecht & Berufstätigkeit
22. Was ist die Signifikanz? Und was sagt sie aus? Welche Tests gibt es dazu?
Sicherheit für eine statistische Aussage. (möglicher Test Chi², es gibt noch mehr, siehe Folien)
23. keine Frage vorhanden
24. Welche Messniveaus gibt es? Welche passenden Tests werden verwand?
Nominalskala: Unterschiede zwischen Merkmalsträger
Ordinalskala: hierarchische Ordnung der Merkmalsträger, Rangfolge
Intervallskala: Äqudistanz der Messpunkte
Ratioskala: Merkmalsausprägungen weisen natürlichen Nullpunkt auf
25. Wie kann man Drittfaktoren kontrollieren? Welche Möglichkeiten des Zusammenhangs gibt es?
Drittfaktor hat keinen nachweisbaren Effekt und bestätigt damit die ursprüngliche Beziehung.
26. Interpretieren Sie bitte dieses Spss-Ergebnis und gehen Sie ebenfalls auf α ein!
keine Antwort.
27. Welche Interpretation können Sie bezüglich der durchgeführten Drittfaktorkontrolle treffen?
a. Nach Einführung einer Drittvariablen sind die bedingten Korrelationen gleich oder nahe Null.
b. Der Zusammenhang ich nicht mehr Signifikant.
28. Nennen Sie mir je 3 Vor- und Nachteile für reaktive Methoden in der Datenerhebung! Welche reaktiven und nichtreaktiven Methoden kennen Sie?
Vorteile:
- Die untersuchten Personen wissen, dass sie untersucht werden.
Nachteil:
- Gefahr der Artefaktbildung
- Hängt von der Tagesform ab
- Selbstdarstellungsbedürfnisse
- Placeboeffekte
Nicht-reaktive-Methoden:
- Spurenmessung
- Abnutzungs- und Ablagerungsspuren
- physiologische Messung
- Verdeckte Beobachtung
- Inhaltsanalyse
- Nicht reaktive Feldexperimente
- Hausmüllanalyse
Reaktive Methoden
- Cati, Capi, Casi, Papi
- Leitfadeninterviews
- Telefoninterview
- Mail-Survey
29. Welche Reaktion (Effekte) können bei einer Befragung auftreten? Nennen Sie mindestens 5 und erklären Sie diese genauer!
1. Wortlaut und Sinn der Frage
2. Missverständnisse und Frageninterpretation
- schlecht operationalisierte Fragen
- Reaktion auf formale Effekte, auf Abfolge von Fragen, auf vermuteten Auftraggeber
3. Interviewereffekte
- eigenmächtige Änderung, Kommentierung, Auftreten, Aussehen
- Reaktion auf Verhaltensweisen, auf äußere Merkmale
4. Situationseffekte
- Reaktion auf anwesende Dritte, Ort, Zeit
Allgemeine Reaktionsmuster der Befragten
- Inhaltliche Antwort, obwohl Befragte keine Meinung zum Objekt haben
- Sozial unerwünschte Antwort
- Generelle Zustimmung zu Fragen
- Es werden ausschließlich erst- oder letztgenannte Kategorien gewählt
- Tendenz zur Mitte, Meidung von Extremurteilen, Befragungsarten
30. keine Frage vorhanden
31. Wie erfragen Sie nicht sozial wünschenswertes Verhalten?
Selbstausfüllbogen.
Zusatz aus der Vorlesung (kann unvollständig sein, da ich manchmal zu spät kam. Bitte in eigenen Unterlagen nachschauen und notfalls vervollständigen!)
1.
a) Tragen Sie in folgende Tabelle Messwerte für die Ausprägungen der Variablen ein!
Item Nr. Ja Nein
1 1 0
2 1 0
3 1 0
b) Welchen Wertebereich (minimale Ausprägungen bzw. maximale Ausprägung) erfasst ein additiver Index, der alle Ausprägungen und Items brücksichitgt?
Index nicht (?) (bin ich mir nicht sicher) von: 0 bis: 9
c) Welches Messniveau hat dieser Index?
Nominal
Ordinal
Intervall
Ratio
Antwort: Ratio
Der Index ist ratioskaliert und die Ausgangsfrage ist nominal.
2.
a) Wenn ein Merkmal in der Grundgesamtheit
- a1) schief
- a2) gleich
verteilt ist, wie sind die entsprechenden Mittelwerte von 10.000 Zufallsstichproben aus dieser Grundgesamtheit?
a1) Nominalverteilt (Gausche-Glockenkurve)
a2) Verteilungsform; eine Grade parallel zur x-Achse, normalverteilt
b) Wenn ein Merkmal in der Grundgesamtheit einpunkt verteilt ist, wie sind die entsprechenden Mittelwerte von 10.000 Zufallsstichproben aus dieser Grundgesamtheit verteilt?
- Keine Streuung, keine Varianz
- Einpunktverteilung
c) Wenn das Nettojahreseinkommen in einer bestimmten Population normalverteilt ist und das arithmetische Mittel 33.000€ beträgt, wie hoch sind Modus und Median?
Ebenfalls 33.000€ (weil bei Normalverteilung Median = arithmetischem Mittel)
|