Biostatistik Schritt 1 von 6 16% In dieser Aufgabenreihe geht es darum, reale Datensätze und ihre Kernaussagen richtig zu interpretieren. Wir benutzen dafür den „Palmerpenguins“ Datensatz. Dieser wurde von Dr. Kristen Gorman und der Palmer Station, Antarctica LTER aus dem „Long Term Ecological Research Network“ zur Verfügung gestellt. Im Datensatz sind folgende Paramter bekannt: Arten: Adelie, Chinstrap, Gentoo Insel: Fundort der Arten Schnabellänge in mm Schnabeltiefe in mm Flügellänge in mm Gewicht in g Geschlecht: männlich, weiblich, NA (nicht definiert) Jahr: Erkundungsjahre 2007, 2008, 2009 Aufgabe 1: Boxplot Über was gibt ein Boxplot Diagramm KEINE Auskunft? Median Ausreißer Mittelwert Kennzeichnung, wo 75% der Werte liegen (3. Quartil) Welche Aussage über dieses Boxplot Diagramm stimmt? Es gibt keine schwereren Chinstrap Pinguine als Gentoo Pinguine. Adelie Pinguine besitzen in diesem Datensatz bezüglich auf ihr Gewicht Ausreißer außerhalb der Bartenden. Im Durchschnitt sind Gentoo Pinguine schwerer als Adelie oder Chinstrap Pinguine. Der Median aller drei Arten befindet sich auf einem ähnlichen Niveau. Welche Aussage stimmt in Anbetracht der Ihnen bekannten Variablen des Datensatzes und dieses Boxplott Diagramms in jedem Fall? Pinguine, die auf der Insel Biscoe leben, haben eine größere Flügellänge als auf Dream oder Torgersen. Die Identifizierung des Geschlechts war besonders schwer auf der Torgersen Insel. Auf der Dream Insel gibt es signifikant mehr männliche Pinguine als weibliche. Männliche Pinguine haben unabhängig von den Inseln durchschnittlich größere Flügel als weibliche. Zu diesem Boxplot Diagramm stellt sich die Frage, warum die Ausdehnung der Werte bei der Flügellänge auf der Insel Biscoe doch so groß ist. Kreuzen Sie an, ohne den Datensatz zu kennen, welche Faktoren dafür NICHT verantwortlich sein könnten! Auf Biscoe leben vermutlich nicht nur eine Art von Pinguinen, sondern mindestens zwei Arten, welche morphologisch größere Unterschiede vorweisen. Es gibt einen Bias beim Jahr der Erhebung, weswegen vermutlich nur ältere Individuen bemessen worden sind. Bei den gefundenen Arten und der gemessenen Flügellänge gibt es natürlicherweise, abhängig von Alter, Körpergröße und Geschlecht, eine gewisse Varianz. Aufgabe 2: Streudiagramm Welche Aussage kann NICHT durch dieses Streudiagramm bekräftigt werden? Gentoo Pinguine haben im Durchschnitt größere Flügel und ein höheres Gewicht als Chinstrap oder Adelie Pinguine. Männliche Pinguine haben innerhalb einer Art ein durchschnittlich höheres Gewicht und eine größere Flügellänge. Es gibt keinen bildlichen Zusammenhang zwischen der Flügellänge und dem Gewicht. Wenn ein Pinguin etwa 5 Kilogramm schwer ist, handelt es sich sehr wahrscheinlich um einen Gentoo Pinguin. Welche Variablenkombinationen (auf der X und Y Achse) können auf einem solchen Punktdiagramm sinnvoll abgebildet werden? Insel und Gewicht [g] Geschlecht und Insel Gewicht [g] und Schnabellänge [mm] Schnabeltiefe und Geschlecht Was sagt der R² Wert in diesem Beispiel aus? Es besteht ein starker positiver Zusammenhang zwischen der Flügellänge und dem Gewicht. Es besteht ein starker negativer Zusammenhang zwischen der Flügellänge und dem Gewicht. Es besteht kein Zusammenhang zwischen der Flügellänge und dem Gewicht. Es besteht ein leichter positiver Zusammenhang zwischen der Flügellänge und dem Gewicht. Unten rechts wird in der Grafik der p Wert angegeben. Wofür steht dieser in diesem Beispiel? Der dargestellte Zusammenhang ist signifikant. Der dargestellte Zusammenhang ist nicht signifikant. Der dargestellte Zusammenhang hat keinerlei Aussagekraft. Der dargestellte Zusammenhang gilt ebenso für alle anderen Variablen in diesem Datensatz. Aufgabe 3: Statistik Sie wollen überprüfen, ob es bei den Adelie Pinguinen signifikante Unterschiede zwischen Männchen und Weibchen bezüglich des Gewichts gibt. Dazu setzen Sie den U‑Test nach Mann-Whitney ein: wilcox.test(data = adelie, body_mass_g ~ sex, paired = FALSE) Als Ergebnis erhalten Sie: > > Wilcoxon rank sum test with continuity correction > > data: body_mass_g by sex > W = 310.5, p-value 2.2e-16 > alternative hypothesis: true location shift is not equal to 0 Was sagt dieses Ergebnis aus? Es gibt keine signifikanten Unterschiede zwischen Männchen und Weibchen bezüglich des Gewichts. Es gibt signifikante Unterschiede zwischen Männchen und Weibchen bezüglich des Gewichts. Es gibt keine signifikanten Unterschiede zwischen Männchen und Weibchen bezüglich des Gewichts, jedoch bei anderen Variablen schon. Es gibt signifikante Unterschiede zwischen Männchen und Weibchen bezüglich des Gewichts und zusätzlich bei anderen Variablen. Es scheint, als würden mehr männliche Adelie Pinguine lieber auf Insel A verweilen und mehr weibliche Adelie Pinguine lieber auf Insel B. Nun möchten Sie herausfinden, ob diese Vorlieben mit dem Geschlecht der Pinguine zusammenhängen. Dies überprüfen Sie mit dem Chi-Quadrat Test: adelie - subset(penguins, species == "Adelie") chisq.test(table(adelie$island, adelie$sex)) Als Ergebnis erhalten Sie folgende Ausgabe: Pearson’s Chi-squared test data: table(adelie$island, adelie$sex) X-squared = 0.039458, df = 2, p-value = 0.9805Was würden Sie in dieses Ergebnis hineininterpretieren? Weibchen bevorzugen eine Insel, Männchen nicht. Männchen bevorzugen eine Insel, Weibchen nicht. Es gibt eine Bevorzugung bestimmter Inseln von den unterschiedlichen Geschlechtern. Es gibt keine Bevorzugung bestimmter Inseln von den unterschiedlichen Geschlechtern. Sie machen sich weitere Überlegungen und versuchen die Stärke des Zusammenhangs zwischen den Arten und den Inseln herauszustellen. Dies geschieht über folgenden Code mit dem Cramérs V: cramersV(table(penguins$species, penguins$island)) Als Ergebnis erhalten sie folgende Ausgabe: > 0.6598431Was würden Sie in das Ergebnis hineininterpretieren? Es besteht ein mittelstarker Zusammenhang zwischen den Arten und den Inseln. Es besteht ein sehr großer Zusammenhang zwischen den Arten und den Inseln. Es besteht kein Zusammenhang zwischen den Arten und den Inseln. Es besteht ein schwacher Zusammenhang zwischen den Arten und den Inseln. Sie machen eine letzte finale Untersuchung – und zwar, ob es einen Zusammenhang zwischen der Schnabeltiefe und der Schnabellänge gibt. Dafür nutzen Sie die „Pearson’s product-moment correlation“ und bekommen einen Wert von ‑0.2350529 raus.Wie interpretieren Sie dieses Ergebnis? Es besteht kein Zusammenhang zwischen Schnabellänge und Schnabeltiefe. Es besteht ein sehr geringer negativer Zusammenhang zwischen Schnabellänge und Schnabeltiefe. Es besteht ein sehr geringer positiver Zusammenhang zwischen Schnabellänge und Schnabeltiefe. Es besteht ein sehr hoher negativer Zusammenhang zwischen Schnabellänge und Schnabeltiefe.