Arbeitsblatt: Statistik in der Biologie

Material-Details

Einführung in die Statistik mit Beispielen zur Anwendung von t-Test und Spearman rank Korrelation.
Biologie
Anderes Thema
10. Schuljahr
3 Seiten

Statistik

19114
790
0
25.04.2008

Autor/in

Patricia Droz
Land: Schweiz
Registriert vor 2006

Downloads Arbeitsblätter / Lösungen / Zusatzmaterial

Die Download-Funktion steht nur registrierten, eingeloggten Benutzern/Benutzerinnen zur Verfügung.

Textauszüge aus dem Inhalt:

Statistik in der Biologie Die Wissenschaft schafft Wissen, und Wissen besteht aus Antworten auf Fragen. In den Naturwissenschaften drehen sich diese Fragen um Dinge, die zählbar oder messbar sind. Jede gezielte wissenschaftliche Untersuchung beginnt mit einer Frage. Vielleicht möchten Sie wissen, wie schwer Hausmäuse sind. Oder Sie interessieren sich für die Pulsrate von Menschen bei unterschiedlicher körperlicher Belastung usw. Mit nur subjektiven Gefühlen oder Annahme können Sie in den Naturwissenschaften nichts anfangen. Aus der gestellten Ausgangsfrage ergibt sich, welche Informationen Sie brauchen, um sie beantworten zu können. Fast immer sind dazu viele Beobachtungen oder Messungen nötig. In einem nächsten Schritt müssen Sie die notwendigen Daten sammeln und analysieren. Die Ergebnisse daraus erlauben es dann, Schlussfolgerungen anzustellen, welche ihre Ausgangsfrage beantworten. Für die Analyse der Daten benötigt man die Statistik. Dabei denkt man oft zuerst an die beschreibende Statistik wie Mittelwerte oder tabellarisch dargestellte Ergebnisse von Zählungen. Für den Forscher ist die analytische Statistik wesentlich wichtiger. Sie gibt Auskunft darüber, mit welcher Wahrscheinlichkeit ermittelte Unterschiede oder Gesetzmässigkeiten rein zufällig entstanden sein können. Dadurch wird es möglich, solche wissenschaftlichen Aussagen ein Stück weit zu verallgemeinern, die höchstwahrscheinlich nicht auf Zufall beruhen. Es lassen sich aber mit Hilfe der Statistik Behauptungen nicht zweifelsfrei beweisen; eine gewisse Unsicherheit/Fehlerwahrscheinlichkeit bleibt immer. Diese Fehlerwahrscheinlichkeit muss immer bei den Resultaten angegeben werden (Signifikanzniveau in der Biologie nach Vereinbarung bei 95%). Je nachdem was für Daten vorliegen und welche Fragestellung analysiert werden soll, wird der geeignete statistische Test angewendet. Es gibt eine grosse Anzahl solcher Tests, die, falls falsch angewendet, Ergebnisse liefern, die falsch sind. Die Auswahl des richtigen statistischen Tests ist also von grosser Bedeutung. Daten Datentypen: Nominaldaten: Daten können nur Kategorien zugeordnet werden die sich gegenseitig ausschliessen. Zum Beispiel: Geschlecht: männlich oder weiblich Farbe: dunkelrot, rot, rosa, weiss Ordinaldaten: können in geordnete Klassen eingeteilt werden. Zum Beispiel Altersklassen (5 – 10 jährige, 11 – 16 jährige, 17 – 22 jährige) Rangdaten (1,2,3,4,5,6) Intervalldaten: genau messbare Werte. Zum Beispiel Dauer in Sekunden für 100 Lauf Temperatur Gewicht Grösse abhängige – unabhängige Wichtig ist auch ob die Daten in einer Abhängigkeit zueinander sind. Bei unabhängigen Stichproben stammen die Werte von allen Proben von unterschiedlichen Individuen, die in keiner engeren Beziehung zueinander stehen. Zwischen abhängigen Stichproben besteht eine enge Zusammengehörigkeit. Zum Beispiel Herzfrequenz von 10 Personen vor und nach 100 Lauf. Jede Person liefert einen Vorher und Nachher-Wert. Einseitig – Zweiseitig Wird eine einseitige Fragestellung getestet, so hat der Forscher schon bei der Formulierung seiner Hypothese gewisse Vorstellungen über die Richtung des erwarteten Unterschieds. Zum Beispiel: Der Mittelwert von Stichprobe ist grösser als der von Stichprobe B. Bei einer zweiseitigen Fragestellung wird lediglich angenommen, dass ein Unterschied besteht, aber nicht in welcher Richtung. Statistische Tests t-Test Der t-test von Student ist ein Verfahren, das untersucht ob sich die Mittelwerte von zwei unabhängigen Stichproben aus Intervalldaten unterscheiden. Für den t-Test müssen einige Bedingungen erfüllt sein: 1. Die Stichproben müssen voneinander unabhängig sein. 2. Die Varianzen müssen gleich sein. 3. Die Stichproben müssen einer Normalverteilung folgen. t-Test Für unabhängige Stichproben Wir möchten wissen, ob sich zwei Gruppen und hinsichtlich eines Merkmals unterscheiden. Wir haben dazu das Merkmal (z.B. Körpergrösse) bei der Stichprobe n1 (z.B. 10 Frauen) und bei der Stichprobe n2 (10 Männer) gemessen. Person 1 2 3 4 5 6 7 8 9 10 Frauen [cm] 175 165 170 164 169 159 167 173 176 169 Männer [cm] 186 190 192 178 174 193 182 174 172 179 der Test liefert ein signifikantes Ergebnis: 0.0003. Das heisst, dass die Daten zeigen, dass mit einer Wahrscheinlichkeit von 99.97% die Schlussfolgerung richtig ist, dass Männer im Durchschnitt grösser sind als Frauen. Mit Hilfe der Seite können Sie die Daten prüfen und den p-Wert ermitteln. Spearman rank correlation Mit diesem Test wird untersucht ob es eine Korrelation (Zusammenhang) zwischen zwei Werten gibt. Wir möchten zum Beispiel wissen ob die Körpergrösse mit dem Gewicht korreliert. Die Annahme ist: je grösser der Mensch umso schwerer ist er. Die Daten sind also abhängig, da beide Datenmengen von denselben Menschen stammen. Es werden ja zwei Werte von derselben Person gemessen und miteinander verglichen. Person 1 2 3 4 5 6 7 8 9 10 Körpergrösse [cm] Gewicht [Kg] 175 165 170 164 169 159 167 173 176 169 65 61 64 59 63 56 62 64.5 66 63 Dann wir die Datenreihe der Körpergrösse nach Rang geordnet und die Datenreihe der Gewichte (kleinster Wert erhält minimalen Rang 1, grösster Wert erhält höchsten Rang (bei z.B. 10 Versuchspersonen Rang 10). Falls mehrere Personen denselben Wert haben, wird den entsprechenden Werten ein Durchschnittsrang gegeben. Beispiel: 2 Personen sind 63 Kg schwer, ergibt z.B. Rang (45)/2 4.5. Dann wird der Rangkorrelationswert rs berechnet. Dieser Wert rs kann Werte zwischen -1.0 und 1.0 annehmen. Negative Werte (negative Korrelation) bedeuten, dass kleiner wird, je grösser wird. Umgekehrt zeigen positive Werte (positive Korrelation) an, dass mit einer Zunahme von auch eine Zunahme von verbunden ist. Besteht keine Beziehung zwischen und y, hat der Korrelationswert rs einen Wert von 0, während ein Wert von 1 einen perfekten Zusammenhang anzeigt. Wenn davon ausgegangen wird „je grösser desto schwerer ist die Frage einseitig. Wenn ein Zusammenhang vermutet wird aber man weiss nicht in welcher Richtung „je grösser desto schwerer oder leichtert muss man zweiseitig testen. 10 9 rs 1 8 7 6 5 4 3 2 1 0 0 1 2 3 4 5 6 7 8 9 10