94 lines
3.2 KiB
Plaintext
94 lines
3.2 KiB
Plaintext
GEMINI
|
|
|
|
## Berechnung von Cohen's d in Python: Eine Schritt-für-Schritt-Anleitung
|
|
|
|
**Cohen's d** ist ein Maß für die Effektstärke, das häufig in der Statistik verwendet wird, um die Größe eines Unterschieds zwischen zwei Gruppen zu quantifizieren. In Python können wir diese Berechnung recht einfach mit Hilfe von Bibliotheken wie NumPy und SciPy durchführen.
|
|
|
|
### 1. Installation der notwendigen Bibliotheken
|
|
Falls du NumPy und SciPy noch nicht installiert hast, kannst du dies über pip tun:
|
|
|
|
```bash
|
|
pip install numpy scipy
|
|
```
|
|
|
|
### 2. Importieren der Bibliotheken
|
|
```python
|
|
import numpy as np
|
|
from scipy import stats
|
|
```
|
|
|
|
### 3. Berechnen von Cohen's d
|
|
Die Formel für Cohen's d lautet:
|
|
|
|
```
|
|
d = (M1 - M2) / s_pooled
|
|
```
|
|
|
|
wobei:
|
|
* M1 und M2 die Mittelwerte der beiden Gruppen sind
|
|
* s_pooled die gepoolte Standardabweichung ist
|
|
|
|
Hier ist eine Python-Funktion, die Cohen's d berechnet:
|
|
|
|
```python
|
|
def cohen_d(x, y):
|
|
"""Calculates Cohen's d for independent samples.
|
|
|
|
Args:
|
|
x: The first sample.
|
|
y: The second sample.
|
|
|
|
Returns:
|
|
Cohen's d.
|
|
"""
|
|
|
|
nx = len(x)
|
|
ny = len(y)
|
|
dof = nx + ny - 2
|
|
|
|
# Calculate the pooled standard deviation
|
|
sx = np.std(x, ddof=1)
|
|
sy = np.std(y, ddof=1)
|
|
s_pooled = np.sqrt(((nx-1)*sx**2 + (ny-1)*sy**2) / dof)
|
|
|
|
# Calculate Cohen's d
|
|
d = (np.mean(x) - np.mean(y)) / s_pooled
|
|
|
|
return d
|
|
```
|
|
|
|
### 4. Beispiel
|
|
```python
|
|
# Erstelle zwei Beispiel-Datensätze
|
|
group1 = [1, 2, 3, 4, 5]
|
|
group2 = [6, 7, 8, 9, 10]
|
|
|
|
# Berechne Cohen's d
|
|
d = cohen_d(group1, group2)
|
|
print("Cohen's d:", d)
|
|
```
|
|
|
|
**Interpretation von Cohen's d:**
|
|
* |d| < 0.2: Sehr kleiner Effekt
|
|
* 0.2 ≤ |d| < 0.5: Kleiner bis mittlerer Effekt
|
|
* 0.5 ≤ |d| < 0.8: Mittlerer bis großer Effekt
|
|
* |d| ≥ 0.8: Sehr großer Effekt
|
|
|
|
**Wichtiger Hinweis:**
|
|
* **Unabhängige Stichproben:** Die obige Funktion ist für unabhängige Stichproben konzipiert. Für abhängige Stichproben (z.B. bei wiederholten Messungen) gibt es eine leicht abgewandelte Formel.
|
|
* **Normalverteilung:** Cohen's d setzt normalerweise eine annähernd normale Verteilung der Daten voraus.
|
|
* **Ausreißer:** Ausreißer können die Berechnung von Cohen's d stark beeinflussen. Es ist ratsam, die Daten vor der Berechnung auf Ausreißer zu überprüfen.
|
|
|
|
**Zusätzliche Funktionen in Bibliotheken:**
|
|
Einige Python-Bibliotheken wie `pingouin` bieten bereits eingebaute Funktionen für die Berechnung von Effektstärken wie Cohen's d an und können zusätzliche Statistiken berechnen.
|
|
|
|
**Weitere Überlegungen:**
|
|
* **Effektgröße:** Cohen's d ist nur eine von vielen Effektstärken. Die Wahl der geeigneten Effektstärke hängt von der Forschungsfrage und den Daten ab.
|
|
* **Konfidenzintervalle:** Es ist oft hilfreich, ein Konfidenzintervall für Cohen's d zu berechnen, um die Unsicherheit der Schätzung zu quantifizieren.
|
|
|
|
**Zusammenfassung:**
|
|
|
|
Mit dieser Anleitung und dem bereitgestellten Python-Code kannst du Cohen's d effektiv berechnen und interpretieren. Denk daran, die Voraussetzungen für die Anwendung von Cohen's d zu überprüfen und gegebenenfalls Anpassungen vorzunehmen.
|
|
|
|
**Möchtest du noch mehr über Cohen's d oder andere Effektstärken erfahren?**
|