Überlappung zweier Normalverteilungen

Wie kann man den Überlappungsgrad zweier Normalverteilungen einfach bestimmen?

Eine häufige Frage in der Datenanalyse - oder zumindest im Statistikkurs - lautet: Wie stark überlappen sich zwei Normalverteilungen? Das Ausmaß bzw. der Anteil der Überlappung kann als Indikator für z.B. die Effektstärke einer Intervention verstanden werden, welche zwei Gruppen bzw. Populationen trennt (z.B. neues Vertriebstraining vs. altes Vertriebstraining).

 

Aber wie berechnet sich der Überlappungsbereich? Klar, eine einfach Möglichkeit lautet, das Integral des (im Diagramm) rot eingefärbten Bereichs zu berechnen.

 

Aber versuchen wir es mit einer einfachen Überlappung, die ohne Integrieren auskommt.

 

Überlegen wir zuerst, an welcher Stelle sich der Schnittpunkt der beiden Kurven befindet. Genau: Auf halben Weg zwischen den beiden Maxima (Erwartungwerte bzw. "Mittelwerte"). Und wie "breit" ist dieser Bereich? Natürlich genau entsprechend der Differenz der Maxima. 

 

Wir nehmen also die Hälfte dieses Wertes, addieren ihn zum linken Mittelwert (schwarze Kurve) und voila! Wir haben die X-Koordinate des Schnittpunkt S

 

Nun können wir den Flächenanteil der Normalverteilung (linke, schwarze Kurve) zu diesem Schnittpunkt S aus einer Tabelle ablesen bzw. von einer Software ausgeben lassen. Achtung: Meistens wird der Bereich von Minus Unendlich bis zu S angegeben ("Fläche links"). 

Wir brauchen aber den Bereich von S bis Plus Unendlich ("Fläche rechts"). Aber keine Bange: 1 - "Fläche links" gibt uns den gesuchten Wert "Fläche rechts".

Wir addieren beide Wahrscheinlichkeiten (Flächen) und - da ist sie, die Überlappungsfläche bzw. -wahrscheinlichkeit.

 

Wenn die Streuungen der beiden Verteilungen identisch sind, sind die linke und die rechte rote Fläche gleich groß. Dann reicht es, eine Hälfte zu berechnen und diesen Wert dann zu verdoppeln.

Hier noch einige Überlappungswerte für "typische" d-Werte (Cohen):

Druckversion Druckversion | Sitemap
© Data-Divers