Sie möchten an vier Standorten Ihres Unternehmens den Zusammenhang zwischen Drehzahl der Produktionsmaschine und Anzahl der Ausschuss-Teile bestimen. Sie messen die beiden Größen an den vier Standorten. Die Tabelle zeigt die Werte:
Drehzahl (X) und Ausschuss (Y) an den Standorten I bis IV
|
---|
Dann bestimmen Sie Mittelwert und Varianz jeder Größe. Schließlich berechnen Sie an jedem Standort den Zusammenhang zwischen Drehzahl und Ausschuss. Ihre Analyse zeigt: Die Werte sind an allen Standorten gleich:
Mittelwert, Streuung (Varianz) und Korrelation von Drehzahl und Ausschuss pro Standort
|
|||||||||||||||||||||||||||||||||||
Es sind also keine Unterschiede an den vier Standorten zu beobachten.
Richtig?
Wenn wir nur die Zahlen betrachten, scheint es, als wären alle vier Standorte nahezu identisch hinsichtlich der analysierten Werte.
Erst wenn wir Diagramme einsetzen, erkennen wir, dass an den vier Standorten grundverschiedene Vorgänge am Werk sind:
Am Standort I zeigt sich ein linearer Trend mit ordentlicher Fehlerstreuung: Tendenziell steigt der Ausschuss (Y) bei steigender Drehzahl (X), allerdings gibt es doch deutliche Abweichungen von dem durch die Gerade vorhergesagten Trend. Im nächsten Schritt könnte man überprüfen, welche Faktoren die Ausschusszahl noch beeinflussen, da offenbar die Drehzahl alleine noch nicht die Ausschusszahl präzise bestimmt.
Ohne Diagrammen wären uns wesentliche Informationen verborgen geblieben. Stattdessen hätten wir irrtümlich gedacht, alle vier Datensätze zeigen dieselben Muster. Erst eine grafische Datenanalyse hat die grundlegend verschiedenen Strukturen zu Tage gebracht.
Die Fallstudie zeigt, dass eine grafische Datenanalyse wesentliche Erkenntnisse über die Daten verdeutlichen kann. Daher sollte die grafische Datenanalyse Teil jeder statistischen Analyse sein.
Diees Fallstudie beruht auf der klassischen Analyse von Anscombe.