Visualization

Fallstudie: Wozu brauche ich eine Visualisierung meiner Daten?

Sie möchten an vier Standorten Ihres Unternehmens den Zusammenhang zwischen Drehzahl der Produktionsmaschine und Anzahl der Ausschuss-Teile bestimen. Sie messen die beiden Größen an den vier Standorten. Die Tabelle zeigt die Werte:

Drehzahl (X) und Ausschuss (Y) an den Standorten I bis IV

I

II

III

IV

X1

Y1

X2

Y2

X3

Y3

X4

Y4

10

8,04

10

9,14

10

7,46

8

6,58

8

6,95

8

8,14

8

6,77

8

5,76

13

7,58

13

8,74

13

12,74

8

7,71

9

8,81

9

8,77

9

7,11

8

8,84

11

8,33

11

9,26

11

7,81

8

8,47

14

9,96

14

8,1

14

8,84

8

7,04

6

7,24

6

6,13

6

6,08

8

5,25

4

4,26

4

3,1

4

5,39

19

12,5

12

10,84

12

9,13

12

8,15

8

5,56

7

4,82

7

7,26

7

6,42

8

7,91

5

5,68

5

4,74

5

5,73

8

6,89

             

 

Dann bestimmen Sie Mittelwert und Varianz jeder Größe. Schließlich berechnen Sie an jedem Standort den Zusammenhang zwischen Drehzahl und Ausschuss. Ihre Analyse zeigt: Die Werte sind an allen Standorten gleich:

 

Mittelwert, Streuung (Varianz) und Korrelation von Drehzahl und Ausschuss pro Standort

Mittelwert

9,00

7,50

9,00

7,50

9,00

7,50

9,00

7,50

Varianz

11,00

4,13

11,00

4,13

11,00

4,12

11,00

4,12

Korrelation

0,82

 

0,82

 

0,82

 

0,82

 
               
                 
                 

 

Es sind also keine Unterschiede an den vier Standorten zu beobachten.

 

Richtig?

 

Wenn wir nur die Zahlen betrachten, scheint es, als wären alle vier Standorte nahezu identisch hinsichtlich der analysierten Werte.

 

Erst wenn wir Diagramme einsetzen, erkennen wir, dass an den vier Standorten grundverschiedene Vorgänge am Werk sind:

Am Standort I zeigt sich ein linearer Trend mit ordentlicher Fehlerstreuung: Tendenziell steigt der Ausschuss (Y) bei steigender Drehzahl (X), allerdings gibt es doch deutliche Abweichungen von dem durch die Gerade vorhergesagten Trend. Im nächsten Schritt könnte man überprüfen, welche Faktoren die Ausschusszahl noch beeinflussen, da offenbar die Drehzahl alleine noch nicht die Ausschusszahl präzise bestimmt.

 

In Standort II zeigt sich ein ganz anderes Bild: Mit steigender Drehzahl nimmt die Ausschuss-Zahl erst zu, um dann bei höheren Drehzahlen wieder abzunehmen. Dieser Zusammenhang lässt darauf schließen, dass die Maschine im mittleren Drehzahlbereich unrund läuft und technisch geprüft werden sollte.

 

An Standort III wird die Ausschusszahl "eigentlich" sehr exakt durch die Drehzahl vorhergesagt. Allerdings gibt es in einem Drehzahlbereich einen extrem hohen Ausschuss. Diese Analyse legt nahe, den betreffenden Drehzahlbereich der Maschine genauer zu prüfen und etwaige Fehlermomente zu entfernen.

 

An Standort IV läuft die Produktion fast nur im geringen Drehzahlbereich - mit recht unterschiedlicher Ausschusszahl. Einmal lief die Produktion in hohem Drehzahlbereich mit einer erwartungsgemäß hohen Ausschusszahl.

 

 

 

Ohne Diagrammen wären uns wesentliche Informationen verborgen geblieben. Stattdessen hätten wir irrtümlich gedacht, alle vier Datensätze zeigen dieselben Muster. Erst eine grafische Datenanalyse hat die grundlegend verschiedenen Strukturen zu Tage gebracht.

 

Die Fallstudie zeigt, dass eine grafische Datenanalyse wesentliche Erkenntnisse über die Daten verdeutlichen kann. Daher sollte die grafische Datenanalyse Teil jeder statistischen Analyse sein.

 

Diees Fallstudie beruht auf der klassischen Analyse von Anscombe.

Druckversion Druckversion | Sitemap
© Data-Divers