Statistik erleben

Diese Seite enthält Studienarbeiten aus den Studiengängen Elektrotechnik und Informatik der Hochschule Aalen.


Hinweis:

Für vier der Visualisierungen (Normalverteilte Zufallszahlen, Visualisierung des Vertrauensbereich, Vergleich von zwei Mittelwerten, Lineare Regression) gibt es JavaScript-Versionen, die direkt im Browser laufen. Die anderen Visualisierungen gibt es bisher nur als Java-Applets.

Hinweise zum Einsatz der Java-Applets:

  • Öffnen Sie das Applet über den jeweiligen Link (Achtung: nur Internet Explorer) oder laden Sie die zip-Datei mit allen Applets herunter und entpacken Sie sie.
  • Auf Ihren Rechner muss Java installiert sein (Java kann kostenlos von der Seite https://www.java.com/de/download/ heruntergeladen werden - wählen Sie die Version für Ihr Betriebssystem).
  • Wählen Sie in der Systemsteuerung Ihres Betriebssystems Java aus, reduzieren Sie im Reiter "Sicherheit" die Sicherheitsebene auf "Hoch" (weniger geht nicht mehr) und fügen Sie den Pfad zum Verzeichnis mit den entpackten Applets zur Ausnahmeliste hinzu. Falls Sie die Applets direkt im Browser (Internet-Explorer) ausführen wollen, fügen Sie die Seite http://wilhelm.kleppmann.de/ zur JAVA-Ausnahmeliste hinzu.
  • Wenn Sie die Applets heruntergeladen haben, öffnen Sie die html-Datei im Unterverzeichnis mit dem gewünschten Applet mit dem Internet Explorer (bei allen anderen gängigen Browsern werden Applets inzwischen leider vollständig blockiert).
  • Sie müssen zunächst "Geblockte Inhalte" zulassen und anschließend nochmals "Das Risiko akzeptieren und diese Anwendung ausführen" (Häkchen setzen und ausführen). Erst dann erscheint das Start-Icon des jeweiligen Applets und Sie können es starten.

Es tut mir leid, dass all dies so umständlich geworden ist, aber inzwischen sind Applets wegen ihrer Risiken gefürchtet. Es gibt daher keinen einfacheren Weg mehr (früher konnte man sie mit einem beliebigen Browser einfach anklicken). Nach Bestehen all dieser Mutproben wünsche ich Ihnen aber viel Freude und Aha-Erlebnisse mit den Simulationen. Ich weiß von keinen Risiken, kann aber keine Haftung übernehmen.

Der „Zentrale Grenzwertsatz“ besagt, dass die Verteilung des Mittelwerts von n unabhängigen Zufallszahlen aus einer beliebigen Verteilung mit endlichem Mittelwert μ und endlicher Standardabweichung σ sich mit zunehmendem n immer mehr einer Normalverteilung mit Mittelwert μ und der Standardabweichung σ/√n annähert.

Mit diesem Applet können Sie beobachten,

  • wie sich die Verteilung der mittleren Augenzahl von n Würfeln mit zunehmendem n immer mehr einer Normalverteilung annähert,
  • wie die Breite dieser Normalverteilung mit zunehmendem n immer kleiner wird (der Mittelwert streut umso weniger, je größer der Stichprobenumfang ist),
  • wie sich mit zunehmender Anzahl von Würfen die relative Häufigkeit der Würfelergebnisse immer mehr der berechneten Wahrscheinlichkeit annähert.

Der Zentrale Grenzwertsatz ist der Grund für die Bedeutung der Normalverteilung in der Statistik: Häufig ist man an der Verteilung von Mittelwerten interessiert, und auch die Zufallsstreuung eines Einzelwertes ist häufig die Summe vieler unabhängiger Einzelbeiträge und damit näherungsweise normalverteilt.


Zum Applet

Dieses Applet stellt die Dichte der Binomial- und Poissonverteilung dar. Ziel des Applets ist es, zu zeigen,

  • wie die Form der Verteilungsdichten von den jeweiligen Parametern abhängt,
  • was ein Zufallsstreubereich ist.

Die Parameter der Verteilungen können eingegeben oder mit Schiebern verändert werden - das Applet zeigt dann die Form der Verteilungsdichte. Zusätzlich können Wertebereiche vorgegeben werden - das Applet hebt den gewählten Bereich dann grafisch hervor und berechnet die Wahrscheinlichkeit, mit der ein Ergebnis in diesem Bereich liegt.


Zum Applet

Dieses Applet zeigt die Dichte der Binomialverteilung für einen von Ihnen vorgegebenen Stichprobenumfang n und Anteil p, zusammen mit einem Stichprobenergebnis x und den dazu gehörenden Vertrauensbereichen. Ziel des Applets ist es, zu verdeutlichen, dass

  • die Stichprobenergebnisse x streuen,
  • man aus jeder Stichprobe einen anderen Vertrauensbereich enthält, aber 95% der 95%-Vertrauensbereiche den wahren Anteil p enthalten,
  • die 99%-Vertrauensbereiche immer breiter als die 95%-Vertrauensbereiche sind,
  • die Vertrauensbereiche umso schmäler sind, je größer der Stichprobenumfang n ist,
  • bei p=0,5 die Verteilung und damit der Vertrauensbereich besonders breit ist; je näher p bei 0 bzw. 1 liegt, desto schmäler werden beide.

Die Parameter der Verteilungen können eingegeben oder mit Schiebern verändert werden - das Applet zeigt dann die Schaubilder, welche sich aus den veränderten Werten ergeben.


Zum Applet

Dieses Applet stellt die Dichte der Normalverteilung, t-Verteilung, Chi-Quadrat-Verteilung und F-Verteilung dar. Ziel des Applets ist es zu zeigen,

  • wie die Form der Verteilungsdichten von den jeweiligen Parametern abhängt,
  • dass die Wahrscheinlichkeit für ein Ergebnis in einem bestimmten Bereich die Fläche unter der Verteilungsdichte ist und
  • was ein Zufallsstreubereich ist.

Die Parameter der Verteilungen können eingegeben oder mit Schiebern verändert werden - das Applet zeigt dann die Form der Verteilungsdichte. Zusätzlich können Wertebereiche vorgegeben werden - das Applet hebt den gewählten Bereich dann grafisch hervor und berechnet die Wahrscheinlichkeit, mit der ein Einzelwert in diesem Bereich liegt. Umgekehrt kann die Wahrscheinlichkeit vorgegeben werden und das Applet berechnet den zugehörigen Zufallsstreubereich und stellt ihn grafisch dar.


Zum Applet

Mit Hilfe dieses Applets kann der Anwender viele Stichproben aus der selben Grundgesamtheit erzeugen. Die Grundgesamtheit wird durch den Mittelwert und die Standardabweichung bestimmt. Der Umfang der Stichproben und deren Anzahl werden ebenfalls vom Anwender vorgegeben. Die grafischen Darstellungen sollen zeigen, dass

  • die Stichprobenergebnisse streuen
  • Mittelwerte weniger streuen als Einzelwerte
  • die Verteilung der Einzelwerte, Mittelwerte, Varianzen und Standardabweichungen über viele Stichproben berechnet werden kann
  • Mittelwert und Varianz erwartungstreue Schätzwerte sind, Varianz (1/n) und Standardabweichung aber nicht.

Dieses Applet zeigt die Verteilung des kleinsten (x(1)), zweitkleinsten (x(2)) usw. bis zum größten Wert (x(n)) einer Stichprobe vom Umfang n, wenn die Einzelwerte normalverteilt sind. Die Verteilung der Einzelwerte, der Stichprobenumfang n und der Rangwert i können verändert werden.

Das Applet soll grafisch zeigen und plausibel machen,

  • was ein Rangwert x(i) ist,
  • dass die Verteilung der Rangwerte schmäler ist als die Verteilung aller Einzelwerte (und zwar umso schmäler, je größer der Stichprobenumfang n ist),
  • dass die Verteilung der Rangwerte in der Mitte schmäler ist als die Verteilung des kleinsten bzw. größten Wertes,
  • dass die Verteilung der Rangwerte asymmetrisch ist (nicht normalverteilt), obwohl alle Werte zusammen normalverteilt sind.


Zum Applet

Das Wahrscheinlichkeitsnetz ist eine grafische Möglichkeit zu überprüfen, ob vorgegebene Daten zu einer angenommenen Verteilung passen oder nicht. Die Achsen werden so skaliert, dass die angenommene Verteilung als Gerade dargestellt wird.

Mit diesem Applet können eigene und simulierte Daten wahlweise in ein Wahrscheinlichkeitsnetz für normalverteilte, für logarithmisch normalverteilte und für weibullverteilte Merkmalswerte eingetragen werden. Zufallszahlen mit vorgegebener Verteilung können erzeugt und dargestellt werden. So können Sie beobachten, dass

  • Daten aufgrund der Zufallsstreuung immer von der Geraden abweichen,
  • diese Abweichungen aber mit zunehmendem Stichprobenumfang n immer kleiner werden, wenn die Stichprobe aus der jeweiligen Verteilung entnommen wurde,
  • abweichende Verteilungen zu einer Abweichung von der Geraden führen,
  • diese Abweichung bei kleinem Stichprobenumfang n aber nicht von der Zufallsstreuung unterscheidbar ist.

Für die Simulation kann als Verteilung auch eine beschnittene Normalverteilung (entsteht durch Aussortieren von Teilen außerhalb der Spezifikation) oder eine Mischverteilung (Teile von zwei unterschiedlichen Herstellern, Linien, Maschinen werden zusammengemischt) vorgegeben werden. So können Sie testen, ob solche typischen Abweichungen von einer Normalverteilung erkannt werden.


Zum Applet

Versuchsergebnisse, Messwerte usw. streuen aufgrund zufälliger Einflüsse. Daher unterliegen auch die aus mehreren Ergebnissen berechneten Mittelwerte und Standardabweichungen dem Zufall. Aus jeder Messreihe (Stichprobe) erhält man einen etwas anderen Mittelwert.

Doch wo liegt der wahre, leider normalerweise unbekannte Mittelwert der Grundgesamtheit (d.h. der Mittelwert, den man erhielte, wenn man den Versuch unter immer gleichen Bedingungen unendlich oft wiederholen könnte)? Der 95%-Vertrauensbereich (=Konfidenzbereich) für den Mittelwert ist ein Bereich, der bei durchschnittlich 95% der Stichproben den wahren Mittelwert der Grundgesamtheit enthält.

Das folgende Applet erzeugt fünfzig Stichproben mit einer frei wählbaren Anzahl (max. 9999) von Zufallszahlen. Die Einzelwerte der Stichproben stammen aus einer Normalverteilung, deren Mittelwert und Standardabweichung vorgegeben werden. Das Applet berechnet dann für jede Stichprobe Mittelwert und Standardabweichung dieser Stichprobe, sowie den 95%- und 99%-Vertrauensbereich für den Mittelwert. Alle Vertrauensbereiche werden grafisch dargestellt.

Bitte achten Sie auch auf folgende Punkte:

  • Aus jeder Stichprobe erhält man einen anderen Vertrauensbereich, da Mittelwert und Standardabweichung der Stichprobe dem Zufall unterliegen.
  • Durchschnittlich 95% der 95%-Vertrauensbereiche (bzw. 99% der 99%-Vertrauensbereiche) enthalten den wahren Mittelwert (das Maximum der Kurve).
  • Die 99%-Vertrauensbereiche sind immer breiter als die 95%- Vertrauensbereiche.
  • Je größer der Stichprobenumfang, desto schmäler sind die Vertrauensbereiche im Allgemeinen. Dennoch streut die Breite, weil Standardabweichung der Stichprobe streut.

Häufig sollen zwei Lieferchargen, Fertigungsverfahren, Prozess- oder Produktvarianten verglichen werden. Man möchte wissen, ob sich die wahren aber unbekannten Mittelwerte der beiden Gruppen (=Grundgesamtheiten) unterscheiden oder nicht. Dazu wird aus jeder Gruppe eine Stichprobe entnommen.

Die Differenz der Stichprobenmittelwerte ist ein Schätzwert für den wahren Unter­schied der Mittelwerte der Grundgesamtheiten Δµ – sie unterliegt aber der Zufallsstreuung. Daher stellt sich die Frage: Unterscheiden sich die Mittelwerte der beiden Grundgesamtheiten wirklich oder ist der beobachtete Unterschied der Stich­proben­mittelwerte nur auf die Zufalls­streuung zurückzuführen?

Im folgenden Applet wird unterstellt, dass Stichproben vom gleichen Umfang n (einstellbar im Bereich 2 bis 30) aus zwei Grundgesamtheiten gezogen werden, deren Mittelwerte sich um die wahre Differenz Δµ unterscheiden (einstellbar im Bereich von 0 bis 10). Die wahre Standardabweichung σ ist für beide Grundgesamtheiten gleich (einstellbar im Bereich 1 bis 3), ihr Wert ist dem Anwender aber normalerweise unbekannt.

Im Applet kann zwischen zwei Darstellungen umgeschaltet werden:

  • Verteilungen enthält die Verteilung
    • der Einzelwerte (blau, abschaltbar, Normalverteilung wird angenommen)
    • die Verteilung der "Differenz der Mittelwerte", wenn Δμ=0 (zentriert um 0) und
    • die Verteilung der "Differenz der Mittelwerte" für den vorgegebenen Wert für Δμ.
  • Stichprobenergebnisse enthält die aus den Ergebnissen von je 20 Stichproben berechnete Differenz der Mittelwerte und 95%- und 99%-Vertrauensbereiche (=Konfidenzbereiche) für diese Differenz.

Vergleichen Sie die beiden Darstellungen und beobachten Sie interaktiv, wie sich die Veränderung der Parameter auswirkt. So erleben Sie den Mittelwertvergleich (=Zwei-Stichproben-t-Test) und verstehen nachher hoffentlich besser, worauf bei der Planung zu achten ist und was die Ergebnisse bedeuten.

Mit diesem Applet können Sie Punkte in ein Koordinatensystem einzeichnen und die zugehörige Regressionsgerade berechnen und darstellen lassen - oder Sie verwenden vorgegebene Beispiele als Ausgangspunkt. Zeichnen Sie eine Gerade von Hand ein und vergleichen Sie Ihre Gerade mit der Regressionsgeraden. Das Ziel ist, die Summe der quadrierten Abweichungen zu minimieren. Als Hilfe können Sie die quadratischen Abweichungen von der Geraden darstellen lassen. Lassen Sie den Vertrauensbereich für die Regressionsgerade und den Vorhersagebereich für Einzelwerte berechnen und beobachten Sie, wie sich die Bereiche unterscheiden und wie sie sich mit den Punkten verändern. 

Berechnen Sie die Residuen und Kennzahlen wie Hebel und Cook-Distanz und erleben Sie, wie diese sich mit den Daten verändern. Und beobachten Sie die Zerlegung der Summe der quadrierten Abweichungen in einen Anteil QREGRESSION, den die Regressionsgerade erklärt, und die Reststreuung QREST. Zerlegen Sie QREST dann weiter in eine Abweichung des jeweiligen Mittelwerts QLACK OF FIT und reine Zufallsstreuung um den jeweiligen Mittelwert QPURE ERROR. Im Vergleich zu QREST wird auch PRESS berechnet und visualisiert - hier wird die Gerade immer ohne den jeweils betrachteten Punkt berechnet und somit die Prognosefähigkeit der Geraden geprüft.

Mit Hilfe dieses Applets kann der Anwender Punktewolken in ein Koordinatensystem einzeichnen und die zugehörigen Streuellipsen berechnen und visualisieren. Dazu werden Kovarianzmatrix, Eigenvektoren, Eigenwerte, Schwerpunkt und Halbachsen der Ellipse berechnet. Zudem kann für einen vorgegebenen Punkt die Mahalanobisdistanz vom Schwerpunkt der Punktewolke berechnet werden.

Statt Daten von Hand einzugeben, können mit einem Zufallszahlengenerator auch 2-dimensional normalverteilte Daten erzeugt werden. Damit soll dem Anwender ein Gefühl für die Wirkung der Zufallsstreuung und für die Bedeutung der Parameter einer 2-dimensionalen Normalverteilung vermittelt werden.


Zum Applet

Thumb evoplogo

Ziel von EVOP ist die kontinuierliche Verbesserung von Fertigungsprozessen. Als Beispiel wird hier ein Spritzgießprozess betrachtet.

Aufgabenbeschreibung:

Ein Kunststoff - Spritzgießprozess wurde an einer Pilotanlage entwickelt und anschließend auf die Produktionsanlage übertragen.

Ziel ist es, Teile mit

  • möglichst geringem Verzug (höchstens 0,02 mm, optimal sind Werte < 0,01 mm) und
  • möglichst hoher Schlagzähigkeit (mindestens 8 kJ/m², optimal sind Werte > 10 kJ/m²)

herzustellen.

Wichtige Prozessparameter sind die Einspritzgeschwindigkeit der Masse in die Form (und damit die Zeit für das Füllen der Form) und der Druck nach dem Füllen der Form (Nachdruck). In der Pilotanlage wurde ermittelt, dass folgende Werte zu geringem Verzug und hoher Schlagzähigkeit führen:

  • Einspritzgeschwindigkeit: 30 bis 35 mm/sec
  • Nachdruck: 300 bis 350 bar.

Beim Übertragen in die Fertigung stellen Sie fest, dass die Mindestforderungen für Verzug und Schlagzähigkeit knapp erreicht werden.
Sie könnten nun als Sollwerte die Spezifikationsmitten (Einspritzgeschwindigkeit 32,5 mm/sec undNachdruck 325 bar) festlegen und sich freuen, dass Sie einen gerade noch ausreichend guten Prozess haben. Oder Sie suchen nach Möglichkeiten, Ihren Prozess zu verbessern. Dann verändern Sie Einspritzgeschwindigkeit und Nachdruck systematisch im Rahmen der Spezifikation.

Sie beobachten, wie Verzug und Schlagzähigkeit sich mit den Prozessparametern verändern. Da Sieinnerhalb der Spezifikation bleiben, verändern sich die Zielgrößen natürlich auch nur geringfügig.Das bedeutet, dass Sie bei jeder Parameterkombination verkaufsfähige Produkte erhalten.
Aber natürlich ist Ihren Messwerten auch eine Zufallsstreuung überlagert (Messfehler, kleine, nicht kontrollierbare Veränderungen der Umgebungsbedingungen und diverser anderer Prozessparameter). Daher sollten Sie den Versuchsplan mehrmals durchlaufen bis Sie sich sicher sind, dass die Veränderungeines oder beider Prozessparameter in eine bestimmte Richtung wirklich eine Verbesserung bringt. Als Entscheidungshilfe wird der Effekt der Prozessparameter und die Breite des 95%-Vertrauensbereichesberechnet - wenn der Betrag eines Effektes größer ist als die Breite des Vertrauensbereiches, dann können Sie sich ziemlich sicher sein, dass der beobachtete Effekt echt ist und nicht nur zufällig. Man sagt, der Effekt ist statistisch signifikant. Signifikante Effekte sind rot gekennzeichnet und im 2D-Diagramm als Pfeil dargestellt.

Wenn Sie überzeugt sind, dass die Veränderung eines oder beider Prozessparameter in eine bestimmte Richtung zu einer Verbesserung der Zielgröße(n) führen, dann verändern Sie die Spezifikation vorsichtig in diese Richtung und beobachten den Prozess erneut.
Wiederholen Sie den Vorgang und beobachten Sie, wie Sie immer besser werden - bis Ihnen das Ergebnis gut genug istoder bis keine weitere Verbesserung mehr möglich ist. Sie haben dann erlebt, wie Sie durch vorsichtige Veränderung der Prozessparameter während der laufenden Fertigung nicht nur Ihr Produkt herstellen können, sondern auch Wissen über Verbesserungsmöglichkeiten erhalten. So können Sie immer besser werden.


Zum Applet

Ziel der Shewhart-Qualitätsregelkarten ist es, Veränderungen in der laufenden Fertigung möglichst schnell zu erkennen, um dann nach den Ursachen der Veränderung suchen und sie wieder beseitigen zu können. Das Applet zeigt:

  • wie die x- und s-Regelkarte funktionieren
  • warum sie mit zunehmendem Stichprobenumfang n immer empfindlicher werden
  • was die Eingriffswahrscheinlichkeit PE ist und wie sie zustande kommt und
  • dass eine kleine Veränderung der Fertigung meist erst nach mehreren Stichproben erkannt wird, während eine große Veränderung meist schon bei der nächsten Stichprobe erkannt wird.

Das Applet simuliert 50 Stichproben des Umfangs n aus einer Grundgesamtheit mit ggf. veränderten Werten µ und σ und stellt die Ergebnisse zusammen mit den aus den Vorlaufswerten µ0 und σ0 berechneten x- bzw. s-Regelkarten dar. µ0 und σ0, µ und σ, sowie n können mit Schiebern verändert werden. Im Applet kann zwischen drei Darstellungen umgeschaltet werden:

  • x-Karte enthält
    • im oberen Bild die x-Karte, deren Grenzen für µ0 und σ0 berechnet wurden, mit Stichprobenergebnissen aus einer ggf. veränderten Fertigung mit µ und σ
    • im mittleren Bild die Eingriffswahrscheinlichkeit PE, d.h. die Wahrscheinlichkeit dafür, dass ein Stichprobenmittelwert aus der veränderten Fertigung außerhalb der Eingriffsgrenzen liegt (d.h. dass die Veränderung erkannt wird)
    • im unteren Bild wird erläutert, wie die Eingriffswahrscheinlichkeit zustande kommt
  • s-Karte enthält dieselben drei Bilder, nur für die s-Karte.
  • Sprung in Fertigung zeigt die übliche Kombination aus x- und s-Karte, wobei die Fertigung am Anfang ungestört ist (µ0 und σ0), an einer zufälligen Stelle aber auf µ und σ springt – Aufgabe ist es dann, die Sprungstelle zu erkennen.


Zum Applet