>PO - Verteilung würde ich tippen.
An dieser Stelle muß man das Fehlergeschehen und seine Wahrnehmung genau beschreiben. Handelt es sich z.B. um defekte Lötstellen, von denen z.B. 200 pro Teil vorhanden sind und von denen auch mal mehrere pro Teil reklamiert werden. Oder unterscheidest Du nicht so feinfühlig, sprich kaputt ist kaputt, egal was dahintersteckt. Wenn der Fall a) zutrifft, dann sind 20 Lötdefekte ein seltenes Ereignis gegenüber 16000 Lötstellen, die Poissonverteilung ist sicherlich das richtige Modell zur Fehlerbeschreibung. Beim Fall b) sollte aber besser auf die Binomialverteilung (BV)zurückgegriffen werden.
Wie Du vielleicht weißt, lassen sich die Verteilungsmodelle zum Beschreiben von zählbaren Merkmalen aufeinander zurückführen. Sozusagen die >Eierlegende-Woll-Milch-Sau< der Statistik für attibutive Problemfälle ist die Hypergeometrische Verteilung. Bei Ihr sind keine Randbedingungen zu beachten, sie ist aber von vier Veränderlichen abhängig und nummerisch sehr anspruchsvoll. Kann man bei der Fragestelllung von einem konstanten Fehleranteil ausgehen, dann wird_s mathematisch schon etwas einfacher, die Binomialverteilung wird verwendet. (Konstanten Fehleranteil bei der Stichprobenentnahme kann erzwungen werden, wenn jedes Teil nach der Überprüfung wieder in das zu prüfende Los zurück gelege wird, daher auch >Verteilung mit Zurücklegen<). Und so läßt sich durch weitere Randbedingungen das mathematische Modell immer weiter vereinfachen bis hin zur Normalverteilung, die in der standardisierte Form nur noch von der Fehlerzahl x abhängig ist.
Zwischen diesen Verteilungsmodellen gibt es also Übergänge.
Im vorliegenden Fall stellt sich also die Frage: Binomialverteilung (BV)oder Poissonverteilung (PV)? Ein sinnvoller Übergang kann nach folgender Grenzbedingung entschieden werden.
PV, wenn p < [n/3200]^(1/1,2)gilt.
In Deinem vorliegenden Fall liegt p(A) bei 25\%, ist also deutlich über diesem Grenzwert von 4,6\% und somit dürfte die PV den Sachverhalt nicht sonderlich gut beschreiben. Die BV sollte hier bevorzugt herangezogen werden. (Ich rechne aber nachfolgend mit der PV, da sie einfacher zu handeln ist)
: Ich weiß das alle 800 Stück NIO sind und so sehe ich sie als GG (=Grundgesamtheit). Da ich aber nicht die Zeit habe, mir alle anzusehen arbeite ich nach der ISO 2859:
: Prüfniveu 2=J, J bei 800 Stk. --> n= 80Stk. "J" ist der Kennbuchstabe den ich anhand der ersten Tabelle (Tabelle 13 lt. W. Timischl 2. Auflage) ermittelt habe. Anhand der zweiten Tabelle (Tabelle 14a lt. W. Timischl 2. Auflage) habe ich meinen Stichprobenumfang mit "J festgelegt".
Interpretiere ich Deine Fragestellung richtig: Du möchtest abschätzen, wie stark die einzelnen Fehler an diesem Ausschußlos beteiligt sind?
: Und nun möchte ich aufgrund meiner gezogenen Stichprobe auf die GG schließen bzw. hochrechnen. Ich meine damit: Wenn ich von 800 Stk. 10\% prüfe und davon haben 20 den Fehler "A" und 60 den Fehler "B", schließe ich daraus das in der GG die Fehlerverteilung wie folgt aussieht: "200" mit Fehler "A" und "600" mit Fehler "B". Meine Frage nun, ist das so korrekt?
200 Fehler vom Typ A bzw 600 vom Typ B sind in der Tat die besten >SCHÄTZWERTE<, die auf der Basis Deiner Stichprobenergebnisse gemacht werden können. Ziehst Du erneut eine Stichprobe von 80 Teilen, dann ist es reiner Zufall, wenn wieder 20 Fehler vom Type A auftauchen, daher der Name >Schätzwert