Wie errechnet sich die Stichprobengröße für die Verpackungsvalidierung?
In den meisten Fällen wird es jedem Unternehmen überlassen, die Stichprobengröße zu bestimmen und nach einer statistisch gültigen Begründung zu begründen (Referenz ISO 11607-1, Abschnitt 4.3)1. Diese schwer fassbare, aber entscheidende Frage wird im Folgenden diskutiert. Diese Informationen können dann als Ausgangspunkt für die Ermittlung und Begründung des Stichprobenumfangs verwendet werden.
Der erste Schritt bei der Auswahl einer angemessenen Stichprobengröße ist die Risikoberechnung. Risiko ist die „Kombination aus dem Eintritt eines Schadens und der Schwere des Schadens, der aufgrund eines Versagens eintreten kann“.
Ein gängiger Ansatz zur Berechnung von Risiken ist als Risk Priority Number (RPN) bekannt2. Die RPN ist eine Berechnung basierend auf einem zugewiesenen Schweregrad, Auftreten und Erkennungswert, wobei jeder Kategorie ein Wert von 1 bis 10 zugewiesen wird. Für den Schweregrad wäre ein Wert von „10“ der schwerwiegendste. Für das Auftreten bedeutet ein Wert von „10“ die höchste Wahrscheinlichkeit. Für die Erkennung bedeutet ein Wert von „10“ den am schwierigsten zu erkennenden Wert. Es ist wichtig zu beachten, dass die RPN kein Maß für das Risiko des Herstellers ist; es handelt sich vielmehr um eine Risikopriorität. Um dieses Konzept besser zu verstehen, beziehen Sie sich auf die nachstehenden Definitionen jeder Kategorie, wie sie von FMEA-FMECA skizziert werden3:
Die RPN wird dann berechnet, indem die zugewiesene Zahl aus jeder Kategorie genommen und miteinander multipliziert wird. Im High-End-Bereich bedeutet eine Endpunktzahl von 1000 (bei einer Punktzahl von 10 für jede Kategorie), dass ein Fehler für den Endbenutzer katastrophal sein kann. Auf der anderen Seite des Spektrums bedeutet eine Punktzahl von 1 eine sehr geringe Auswirkung auf den Endbenutzer, wenn ein Fehler auftritt.
Zum Beispiel kann ein Produkt mit einem hohen Schweregrad (z. B. ein Fehler könnte katastrophal sein) eine Bewertung von 10 ausgestellt werden, was im schlimmsten Fall der Fall ist. Das gleiche Produkt kann eine hohe Erkennungsbewertung haben (bei schwer zu erkennenden Fehlern), daher wird ein Wert von 8 zugewiesen. Schließlich wird davon ausgegangen, dass ein Fehler selten ist und nicht oft auftritt. Daher wird eine Häufigkeitsstufe von 4 zugewiesen. Diese Werte werden dann multipliziert, was zu einem RPN von 320 führt. Nachdem der RPN berechnet wurde, kann er anhand von der folgenden Tabelle 1 in einem dreistufigen Ansatz mit niedrigem, mittlerem oder hohem Risiko kategorisiert werden4.
Tabelle 1: Korrelation des Risikos mit Vertrauen und Zuverlässigkeit
Der RPN-Wert wurde nun bestimmt und kann mit Hilfe von Konfidenz- und Zuverlässigkeitsintervallen mit der Stichprobengröße korreliert werden. Die Zuverlässigkeit bestimmt, wie viele Einheiten die Pass/Fail-Kriterien erfolgreich erfüllen. Das Konfidenzintervall ist ein Ausdruck der Unsicherheit über eine unbekannte Konstante. Eine Zuverlässigkeit von 90 % bedeutet beispielsweise, dass 90 von 100 Einheiten alle Kriterien für bestanden/nicht bestanden erfüllen, und ein Vertrauensintervall von 95 % zeigt, dass ein Hersteller zu 95 % sicher ist, dass er weniger als oder gleich 10 echte Fehler haben wird. In Fortsetzung des oben begonnenen Beispiels (RPN 320) haben wir festgestellt, dass ein 95 %-Konfidenz-/95 %-Zuverlässigkeitsniveau die geeignete Stichprobengröße für dieses Risikoniveau bestimmt. Durch Eingabe der Werte in ein nicht parametrisches Binomial-Zuverlässigkeitsdiagramm nach Methode 1 (siehe die folgende Tabelle 2) zusammen mit der Anzahl der zulässigen Testfehler liefert die Tabelle dann die Mindeststichprobengröße. Es sollte beachtet werden, dass nichtparametrische binomiale Zuverlässigkeitsdemonstrationstests weit verbreitet für Tests verwendet werden, die attributive oder qualitative Daten sind.
Tabelle 2: listet die entsprechenden Stichprobengrößen für die angegebenen Konfidenzintervalle und Zuverlässigkeit auf. Die in dieser Tabelle aufgeführten Stichprobengrößen gelten für null Ausfälle oder Fehler.
Betrachtet man das hypothetische Beispiel, das weiter oben beschrieben wurde, eine RPN von 320 und ein Konfidenzintervall von 95 % und eine Zuverlässigkeit von 95 %, bedeutet dies eine Stichprobengröße von 59 ohne zulässige Fehler. Wenn zulässige Testfehler in die Gleichung aufgenommen werden, erhöht sich die Stichprobengröße, die erforderlich ist, um die gleichen Vertrauens- und Zuverlässigkeitsintervalle zu erreichen, erheblich. Schließlich müssen Hersteller bedenken, dass es weitere Faktoren gibt, die sich ebenfalls auf die Stichprobengröße auswirken können, wie die Herstellungskosten des Produkts und die Komplexität des Designs. Herstellern wird dringend empfohlen, sich mit Verpackungsexperten zu beraten, um die Kriterien für bestanden/nicht bestanden zu bestimmen und für jedes ihrer Produkte eine Stichprobengröße und eine Begründung anzugeben. Dies wird dazu beitragen, etwaige Probleme bei möglichen Audits in diesem Bereich zu mildern. Die Auswahl einer geeigneten Stichprobengröße kann komplex sein, da es keine branchenweit akzeptierten Werte gibt, die allgemein gültig sind. Unterschiedliche Produkte bergen unterschiedliche Risiken und erfordern daher unterschiedliche Stichprobengrößen. Durch das Verständnis der technischen Aspekte des Produkts, des Herstellungsprozesses und des mit seiner Verwendung verbundenen Risikos können die ersten Schritte zur Bestimmung und Begründung einer angemessenen Stichprobengröße unternommen werden.
Die oben beschriebene Herangehensweise zur Berechnung des Stichprobengröße dient vor allem für attributive Prüfungen die man im physikalischem Sinne nicht messen kann, wie die Dichtheitsprüfung nach ASMT F3039 bzw. ASTM F1929, die visuelle Prüfung nach ASTM F1886/F1886M und den Bubble Test nach ASTM F2096.
Falls es sich bei der Verpackungsprüfung um qualitative Aussagen handelt wie die Zugprüfung nach ASTM F88/F88M bzw. EN 868-5 oder die Berstdruckprüfung nach ASTM F1140/F1140M bzw. ASTM F2054/2054M ist auch eine andere Herangehensweise möglich, die wir Ihnen im Folgenden erläutern.5
Dabei werden zunächst die Mittelwerte und Standardabweichung bereits zuvor getesteter Packmittel ermittelt und die folgende Formel verwendet:
X – k*S > unteres Akzeptanzkriterium
X = Mittelwert der Stichproben
k = Faktor
S = Standardabweichung
Unteres Akzeptanzkriterium = 1,5 N bei 15 cm breiten Ausschnitten
Wenn man die Formel nach k umstellt ergibt sich Folgendes:
k = (X – unteres Akzeptanzkriterium) / S
Nehmen wir an es wurde eine Zugprüfung an 10 Prüfmustern durchgeführt und der Mittelwert der 10 Stichproben lag bei 3,51 N/15 mm und die Standardabweichung bei 0,5 N/15 mm. Das untere Akzeptanzkriterium für die Zugprüfung liegt bei 1,2 N/15 mm, siehe EN 868-5.
Dann wäre die Formel folgende:
k = (3,51 – 1,2) / 0,5
k = 4,62
Gemäß Tabelle C.2 der ISO 16269-6, einem Konfidenzintervall von 95 % und einer Zuverlässigkeit von 95 % liegt der ermittelte k-Faktor (4,62) zwischen n= 4 bzw. 5, somit müsste der Stichprobenumfang bei mindestens 5 liegen. Dies stellt natürlich aus ökonomischer Sicht einen klaren Vorteil dar, da eine sehr viel geringe Anzahl an Testmustern zur Prüfung vorliegen muss und weniger Testungen in diesem Beispiel statistisch ausreichend sind. Der Nachteil ist, dass diese Überlegungen initial vor der eigentlichen Validierung stattfinden und verifiziert werden müssen.
Umgekehrt ist es retrospektiv möglich nachzuweisen inwiefern bereits vorliegende Messungen einer Validierung diesen Aspekten entsprochen haben. Hierzu verwendet man die initiale Formel:
X – k*S > unteres Akzeptanzkriterium
Beispielsweise wurden 10 Beutel in der Zugprüfung geprüft, dabei wurde ein Mittelwert von 3,20 N/15 mm erreicht und eine Standardabweichung von 0,4 N/ 15 mm. Gemäß Tabelle C.2 der ISO 16269-6 liegt der k-Faktor (Konfidenzintervall von 95 % und einer Zuverlässigkeit von 95 %) bei 2,9110, das untere Akzeptanzkriterium bei 1,2 N/15 mm.
Daher wird wie folgt gerechnet:
3,2 – 2,9110 * 0,4 > 1,2
2,0356 > 1,2
Es kann retrospektiv davon ausgegangen werden, dass die Stichprobengröße ausreicht um ein Konfidenzintervall von 95 % und eine Zuverlässigkeit von 95 % einzuhalten
Referenzen:
1 Packaging for terminally sterilized medical devices – Part 1: Requirements for materials, sterile barrier systems and packaging systems. ISO 11607-1
2 Ombu Enterprises PDF “Understanding Risk Priority numbers”
3 https://en.wikipedia.org/wiki/Failure_mode_and_effects_analysis
4 https://www.packagingdigest.com/testing/determining-valid-sample-size-package-testing
(deutsche Übersetzung von Brandon Muhlestein and Pal Khangaldy | Dec 12, 2017)
Übersicht Wissensportal