zur Startseite

Messunsicherheit - Abschätzung

Messunsicherheitsbudget nach GUM

Die Abschätzung der Messunsicherheit ist in zahlreichen Dokumenten beschrieben. Als zentrales Dokument ist hier der ISO-Guide to the expression of uncertainty in measurement (deutsch als DIN V ENV 13005) hervorzuheben, dessen Anwendung in vielen anderen Papieren erläutert ist. Für den Bereich der chemischen Analytik ist dies im EURACHEM/CITAC-Guide Quantifying Uncertainty in Analytical Measurement geschehen, der ebenfalls in deutscher Übersetzung vorliegt.

Der Prozess der Messunsicherheitsabschätzung kann in 4 Stufen eingeteilt werden:

  1. Spezifikation der Messgröße
  2. Identifizierung der Unsicherheitsquellen
  3. Quantifizierung der Unsicherheiten
  4. Umrechnung und Kombination der Unsicherheiten sowie Berechnung der erweiterten Unsicherheit

Das Verfahren zielt darauf ab, zunächst alle Unsicherheitsquellen zu erfassen, deren Beiträge dann als Standardunsicherheiten zu quantifizieren (d.h. faktisch als Standardabweichung), diese Einzelkomponenten zu einer Gesamtunsicherheit zusammenzufassen und schlussendlich durch Berechnung der erweiterten Unsicherheit das zugrunde liegende Vertrauensniveau auf einen relevanten Wert zu erhöhen.

Stufe 1 - Spezifikation der Messgröße

Bezogen auf eine Unsicherheitsschätzung erfordert die " Spezifikation der Messgröße" einerseits eine klare und unzweifelhafte Darstellung, was zu messen ist und andererseits einen quantitativen Ausdruck, der den Wert der Messgröße auf die Parameter, von denen er abhängt, bezieht. Nur so ist gewährleistet, dass möglichst alle Unsicherheitsquellen identifiziert werden können. Der “quantitative Ausdruck” soll als Formel beschreiben, wie ein Parameter mit der Messgröße zusammenhängt, z.B.

quantitativer Ausdruck

Parameter, die nicht direkt in das Messergebnis eingehen, aber dennoch zur Unsicherheit des Resultats beitragen, können als Faktoren einbezogen werden, die den Wert 1 mit einer zu quantifizierenden Unsicherheit haben. Aus dem Zusammenhang zwischen den Einzelparametern ist es möglich, den Einfluss der jeweiligen Größen auf die Gesamtunsicherheit zu erfassen.

Stufe 2 - Identifizierung der Unsicherheitsquellen

In der vorhergehenden Stufe wurde ermittelt, aus welchen Parametern sich die Messgröße zusammensetzt. Jetzt muss ermittelt werden, welche Quellen von Unsicherheiten diese Einzelparameter haben. Beispielhaft seien hier aufgeführt:

  • für Wägungen: z.B. Kalibrierunsicherheit der Waage, Präzision der Waage, Auftriebskorrektur
  • für Volumenmessungen: z.B. Kalibrierunsicherheit des Volumenmessgeräts, Ablese-/Füllgenauigkeit, Temperatur,
  • Reinheit der Chemikalien
  • für hoch genaue Messungen: Unsicherheiten der Tabellenwerte von Dichten, Atomgewichten etc.

Zur graphischen Darstellung der Zusammenhänge kann man so genannte Fischgrätdiagramme erstellen, die die Zusammenhänge darstellen, z.B. für eine Säure/Base-Titration:

Fischgrätdiagramm
(aus EURACHEM/CITAC-Guide)

Stufe 3 - Quantifizierung der Unsicherheiten

Die Unsicherheitsbeiträge sollen nun alle auf dem Vertrauensniveau der Standardabweichung quantifiziert werden. Bei Beiträgen, die aus statistischen Daten ermittelt werden oder bei denen aus anderen Gründen eine Normalverteilung angenommen werden kann, wird die Standardabweichung direkt als Standardmessunsicherheit verwendet. Werden Mittelwerte aus mehreren Messungen verwendet, ist hier die Standardabweichung des Mittelwerts (also s/√n) einzusetzen. Ist über die Verteilung der möglichen Werte nichts bekannt, z.B. bei der Spezifikation des Volumens eines Volumenmessgeräts oder bei der Reinheit einer Substanz, so kann eine Rechteckverteilung angenommen. Dann ergibt sich die Standardabweichung durch Division der halben Breite durch Wurzel aus 3. Ist die Wahrscheinlichkeit größer, dass sich der Wert in der Nähe der Mitte des angegebenen Intervals befindet, kann man auch eine Dreiecksverteilung annehmen. Dann ist die Standardabweichung gleich der halben Breite, dividiert durch Wurzel aus 6.

Stufe 4 - Umrechnung und Kombination der Unsicherheiten sowie Berechnung der erweiterten Unsicherheit

Die Standardunsicherheiten der Einzelparameter müssen jetzt in Unsicherheiten des Messergebnisses, bedingt durch den Einfluss der Unsicherheit des Einzelparameters umgerechnet werden. Hierbei muss also berücksichtigt werden, wie stark sich die Unsicherheit des Parameters auf die Unsicherheit des Ergebnisses auswirkt. Diese Empfindlichkeitskoeffizienten können für alle Parameter der Eingangsgleichung aus Stufe 1 durch partielle Differentation der Gleichung nach diesem Parameter bestimmt werden. In dem EURACHEM/CITAC-Guide ist auch eine numerische Berechnung beschrieben. Nach Multiplikation der oben quantifizierten Unsicherheitskomponente für den Parameter P mit seinem Empfindlichkeitskoeffizienten erhält man also den Standardunsicherheitsbeitrag für das Messergebnis, der durch den Parameter P bedingt ist.

Diese Standardunsicherheitsbeiträge werden nach dem Fehlerfortpflanzungsgesetz zu einer kombinierten Standardunsicherheit zusammengeführt:

Fehlerfortpflanzung

Um zu einem höheren Vertrauensniveau der Unsicherheitsangabe zu kommen, wird die kombinierte Standardunsicherheit nun noch mit einem Erweiterungsfaktor multipliziert. Der meist verwendete Erweiterungsfaktor k=2 ergibt ein Vertrauensniveau von ca. 95%.

Der NORDTEST-Ansatz

Das NORDTEST-Handbook for calculation of measurement uncertainty in environmental laboratories beschreibt ein Verfahren, das Daten aus der Routinequalitätssicherung und Validierung für die Abschätzung der Messunsicherheit nutzt. Hier wird also nicht versucht, das Messverfahren in möglichst kleine Schritte aufzuteilen und die Einzelunsicherheiten dann zu quantifizieren. Hier wird vielmehr versucht, alle Beiträge zu einer statistischen Abweichung und alle, die zu einer systematischen Abweichung führen, jeweils integrativ aus den o.g. Daten zu ermitteln. Dieser Ansatz wurde auch im Leitfaden zur Abschätzung der Messunsicherheit aus Validierungsdaten umgesetzt, der im Januar 2006 in den Deutschen Einheitsverfahren zur Wasser-, Abwasser- und Schlammuntersuchung unter der Bezeichnung A0-4 erschienen ist.

Die grundsätzliche Vorgehensweise ist in folgendem Diagramm dargestellt:

flussdiagramm

Ablauf der Messunsicherheitsermittlung nach DEV A0-4 (nach DEV A0-4)

Ermittlung der Unsicherheitskomponente durch zufällige Abweichungen uRw (Reproduzierbarkeit innerhalb des Labors)

Die Ermittlung sollte unter den Bedingungen stattfinden, die auch bei der Routineanalytik gelten. Das sind keine Wiederholbedingungen, aber auch keine Vergleichsbedingungen, sondern Zwischenbedingungen. Diese Bedingungen sind z.B. für Regelkarten erfüllt.

Möglichkeit 1: aus Kontrollproben, die die gesamte Analytik abdecken

Wenn die Kontrollprobe den gesamten analytischen Bereich abdeckt (inklusive der Probenvorbereitung) und die Matrices der Kontrollprobe und der Routineproben ähnlich sind, dann kann Rw direkt aus der Analytik der Kontrollproben (Regelkarte) abgeschätzt werden. Bei großen Konzentrationsbereichen sollten mehrere Kontrollproben unterschiedlicher Konzentration verwendet werden.

uRw = sRw

Möglichkeit 2: aus Kontrollproben für abweichende Matrices und/oder Konzentrationen

Wenn eine synthetische Kontrollprobe verwendet wird und die Matrices der Kontrollprobe und der Routineproben nicht ähnlich sind, dann müssen die Unsicherheitsbeiträge, die aus den verschiedenen Matrices resultieren, zusätzlich einbezogen werden Diese können aus der Wiederholbarkeit bei verschiedenen Matrices (Spannweitenregelkarte) abgeschätzt werden.

nordtest urw2

Möglichkeit 3: aus instabilen Kontrollproben

Wenn es keine stabile Kontrollprobe gibt (z.B. Sauerstoffmessung), dann können zunächst nur Unsicherheitsbeiträge aus der Wiederholbarkeit (Spannweitenregelkarte) abgeschätzt werden. Die Langzeit-Komponenten (von Serie zu Serie) müssen beispielsweise über eine Expertenschätzung aus der Erfahrung hinzugefügt werden.

urw3

Ermittlung der Unsicherheitskomponente durch systematische Methoden- und Laborabweichungen ubias

Diese kann abgeschätzt werden aus:

  • der Analytik von zertifizierten Referenzmaterialien
  • der Teilnahme an Ringversuchen oder
  • aus Wiederfindungsexperimenten.

Quellen für systematische Abweichungen sollten, wenn möglich, immer eliminiert werden. Wenn die systematische Abweichung signifikant ist und auf zuverlässigen Daten (z.B. ZRM) basiert, sollte das Messergebnis entsprechend korrigiert werden. Systematische Abweichungen können von der Matrix abhängen. Dies kann durch die Verwendung von in der Matrix unterschiedlichen Referenzmaterialien geprüft werden.

Die Unsicherheitskomponente besteht aus weiteren Einzelkomponenten:

  • die Abweichung selbst (z.B. in % Differenz vom Vorgabewert bzw. zertifizierten Wert) und ggf. die Unsicherheit der Bestimmung dieser Abweichung
  • die Unsicherheit des Vorgabewerts bzw. zertifizierten Werts uCref

ubias kann abgeschätzt werden aus der Kombination dieser beiden Komponenten:

ubias1

bzw. unter Einbeziehung der Unsicherheit der Bestimmung der Abweichung

ubias2

Möglichkeit 1: Verwendung eines zertifizierten Referenzmaterials

bias -  aus dem Mittelwert der Abweichungen der mehrfachen Analytik des Referenzmaterials

sbias - die Standardabweichung der mehrfachen Analytik des Referenzmaterials

nM - die Zahl der Messungen des Referenzmaterials

uCref - die Standardunsicherheit des Referenzmaterials (aus dem Zertifikat entnommen)

Möglichkeit 2: Verwendung mehrerer zertifizierter Referenzmaterialien

Die Analytik mehrerer Referenzmaterialien liefert mittlere Abweichungen für jedes Ref.-Material i. Aus diesen Abweichungen biasi und der Zahl der analysierten Referenzmaterialien sowie der Standardunsicherheit der zertifizierten Wertes lässt sich nach obiger Gleichung wiederum ubias berechnen.

Möglichkeit 3: Verwendung von Ringversuchsergebnissen

Die Unsicherheit des Vorgabewertes von Ringversuchen ergibt sich, falls der Vorgabewert aus dem Mittelwert der Teilnehmer errechnet wurde, zu:

mubias3

oder falls der Median oder robuste Schätzverfahren zur Berechnung eingesetzt wurden gemäß ISO 13528 zu:

 mubias4

Falls andere Methoden zur Festlegung des Vorgabewertes verwendet wurden, muss die Unsicherheit des Vorgabewertes beim Ringversuchsveranstalter erfragt werden.

Um ein einigermaßen klares Bild der Abweichungen eines Labor zu bekommen, sollte das Labor an mindestens sechs Ringversuchsproben innerhalb eines angemessenen Zeitraums analysiert haben.

Für die Analytik dieser Ringversuchsproben werden die jeweiligen Abweichungen biasi vom Vorgabewert ermittelt. Die Unsicherheiten der Vorgabewerten werden zur weiteren Berechnung gemittelt.

ubias ergibt sich dann zu:

mubias5

wobei nR für die Zahl der verwendeten Ringversuchsproben steht.

Möglichkeit 4: Verwendung von Ergebnissen von Wiederfindungsversuchen

Wiederfindungsexperimente werden häufig bei der Validierung oder Verifizierung von Analysenverfahren durchgeführt. Dabei wird eine Probe mit dem Analyten aufgestockt und sowohl vor als auch nach der Aufstockung gemessen. Aus der Differenz der Messungen und der zugegebenen Menge an Analyt kann dann die Wiederfindung berechnet werde. Falls keine systematische Abweichung auftritt, sollte der Mittelwert mehrerer Aufstockungsversuche bei 100 % liegen.

Selbstverständlich ist auch hier die Menge an zugegebenem Analyten mit einer Unsicherheit behaftet.

Als Beispiel sei hier die Aufstockung einer realen Probe mit einer Standardlösung (mit Herstellerzertifikat) mittels einer Mikropipette dargestellt. Die Unsicherheit der Konzentration der Standardlösung ergibt sich direkt aus dem Zertifikat des Herstellers. Dort finden wir die Angabe ± 1,2 % (Vertrauensniveau 95%). Zur Umrechnung auf eine Standardunsicherheit müssen wir diesen Wert durch 1,96 dividieren und erhalten näherungsweise:

uconc = 0,6 %

Für die Abschätzung der Unsicherheit des zugegebenen Volumens werden Angaben des Herstellers der Mikropipette verwendet. Dieser gibt als systematischen Fehler eine max. Abweichung von 1% an und als Wiederholbarkeit (zufälligen Fehler) eine Standardabweichung von max. 0,5 %. Die Angabe für die Wiederholbarkeit kann direkt verwendet werden, die max. Abweichung muss noch in eine Standardabweichung umgerechnet werden. Da alle Werte im Bereich ± 1 % als gleich wahrscheinlich angenommen werden müssen, wird ein Rechteckverteilung der möglich Werte angenommen. Für eine Rechteckverteilung mit halber Breite a berechnet sich die Standardabweichung zu a/√3. Für die Standardunsicherheit des zugegebenen Volumen ergibt sich damit:

mubias6

Die Gesamtunsicherheit der Aufstockung ist damit:

mubias7

Zur Berechnung der gesamten Unsicherheit der Abweichung werden jetzt noch die Abweichungen in den Wiederfindungsversuchen herangezogen. Für Wiederfindungen von z.B. 95%, 98%, 97%, 96%, 99% und 96% ergeben sich dann Abweichungen von 5%, 2%, 3%, 4%, 1% und 4%.

Wie oben berechnet man:

mu_ubias1

oder im geschilderten Beispiel:

mu_bias8

Ermittlung der Gesamtstandardunsicherheit

Die Gesamtstandardunsicherheit oder kombinierte Standardunsicherheit uc berechnet sich aus der Kombination der Unsicherheitskomponente durch zufällige Abweichungen uRw mit der Unsicherheitskomponente durch systematische Methoden- und Laborabweichungen ubias.

mu_comb

Dieser Wert gibt die geschätzte Unsicherheit des Messwerts auf dem Vertrauensniveau der Standardabweichung (ca. 68%) an. Zur Umrechnung auf ein höheres Vertrauensniveau kann dieser Wert mit einem Erweiterungsfaktor k multipliziert werden. Die Wahl von k entscheidet über die Höhe des Vertrauensniveaus.

mu_exp

In der Praxis hat sich meist ein Erweiterungsfaktor k=2 durchgesetzt. Dies entspricht einem Vertrauensniveau von ungefähr 95%.

Alternativansatz - direkte Nutzung von Vergleichsstandardabweichungen

Wenn die Daten für die gezeigten Berechnungen nicht vorliegen und wenn die Anforderungen an die Messunsicherheit nur relativ gering sind, dann kann eine grobe Schätzung der Messunsicherheit direkt aus der Vergleichsstandardabweichung von Ringversuchen abgeleitet werden. Dann wird

 uc = sR

gesetzt. Dabei ist sR die Vergleichsstandardabweichung aus einem Ringversuch.

Damit wird dann:

U = 2 ∙ SR

Diese Schätzung könnte - abhängig von der Qualität des Labors - zu hoch sein ("worst case"). Sie könnte aber wegen größerer Inhomogenitäten der realen Proben im Vergleich zum Ringversuch oder anderer Matrices auch zu niedrig sein.