Understanding PT statistics
Technické články | 2024 | EurachemInstrumentace
Proficiency testing (PT) je klíčovým nástrojem zajišťování kvality v laboratořích, poskytuje nezávislé porovnání výsledků mezi laboratořemi a pomáhá odhalit systematické chyby i nesoulad v metodách. Porozumění statistickým parametrům v PT zprávě — zejména odhadu polohy (location), rozptylu (dispersion) a standardní nejistotě polohy — je nezbytné pro korektní interpretaci výsledků a pro informované rozhodování při výběru a hodnocení PT schémat.
Cílem přehledu je vysvětlit, jaké statistiky PT poskytovatelé obvykle uvádějí, jak je interpretovat a jaké jsou hlavní silné a slabé stránky běžných odhadů polohy a rozptylu. Dokument shrnuje doporučení ISO 13528 a klíčové body z Eurachem guideline pro účastníky kvantitativních PT schémat.
PT statistiky obecně popisují dvě základní vlastnosti dat: polohu (střední hodnotu) a rozptyl (šířku rozložení). Používané odhady polohy zahrnují aritmetický průměr, medián a robustní metody (např. Algorithm A, Hampel estimator). Odhady rozptylu zahrnují klasické směrodatné odchylky a robustní alternativy jako MADe (scaled median absolute deviation), nIQR (normalized interquartile range), robustní standardní odchylky založené na Algorithm A nebo Qn/Q metody. ISO 13528 doporučuje použití robustních odhadů při přítomnosti odlehlých hodnot nebo nesymetrie dat. Standardní nejistota polohy se pro aritmetický průměr počítá jako s/sqrt(p), kde s je klasická směrodatná odchylka a p počet výsledků; pro robustní odhady se podle ISO 13528 obvykle používá konzervativní faktor 1,25: u = 1,25 * s*/sqrt(p), kde s* je robustní odhad rozptylu.
- Polohu lze odhadovat různými způsoby; volba ovlivní citlivost na odlehlé hodnoty a na vícevrcholová rozložení. Aritmetický průměr je efektivní pro normální data, ale citlivý na odlehlé hodnoty. Robustní odhady (medián, Algorithm A, Hampel) odolávají odlehlým hodnotám lépe.
- Rozptyl lze hodnotit klasickou směrodatnou odchylkou nebo robustními metrikami (MADe, nIQR, Qn). Robustní metody jsou vhodné, pokud jsou v datech odlehlé výsledky nebo když symetrie nelze předpokládat. Některé konverzní faktory (např. přepočet MAD na MADe nebo IQR na nIQR) předpokládají normální rozložení a mohou proto zkreslovat, pokud k tomuto předpokladu nedochází.
- U malých souborů dat jsou všechny odhady polohy i rozptylu méně spolehlivé; interpretace by měla být opatrná a reportovaná nejistota větší.
- Významný rozdíl mezi odhadnutou polohou skupiny a externím referenčním hodnotám může indikovat bias v analytických postupech používaných účastníky; PT poskytovatel může také reportovat oddělené odhady polohy pro různé analytické metody.
- Pomoc účastníkům PT vybrat vhodné schéma: výběr PT schématu by měl zohlednit použité statistické metody poskytovatele (robustní vs. klasické), zejména pokud jsou očekávány odlehlé výsledky nebo heterogenní analytické postupy.
- Informace o tom, jak byl stanoven x_pt (assigned value), u(x_pt) a σ_pt, umožňují laboratorním specialistům správně vyhodnotit svoji výkonnost a identifikovat systematické odchylky.
- Robustní statistiky snižují vliv individuálních odlehlých výsledků na hodnocení a jsou často vhodnější pro reálná interlaboratorní data, kde může docházet k chybám nebo rozdílným metodikám.
- Reportovaná standardní nejistota polohy pomáhá rozhodnout, zda se odhad polohy statisticky liší od referenční hodnoty nebo od individuálních výsledků.
- Standardizace transparentního reportingu: zvýšené požadavky na PT poskytovatele, aby jasně uváděli, jak byly odhady polohy a rozptylu získány a jaké konverzní faktory byly použity.
- Rozšíření robustních a adaptivních statistických metod v PT analýzách, včetně algoritmů lépe odolných vůči vícevrcholovým rozložením a heterogenitě dat.
- Aplikace bayesovských přístupů a modelů vícerozměrné robustní analýzy pro lepší kvantifikaci nejistot a pro zahrnutí externích informací (např. historických dat nebo referenčních materiálů).
- Využití strojového učení a algoritmů pro detekci a třídění odlehlých výsledků a pro automatizované rozdělení dat podle použitých metod, což umožní přesnější odhady polohy pro homogenní skupiny metod.
- Digitalizace a transparentní datová rozhraní (API) pro snadnější auditovatelnost výpočtů a automatizované reportování σ_pt a u(x_pt).
Správné porozumění statistickým parametrům v PT zprávě je nezbytné pro validní interpretaci porovnání výsledků mezi laboratořemi. Volba mezi klasickými a robustními odhady závisí na povaze dat (přítomnost odlehlých hodnot, symetrie, počet výsledků) a na cílech hodnocení. Transparentní informace o způsobu stanovení assigned value, příslušné nejistotě a štandardní odchylce pro hodnocení výkonnosti umožňují účastníkům učinit podložené závěry o validitě jejich metod a o možných zdrojích biasu.
Ostatní
ZaměřeníOstatní
VýrobceSouhrn
Význam tématu
Proficiency testing (PT) je klíčovým nástrojem zajišťování kvality v laboratořích, poskytuje nezávislé porovnání výsledků mezi laboratořemi a pomáhá odhalit systematické chyby i nesoulad v metodách. Porozumění statistickým parametrům v PT zprávě — zejména odhadu polohy (location), rozptylu (dispersion) a standardní nejistotě polohy — je nezbytné pro korektní interpretaci výsledků a pro informované rozhodování při výběru a hodnocení PT schémat.
Cíle a přehled dokumentu
Cílem přehledu je vysvětlit, jaké statistiky PT poskytovatelé obvykle uvádějí, jak je interpretovat a jaké jsou hlavní silné a slabé stránky běžných odhadů polohy a rozptylu. Dokument shrnuje doporučení ISO 13528 a klíčové body z Eurachem guideline pro účastníky kvantitativních PT schémat.
Použitá metodika
PT statistiky obecně popisují dvě základní vlastnosti dat: polohu (střední hodnotu) a rozptyl (šířku rozložení). Používané odhady polohy zahrnují aritmetický průměr, medián a robustní metody (např. Algorithm A, Hampel estimator). Odhady rozptylu zahrnují klasické směrodatné odchylky a robustní alternativy jako MADe (scaled median absolute deviation), nIQR (normalized interquartile range), robustní standardní odchylky založené na Algorithm A nebo Qn/Q metody. ISO 13528 doporučuje použití robustních odhadů při přítomnosti odlehlých hodnot nebo nesymetrie dat. Standardní nejistota polohy se pro aritmetický průměr počítá jako s/sqrt(p), kde s je klasická směrodatná odchylka a p počet výsledků; pro robustní odhady se podle ISO 13528 obvykle používá konzervativní faktor 1,25: u = 1,25 * s*/sqrt(p), kde s* je robustní odhad rozptylu.
Hlavní výsledky a diskuse
- Polohu lze odhadovat různými způsoby; volba ovlivní citlivost na odlehlé hodnoty a na vícevrcholová rozložení. Aritmetický průměr je efektivní pro normální data, ale citlivý na odlehlé hodnoty. Robustní odhady (medián, Algorithm A, Hampel) odolávají odlehlým hodnotám lépe.
- Rozptyl lze hodnotit klasickou směrodatnou odchylkou nebo robustními metrikami (MADe, nIQR, Qn). Robustní metody jsou vhodné, pokud jsou v datech odlehlé výsledky nebo když symetrie nelze předpokládat. Některé konverzní faktory (např. přepočet MAD na MADe nebo IQR na nIQR) předpokládají normální rozložení a mohou proto zkreslovat, pokud k tomuto předpokladu nedochází.
- U malých souborů dat jsou všechny odhady polohy i rozptylu méně spolehlivé; interpretace by měla být opatrná a reportovaná nejistota větší.
- Významný rozdíl mezi odhadnutou polohou skupiny a externím referenčním hodnotám může indikovat bias v analytických postupech používaných účastníky; PT poskytovatel může také reportovat oddělené odhady polohy pro různé analytické metody.
Přínosy a praktické využití metody
- Pomoc účastníkům PT vybrat vhodné schéma: výběr PT schématu by měl zohlednit použité statistické metody poskytovatele (robustní vs. klasické), zejména pokud jsou očekávány odlehlé výsledky nebo heterogenní analytické postupy.
- Informace o tom, jak byl stanoven x_pt (assigned value), u(x_pt) a σ_pt, umožňují laboratorním specialistům správně vyhodnotit svoji výkonnost a identifikovat systematické odchylky.
- Robustní statistiky snižují vliv individuálních odlehlých výsledků na hodnocení a jsou často vhodnější pro reálná interlaboratorní data, kde může docházet k chybám nebo rozdílným metodikám.
- Reportovaná standardní nejistota polohy pomáhá rozhodnout, zda se odhad polohy statisticky liší od referenční hodnoty nebo od individuálních výsledků.
Budoucí trendy a možnosti využití
- Standardizace transparentního reportingu: zvýšené požadavky na PT poskytovatele, aby jasně uváděli, jak byly odhady polohy a rozptylu získány a jaké konverzní faktory byly použity.
- Rozšíření robustních a adaptivních statistických metod v PT analýzách, včetně algoritmů lépe odolných vůči vícevrcholovým rozložením a heterogenitě dat.
- Aplikace bayesovských přístupů a modelů vícerozměrné robustní analýzy pro lepší kvantifikaci nejistot a pro zahrnutí externích informací (např. historických dat nebo referenčních materiálů).
- Využití strojového učení a algoritmů pro detekci a třídění odlehlých výsledků a pro automatizované rozdělení dat podle použitých metod, což umožní přesnější odhady polohy pro homogenní skupiny metod.
- Digitalizace a transparentní datová rozhraní (API) pro snadnější auditovatelnost výpočtů a automatizované reportování σ_pt a u(x_pt).
Závěr
Správné porozumění statistickým parametrům v PT zprávě je nezbytné pro validní interpretaci porovnání výsledků mezi laboratořemi. Volba mezi klasickými a robustními odhady závisí na povaze dat (přítomnost odlehlých hodnot, symetrie, počet výsledků) a na cílech hodnocení. Transparentní informace o způsobu stanovení assigned value, příslušné nejistotě a štandardní odchylce pro hodnocení výkonnosti umožňují účastníkům učinit podložené závěry o validitě jejich metod a o možných zdrojích biasu.
Reference
- Brookman B., Mann I. (eds.): Eurachem Guide: Selection, Use and Interpretation of Proficiency Testing (PT) Schemes, 3rd ed., 2021.
- Eurachem leaflet: Understanding PT performance assessment.
- ISO 13528:2022 - Statistical methods for use in proficiency testing by interlaboratory comparison.
Obsah byl automaticky vytvořen z originálního PDF dokumentu pomocí AI a může obsahovat nepřesnosti.
Podobná PDF
Understanding PT performance assessment
2024||Technické články
Understanding PT performance assessment Introduction This leaflet is intended to help participants in quantitative proficiency testing (PT) schemes to better understand the performance assessment made by the PT provider [1-4]. Performance assessment parameters Assigned value In order to assess individual…
Klíčová slova
assigned, assigneduncertainty, uncertaintyunitless, unitlessproficiency, proficiencyassessment, assessmentvalue, valueparticipant, participantscore, scoreparticipants, participantsperformance, performanceassessments, assessmentsdeviation, deviationxpt, xptspt, sptagrees
How can proficiency testing help my laboratory?
2022||Technické články
How can proficiency testing help my laboratory? Introduction Proficiency testing (PT) is applicable to quantitative, qualitative and interpretative assessments, but this leaflet will concentrate on PTs for quantitative tests. Participation in PT is an essential part of the quality assurance…
Klíčová slova
spt, sptbias, biasproficiency, proficiencyscores, scoresscore, scorelaboratory, laboratoryperformance, performanceplausibility, plausibilityassessment, assessmentunsatisfactory, unsatisfactoryrounds, roundsquestionable, questionableestablished, establishedzeta, zetaeurachem
Proficiency testing schemes for sampling
2020||Technické články
Proficiency testing schemes for sampling Introduction This leaflet gives some hints on the application of ISO/IEC 17043 [1] for PT providers organising PT schemes for sampling. If there is a comparison between participants and a mechanism for performance evaluation which…
Klíčová slova
sampling, samplingschemes, schemeseee, eeebehalf, behalfminimising, minimisingsite, siteparticipant, participantorganizing, organizingjudge, judgeeurachem, euracheminterpreted, interpretedprovider, providertransportation, transportationprocedure, procedureproficiency
Selecting the right proficiency testing scheme for my laboratory
2022||Technické články
Selecting the right proficiency testing scheme for my laboratory Introduction Participation in Proficiency Testing (PT) is an important part of assuring the quality of test results in a laboratory. The time and effort required can be costly, especially for laboratories…
Klíčová slova
provider, providerproficiency, proficiencylaboratory, laboratoryparticipants, participantsprocedures, proceduresscheme, schemedna, dnastrategies, strategiestesting, testingnumber, numbertest, testmeasurement, measurementmeetings, meetingscriteria, criteriafitness