مشخصه های عملکردی متد
در این پست مشخصه های عملکردی متد که در صحه گذاری روش های آزمون به کار می روند را با جزییات تشریح خواهیم کرد.
گزینش پذیری
اصطلاح ها و تعاریف
گزینش پذیري تجزیه اي به «میزانی که متد تا آن مقدار بتواند جهت تعیین آنالیت هاي خاص در مخلوط ها یا ماتریکس ها، بدون مزاحمت دیگر سازنده هاي با رفتار مشابه، مورد استفاده قرار گیرد،» مرتبط است. تعاریف موجود در سندهاي گوناگون کم و بیش با این تفسیر مطابقت دارند. آیوپاك اصطلاح «گزینش پذیری» را پیشنهاد می کند در حالی که در بخش هاي دیگر نظیر بخش دارویی، از اصطلاح «ویژگی» یا «ویژگی تجزیه اي» استفاده می شود. مورد آخر جهت اجتناب از سردرگمی و اشتباه با اصطلاح «ویژگی تشخیصی» پیشنهاد می شود که در آزمایشگاه طبی استفاده می شود.
اثرات مزاحمت ها
به طور کلی می توان گفت که متدهاي تجزیه شامل یک مرحله اندازه گیري هستند که ممکن است بعد یا قبل از یک مرحله جدا سازي انجام شود. معمولا در مرحله اندازه گیري، غلظت آنالیت به شکل مستقیم اندازه گیري نمی شود، بلکه به جاي آن یک خاصیت ویژه (براي مثال، شدت نور) به طور کمی تعیین می شود. بنابراین، اثبات این نکته که خاصیت اندازه گیري شده فقط از آنالیت ناشی شده و عامل مزاحم دیگري که از لحاظ شیمیایی یا فیزیکی شبیه آنالیت است در آن نقش ندارد، بسیار مهم است، چرا که این وضع باعث ایجاد بایاس در نتیجه اندازه گیري خواهد شد. لذا براي بهبود گزینش پذیري سیستم اندازه گیرنده، لازم است تا قبل از مرحله اندازه گیري یک مرحله جدا سازي انجام شود.
مزاحمت ها، ممکن است با کاهش یا افزایش سیگنال نسبت داده شده به اندازه ده باعث ایجاد بایاس شوند. اندازه اثر براي ماتریکس معین معمولاً متناسب با سیگنال است و در نتیجه گاهی اثر «تناسبی» نامیده می شود. این اثر شیب منحنی تابع کالیبراسیون را تغییر داده، اما بر عرض از مبدأ تأثیري ندارد. این اثر، اثر «چرخشی» نیز نامیده می شود.
«اثر انتقالی» یا «ایستا» از یک سیگنال تولیدي توسط عوامل مزاحم موجود در محلول آزمایشی ناشی می شود، لذا آن مستقل از غلظت آنالیت می باشد. اغلب از آن با نام مزاحمت «پس زمینه» یا «خط پایه» یاد می شود. این اثر بر روي شیب تأثیر نداشته و عرض از مبدأ تابع کالیبراسیون را تغییر می دهد. معمولا اثرات تناسبی و انتقالی به طور همزمان مشاهده می شوند و متد افزایش استاندارد فقط می تواند اثرات تناسبی را تصحیح کند.
ارزیابی گزینش پذیری
براي متدهاي توسعه یافته درون سازمانی، متدهاي برگرفته از مقالات علمی و متدهاي منتشر شده از سوي سازمان هاي استاندارد که خارج از دامنه کاربرد تعیین شده استفاده می شوند، می بایست گزینش پذیری روش اجرایی ایجاد شود. معمولاً وقتی متدهاي منتشر شده از سوي سازمان هاي استاندارد، در دامنه کاربرد مربوطه شان استفاده شوند، گزینش پذیري به عنوان بخشی از فرایند استاندارد سازي متد مورد مطالعه قرار خواهد گرفت.
گزینش پذیري یک متد معمولاً با مطالعه توانایی متد جهت اندازه گیري آنالیت مورد نظر در نمونه هایی که عوامل مزاحم ویژه اي به طور عمدي وارد آن ها شده اند (آن عواملی که به احتمال زیاد در نمونه ها وجود دارند)، مورد بررسی قرار می گیرد. جایی که آشکار نباشد آیا مزاحمت ها از قبل وجود دارند یا خیر، گزینش پذیري متد میتواند با مطالعه توانایی متد جهت اندازه گیري آنالیت در مقایسه با دیگر متدهاي مستقل مورد بررسی قرار گیرد.
در ادامه مثال 1 و مثال 2 ملاحظات عملی مربوط به گزینش پذیري را نشان می دهند.
تکنیک هاي تأییدي می توانند به عنوان ابزاري جهت تصدیق ماهیت ها مفید باشند. هر چقدر شواهد بیشتري جمع آوري شود، تکنیک بهتر خواهد بود. الزاماً باید بین هزینه ها و زمان صرف شده براي شناسایی آنالیت و اطمینانی که با آن بتوان تصمیم گیري کرد که آیا شناسایی به درستی انجام شده یا خیر، توازنی وجود داشته باشد.
در حالی که ارزیابی تکرار پذیري مستلزم تکرار اندازه گیري با یک تکنیک می باشد، تأیید هویت آنالیت مستلزم آن است که اندازه گیري چندین بار و با تکنیک هاي مختلف و ترجیحاً به شکل مستقل انجام شود. تأیید، اطمینان تکنیک آزمایشی را افزایش داده و به خصوص هنگامی که تکنیک هاي تأییدي بر اساس اصول کاملاً متفاوتی اجرا شوند، مفید می باشد. در بعضی از کاربردها، براي مثال، آنالیز مواد آلی مجهول با کروماتوگرافی گازي، استفاده از تکنیک هاي تأییدي ضروري می باشد. وقتی متد اندازه گیري ارزیابی شده به شدت گزینشی باشد، استفاده از دیگر تکنیک هاي تأییدي ممکن است ضروري نباشد.
یک جنبه مهم گزینش پذیري که می بایست لحاظ شود، زمانی است که آنالیت در بیش از یک فرم نظیر فرم متصل یا غیرمتصل، معدنی یا آلی فلزي، یا حالت هاي اکسیداسیون مختلف در نمونه حضور داشته باشد. لذا در این حالت جهت اجتناب از سردرگمی، تعریف دقیق اندازه ده ضروري می باشد.
حد تشخیص و حد تعیین کمی
اصطلاح ها و تعاریف
جایی که اندازه گیري ها در غلظت هاي پایین انجام می شوند، سه مفهوم کلی را می بایست در نظر گرفت. اولاً، ممکن است ایجاد مقداري از نتیجه که نشان دهد آن مقدار آنالیت به طور قابل ملاحظه اي متفاوت از صفر است، ضروري باشد. اغلب در این سطح لازم است تا اقداماتی نظیر بیان یک ماده آلوده نیز انجام شود. این سطح، «مقدار بحرانی»، «حد تصمیم» یا در رهنمودهاي اتحادیه اروپا، «CCα« نامیده می شود. ثانیاً، دانستن پایین ترین غلظت آنالیت که بتواند در سطح مشخص اطمینان توسط متد شناسایی شود نیز مهم است. بدین معنا که در چه غلظت واقعی ما با اطمینان می توانیم بگوییم که از مقدار بحرانی توصیف شده در بالا تجاوز خواهیم کرد؟ اصطلاح هایی نظیر «حد تشخیص» (LOD)، «حداقل مقدار قابل تشخیص» یا در رهنمودهاي اتحادیه اروپا CCB براي این مفهوم استفاده می شود. ثالثاً، تعیین کمترین سطحی که در آن سطح، عملکرد متد براي یک کاربرد نوعی قابل قبول است نیز مهم می باشد. مفهوم سوم معمولاً به نام «حد تعیین کمی» (LOQ) شناخته می شود.
واژه هاي مرتبط با این مفاهیم بسیار متنوع بوده و در بخش هاي مختلف نیز متفاوت می باشند. براي مثال، اصطلاح «حد تشخیص» (LOD)، گرچه در گذشته به طور عمومی پذیرفته نشده بود، با این حال در بعضی از اسناد بخشی مورد استفاده قرار می گرفت. هر چند که این واژه ها در حال حاضر درVIM و کتاب طلایی آیوپاك گنجانده شده اند. ISO به عنوان اصطلاح عمومی از اصطلاح «حداقل مقدار قابل تشخیص متغیر حالت نهایی» استفاده که ترجمه ي آن به زبان شیمی، «حداقل غلظت نهایی قابل تشخیص» خواهد شد. در این راهنما، اصطلاح هاي «مقدار بحرانی»، «حد تشخیص» (LOD) و «حد تعیین کمی» (LOQ)، براي سه مفهوم بالا به کار می روند. LOD و LOQ به طور متداول در صحه گذاري متد تعیین می شوند. تمایزگذاري بین حد تشخیص دستگاه و حد تشخیص متد نیز ضروري است. حد تشخیص دستگاه می تواند بر پایه آنالیز یک نمونه پایه گذاري شود که اغلب واکنشگر بلانکی است که به طور مستقیم (یعنی هرگونه مراحل تهیه نمونه در آن حذف شده) یا به صورت نسبت سیگنال به نویز، براي مثال یک کروماتوگرام به دستگاه معرفی می شود. جهت دستیابی به حد تشخیص متد، LOD می بایست بر اساس آنالیز نمونه هایی که تمام مراحل روش اجرایی اندازه گیري را پشت سر گذاشته اند و استفاده از نتایج محاسبه شده با معادله یکسان براي نمونه هاي آزمایشی، پایه گذاري شود. این روش حد تشخیص، مفید ترین روش صحه گذاري متد بوده و بنابراین تمرکز این راهنما نیز بر آن است. پاراگراف هاي بعدي، تخمین آزمایشی LOD و LOQ را توصیف می کنند.
تعیین انحراف استاندارد در سطوح پایین
(LOD و LOQ) ،معمولا با ضرب انحراف استاندارد (s’0) در یک فاکتور مناسب محاسبه می شوند. مهم است که این انحراف استاندارد، نماینده دقت به دست آمده براي نمونه هاي آزمایشی نوعی باشد و اندازه گیري هاي تکراري کافی نیز جهت ارائه تخمین مناسب در آن لحاظ شده باشند. در این بخش، انحراف استاندارد s’o بر اساس انحراف استاندارد so براي نتایج تک نزدیک صفر پایه گذاري شده است که در عمل براي هر گونه معدل گیري یا تصحیح بلانک نیز تنظیم می شود .
مواردي که در ادامه می آیند، می بایست در تعیین LOD و LOQ یک آزمایش با استفاده از تکرار ساده لحاظ شوند.
نمونه هاي مناسب براي تخمین LOD و LOQ :نمونه هاي استفاده شده می بایست ترجیحاً یا a (نمونه هاي بلانک، یعنی ماتریکس هایی که شامل آنالیت غیرقابل تشخیص هستند و یا b )نمونه هاي آزمایشی با غلظت هاي آنالیت نزدیک به LOD و یا زیر LOD مورد انتظار باشند. نمونه هاي بلانک براي متدهایی که در آن ها یک سیگنال قابل اندازه گیري براي یک بلانک به دست می آید، مثل اسپکتروفتومتري و اسپکتروسکوپی اتمی مناسب می باشند. با این حال، براي تکنیک هایی نظیر کروماتوگرافی که مبتنی بر تشخیص پیک بالاي نویز می باشد، نمونه هایی با سطوح غلظت نزدیک LOD یا بالاي LOD نیاز می باشند. این نمونه ها را می توان براي مثال با، نشانه گذاري یک نمونه بلانک (بخش 5.4 را ببینید) تهیه کرد.
وقتی نمونه هاي بلانک یا نمونه هاي آزمایشی در غلظت هاي 2 پایین در دسترس نباشند، اغلب بلانک هاي واکنشگر استفاده می شوند. چنانچه این بلانک هاي واکنشگر کل روش اجرایی اندازه گیري را پشت سر نگذاشته و به طور مستقیم به دستگاه معرفی شوند، محاسبه انجام شده بر پایه این اندازه گیري ها LOD/LOQ دستگاه را ارائه خواهد داد.
پوشش دهی دامنه ي کاربرد متد: براي متدهاي با دامنه پوششی ماتریکس هاي بسیار متفاوت، ممکن است تعیین انحراف استاندارد هر ماتریکس به طور جداگانه الزامی باشد.
تضمین تکرار نمایندگی: انحراف استاندارد می بایست نماینده عملکرد متد، به همان شکلی باشد که در آزمایشگاه استفاده می شود، یعنی انحراف استاندارد می بایست بر اساس نتایج آزمایشی محاسبه شود که در آنها، آنالیزها دقیقاً مطابق با روش اجرایی اندازه گیري مستند شامل تمام مراحل تهیه نمونه انجام شده باشند. مقادیر استفاده شده براي محاسبه انحراف استاندارد so ، می بایست مطابق با واحدهاي اندازه گیري مشخص در روش اجرایی باشند.
شرایط اندازه گیري: معمولا انحراف استاندارد تحت شرایط تکرارپذیري به دست می آید و این روش در این بخش توضیح داده می شود. با این حال، تخمین قابل اعتمادتر می تواند با استفاده از شرایط دقت میانی به دست آید.
تعداد مشاهدات: تعداد تکرارها (m)، جهت دستیابی به تخمین رضایت بخش از انحراف استاندارد می بایست کافی باشند. نوعاً بین 6 تا 15 تکرار لازم است. اغلب در روش هاي اجرایی/ پروتوکل هاي صحه گذاري 10 تکرار پیشنهاد می شود .
محاسبه معدل گیري: در بسیاري از روش هاي اندازه گیري، میانگین تکرارها در استفاده روتین متد گزارش می شود. در اینجا هر تکرار با اجراي کل روش اندازه گیري به دست می آید. در این حالت، انحراف استاندارد نتایج تک so ، می بایست با تقسیم بر ریشه ي دوم n ،تصحیح شود. در اینجا n ،تعداد تکرارهاي معدل گیري شده در استفاده روتین می باشد.
محاسبه اثر تصحیح هاي بلانک: اگر تصحیح هاي بلانک در روش اندازه گیري مشخص شده باشند، آنگاه می بایست در تعیین انحراف استاندارد براي محاسبه LOD یا LOQ احتیاط شود. اگر در مطالعه صحه گذاري، تمام نتایج با مقدار بلانک یکسان تصحیح شده به دست آیند ـ رویکردي که در اینجا براي سادگی ارائه شده ـ آنگاه انحراف استاندارد نتایج در مقایسه با زمانی که در عمل، نتایج با مقادیر بلانک تصحیح شده متفاوت در اجراهاي مختلف به دست می آیند، کوچکتر خواهد بود.
در این مورد so میبایست با ضرب در مقدار
تصحیح شود. در اینجا n ،تعداد مشاهدات تکراري معدل گیري شده هنگام گزارش نتایج است، وقتی که هر تکرار با دنبال کردن کل روش اندازه گیري به دست آید و nb ، تعداد مشاهدات بلانک استفاده شده براي محاسبه تصحیح بلانک می باشد.
توجه داشته باشید که تحت شرایط دقت میانی، نتایج، با مقادیر بلانک متفاوت تصحیح خواهند شد، لذا هیچ تصحیحی براي انحراف استاندارد لازم نمی باشد. مثال 3 ،این محاسبات را نشان داده و فلوچارت شکل 2 نیز تصحیح هاي لازم براي معدلگیري و تصحیح بلانک را خلاصه می کند.
تخمین LOD
براي اهداف صحه گذاري، معمولا بیان مقدار تقریبی LOD ، یعنی سطحی که در آن تشخیص آنالیت مشکل ساز می شود، کافی است. بدین منظور رویکرد «3s « معمولاً کافی خواهد بود.
وقتی که بحث تایید نظارتی یا انطباق با یک ویژگی مطرح باشد، به خصوص در محاسبه درجات آزادي مرتبط با so ، به رویکرد دقیق تري نیاز می باشد. این رویکرد به طور کامل توسط آیوپاك و دیگر منابع توصیف شده است. جایی که مقدار بحرانی و/ یا LOD براي تصمیم گیري استفاده شوند، دقت می بایست پایش شده و هر وقت که لازم باشد حدود نیز می بایست مجددا محاسبه شوند. بخش ها و مقررات مختلف ممکن است از رویکردهاي مختلف براي تخمین LOD استفاده کنند. پیشنهاد می شود که قرارداد استفاده شده هنگام گزارش حد تشخیص بیان شود.
تخمین LOQ
LOQ پایین ترین سطح آنالیت است که می تواند با عملکرد قابل قبول تعیین شود («عملکرد قابل قبول» به اشکال مختلف، در راهنماهاي مختلف، شامل دقت، دقت و درستی یا عدم قطعیت اندازه گیري می باشد. با این حال، در عمل، LOQ در بیشتر قراردادها به صورت غلظت آنالیت مطابق با انحراف استاندارد به دست آمده s’0 در سطوح پایین با ضرب در فاکتور kQ ،محاسبه می شود. مقدار پیش فرض آیوپاك براي kQ ،رقم 10 است، و اگر انحراف استاندارد به طور تقریبی در غلظت هاي پایین ثابت باشد، این ضریب با انحراف استاندارد نسبی (RSD% ،(10 برابر خواهد شد. ضرایب 5 و 6 نیز بعضی اوقات استفاده شده که به ترتیب با مقادیر %20 و%17متناظر می باشند.
روش هاي اجرایی جایگزین
بخش هاي قبلی، رویکرد عمومی تخمین LOD و LOQ را بر اساس انحراف استاندارد نتایج در غلظت هاي نزدیک صفر توصیف می کنند که تحت شرایط تکرار پذیري به دست آمده اند. اگر چه این رویکرد به طور گسترده به کار می رود، اما روش هاي اجرایی جایگزین دیگري نیز در استانداردها و پروتوکل ها مشاهده می شوند.
در بعضی موارد، براي مثال جایی که مقادیر بلانک به طور چشم گیر از روزي به روز دیگر تغییر می کنند، شرایط دقت میانی به شرایط تکرار پذیري ترجیح داده می شوند. براي مثال، چنانچه نتایج کنترل کیفیت براي نمونه هاي آزمایشی در سطوح غلظت پایین در دسترس باشند، انحراف استاندارد این نتایج می تواند در تخمین LOD و LOQ مورد استفاده قرار گیرد. جایی که انحراف استاندارد استفاده شده براي محاسبه LOD و LOQ تحت شرایط دقت میانی به دست آمده باشد، دیگر نیازي به تصحیح بلانک نشان داده شده در شکل 2 ،نمی باشد. بنابراین انحراف استاندارد آزمایشی به دست آمده از کنترل کیفیت داخلی برابر با انحراف استاندارد so می باشد که براي محاسبه LOD و LOQ استفاده خواهد شد. 2-ISO ،11843 توضیح می دهد که چطور LOD دستگاه می تواند به طور مستقیم از منحنی کالیبراسیون به دست آید.
قابلیت اطمینان تخمین های LOQ و LOD
می بایست به این نکته توجه شود که حتی با 10 تکرار اشاره شده در مرجع خلاصه 2 و مرجع خلاصه 3 ،تخمین هاي انحراف استاندارد ذاتا متغیر هستند. بنابراین، تخمین LOQ/LOD به دست آمده هنگام صحه گذاري می بایست به عنوان یک مقدار شاخص در نظر گرفته شود. با این حال، اگر تخمینی از LOQ/LOD لازم باشد که خیلی ساده نشان دهنده غلظت هاي نمونه هایی باشد که بالاي LOQ/LOD قرار می گیرند، این تخمین کافی خواهد بود. جایی که انتظار می رود نمونه هاي آزمایشگاهی شامل غلظت هاي پایین آنالیت باشند، LOQ/LOD نیز می بایست به صورت منظم پایش شوند.
توانایی تشخیص آنالیز کیفی
آنالیز کیفی، شامل شناسایی یا طبقه بندي مواد است که در یک غلظت جدایِش (برِش) از آنالیت، به طور مؤثر به پاسخ «آري» یا «خیر» منجر خواهد شد. براي متدهاي کیفی، دقت برحسب انحراف استاندارد یا انحراف استاندارد نسبی بیان نشده و به جاي آن از شکل نرخ هاي مثبت و منفی درست و غلط استفاده می شود.
غلظت جدایش در مطالعه صحه گذاري، با تعریف نرخ هاي مثبت و منفی غلط در تعدادي از سطوح بالا و پایین غلظت جدایش مورد انتظار تعیین می شود. حد جدایش جایی است که نرخ هاي منفی غلط براي غلظت هاي بالاي حد (براي مثال با احتمال بیان شده، %5)، پایین می باشند. در صحه گذاري، حد جدایش پیشنهادي در روش اجرایی مستند، ارزیابی می شود .
گستره ی کاری
تعریف
«گستره ي کاري» بازه اي است که در آن، متد به نتایجی با عدم قطعیت قابل قبول منجر می شود. انتهاي پایینی گستره ي کاري با حد تعیین کمی LOQ ،محدود می شود. انتهاي بالایی گستره ي کاري با غلظت هایی تعریف می شود که در آن بی نظمی هاي معناداري در حساسیت تجزیه اي دیده می شود. مثالی از این وضعیت اثر سکو می باشد که در مقادیر جذب بالا در طیف سنجی VIS/UV مشاهده می شود.
ملاحظات مطالعه
گستره ي کاري متد صحه گذاري شده می بایست در دامنه کاربرد روش اجرایی مستند بیان شود. هنگام صحه گذاري، تأیید امکان استفاده متد در این گستره، الزامی است. به منظور ارزیابی گستره ي کاري، لازم است تا آزمایشگاه، خطی بودن متد و روش اجرایی کالیبراسیون پیشنهادي ارائه شده در متد را مد نظر داشته باشد.
گستره ی کاری دستگاه و متد
بسیاري از متدها بر نمونه هاي آزمایشی دریافت شده در آزمایشگاه متکی هستند (نمونه آزمایشگاهی) که قبل از معرفی آن ها به دستگاه اندازه گیرنده و ثبت سیگنال، می بایست عملیات فرآوري (هضم، استخراج، رقیق سازي) روي آن ها انجام شود. در این موارد دو گستره ي کاري وجود خواهد داشت. گستره ي کاري متد در دامنه کاربرد متد که به غلظت نمونه آزمایشگاهی مرتبط است، و براي مثال، به شکل mgkg نمونه آزمایشی جامد بیان می شود، و دیگري گستره ي کاري دستگاه که بر اساس غلظت نمونه آزمایشی فرآوري شده و معرفی شده به دستگاه اندازه گیري (براي مثال mgL در یک محلول پس از استخراج نمونه) تعریف می شود.
مثالی از گستره ي کاري دستگاه در شکل 3A ارائه شده که در آن غلظت هاي استانداردهاي کالیبراسیون در برابر سیگنال دستگاه رسم می شوند. مثالی از گستره ي کاري متد در شکل 3B ارائه شده که در آن غلظت هاي نمونه آزمایشی معلوم در برابر غلظت اندازه گیري شده رسم می شوند. غلظت اندازه گیري شده، نتیجه اي است که با به کار بردن روش اجرایی اندازه گیري (شامل تهیه نمونه) و استفاده از دستگاه کالیبره شده بر اساس متد مکتوب به دست می آید.
در جریان صحه گذاري، هم گستره ي کاري دستگاه و هم گستره ي کاري متد می بایست ارزیابی شوند. داده هاي مربوط به کاري اغلب هنگام توسعه متد تولید می شوند.
در این گونه موارد، ارائه داده ها در گزارش صحه گذاري کافی خواهد بود.
ارزیابی گستره ی کاری دستگاه
پاسخ دستگاه بین LOQ و انتهاي بالایی گستره ي کاري دستگاه، از یک رابطه ي معلوم کاملاً خطی، خمیده خطی و غیره تبعیت می کند. هنگام صحه گذاري لازم است تا
i (این رابطه تأیید شود،
ii (نشان داده شود که گستره ي کاري دستگاه با بازه بیان شده در دامنه کاربرد متد سازگار است و
iii (تصدیق و بررسی شود که روش اجرایی کالیبراسیون دستگاه (تک نقطه اي، براکتینگ یا چند نقطه اي) کافی و کارآمد می باشد.
براي رسم سیگنال ها به منظور بررسی گستره ي کاري دستگاه و تأیید برازندگی هدف، می بایست از استانداردهاي کالیبراسیون با پهناي غلظتی استفاده شود که با ضریب %10 ±و یا حتی %20 ±از گستره ي غلظت مورد انتظار تجاوز می کنند. براي 1-100mgL گستره ي- 1 ، مقدار %20 ±به 8.0 تا 120mgL-1 اشاره می کند. غلظت هاي انتخابی می بایست به طور یکنواخت در امتداد گستره جاي بگیرند. ارزیابی اولیه گستره ي کاري با بررسی چشمی منحنی پاسخ انجام می شود.
مرحله بعدي، تعیین رابطه ي غلظت و پاسخ دستگاه به کمک بررسی آماره هاي رگرسیون و منحنی مانده براي مدل انتخابی (براي مثال، خطی، درجه دوم) می باشد. ارزیابی ممکن است شامل معیارهاي آماري خاص، نظیر آزمون هاي «نیکویی برازش» نیز باشد. تجزیه گر از منحنی پاسخ و آماره هاي تأیید کننده به دست آمده از گستره ي کاري دستگاه، می تواند ارزیابی کند که آیا روش اجرایی کالیبراسیون پیشنهاد شده در متد مناسب می باشد یا خیر. روش کالیبراسیون با برآورد گستره ي کاري متد، باز هم بیشتر ارزیابی می شود.
ارزیابی گستره ی کاری متد
به منظور ارزیابی گستره ي کاري متد
1) می بایست نمونه هایی با غلظت هاي معلوم و بلانک هاي نمونه در دسترس باشند،
2) نمونه هاي استفاده شده می بایست وارد کل روش اجرایی اندازه گیري شوند،
3) غلظت هاي نمونه هاي مختلف می بایست ترجیحاً کل گستره ي مورد نظر را پوشش دهند و
4) دستگاه می بایست بر اساس روش اجرایی کالیبراسیون پیشنهاد شده کالیبره شود.
نتیجه اندازه گیري براي هر نمونه آزمایشی بر اساس روش اجرایی مکتوب، محاسبه می شود. این مقادیر بر روي محور yها و در برابر غلظت هاي معلوم نمونه ها (محور x) همانند شکل 3B رسم می شوند. گستره ي کاري متد و خطی بودن با بررسی چشمی منحنی ارزیابی شده و با آماره ها و منحنی مانده به دست آمده از رگرسیون خطی تأیید می شود.
ارزیابی گستره ي کاري با داده هاي به دست آمده از مطالعات بایاس و دقت نیز تأیید می شود، البته به شرطی که این مطالعات غلظت هاي کل گستره ي کاري متد را پوشش دهند.
از آنجا که مزاحمت ها می توانند پاسخ هاي غیرخطی ایجاد کنند و توانایی متد براي استخراج/ بازیابی آنالیت نیز ممکن است بسته به ماتریکس نمونه تغییر کند، لذا براي هر ماتریکس پوشش داده شده در دامنه کاري متد، می بایست گستره ي کاري جداگانه اي ایجاد شود.
حساسیت تجزیه ای
تعریف
حساسیت تجزیه ای، تغییر در پاسخ دستگاه است که با تغییر در کمیت اندازه گیري شده (براي مثال، غلظت آنالیت)، یعنی گرادیان منحنی پاسخ مطابقت دارد. در اینجا استفاده از پسوند «تجزیه اي» به خاطر مشابهت آن با اصطلاح «حساسیت تشخیصی» استفاده شده در آزمایشگاه تشخیص طبی، پیشنهاد می شود. گاهی اوقات، اصطلاح «حساسیت» براي اشاره به حد تشخیص استفاده می شود، اگر چه استفاده آن در VIM توصیه نمی شود.
کاربردها
حساسیت تجزیه اي فقط یک مشخصه عملکردي ویژه و مهم نیست و حداقل دو کاربرد مفید دیگر نیز در رابطه با آن وجود دارد:
1 . گاهی اوقات حساسیت تجزیه اي تئوري معلوم است. بسیاري از الکترودهاي یون گزین رفتار نرنستی از خود نشان می دهند، براي مثال، سیگنال به دست آمده از یک الکترود شیشه سالم که انتظار می رود به شکل pH/59mV تغییر کند.
2 . در سیستم هاي اندازه گیري اسپکتروفتومتري، مقدار جذب می تواند از قانون بیرـ لامبرت پیش بینی شود. لذا بعضی اوقات از آن می توان براي بازبینی عملکرد دستگاه و استانداردها نیز استفاده کرد.
درستی
واژگان توصیف کیفیت اندازه گیری
در این پست، ما از سه ویژگی عملکردي درستی، دقت و عدم قطعیت براي توصیف کیفیت نتایج به دست آمده از متد، استفاده می کنیم. با این حال، دانشمندان اغلب از مفاهیم مختلفی نظیر انواع خطاها (تصادفی، سیستماتیک و خطاهاي درشت)، صحت (درستی و دقت) و عدم قطعیت استفاده می کنند. بعضی از این مفاهیم داراي معناي کیفی و بعضی دیگر داراي معناي کمی می باشند. با گذشت سال ها، اصطلاح ها و تعاریف تغییر کرده و اصطلاح هاي جدید معرفی شده اند. به علاوه، بخش هاي مختلف، واژه هاي متفاوت خود را ترجیح می دهند که همه آن ها به سردرگمی هاي زیادي منجر شده اند. شکل 4 ،ارتباط بین واژه ها را نشان داده و جزئیات بیشتر در VIM و راهنماي یوراکم در باره واژه شناسی ارائه شده است.
«صحت» اندازه گیري، نزدیکی یک نتیجه تک به یک مقدار مرجع (برای تعریف دقیق (VIM)، 213 را ببینید) را بیان می کند. صحه گذاري متد، صحت نتایج را با بررسی اثرات تصادفی و سیستماتیک روي نتایج تک بررسی می کند. بنابراین صحت معمولا، به صورت مؤلفه «درستی» و «دقت» مطالعه می شود. به علاوه، بیان عمومی صحت که بیش از پیش مطرح می شود، «عدم قطعیت اندازه گیري» است که یک رقم تک را فراهم می کند.
«درستی» اندازه گیري، میزان نزدیکی میانگین تعداد بی شمار از نتایج (تولید شده با متد) را به مقدار مرجع بیان می کند. از آنجا که امکان بی شمار اندازه گیري وجود ندارد، لذا درستی نمی تواند اندازه گیري شود. با این حال، می توانیم یک ارزیابی عملی از درستی داشته باشیم. این ارزیابی معمولا، به صورت کمی و بر اساس «بایاس» بیان می شود.
بایاس
تعیین عملی بایاس به مقایسه میانگین نتایج (x) متد نامزد با مقدار مرجع مناسب (Xref) متکی است. سه رویکرد عمومی وجود دارد:
a) آنالیز مواد مرجع
b) آزمایش هاي بازیابی با استفاده از نمونه هاي نشانه گذاري شده و
c) مقایسه نتایج به دست آمده با دیگر متدها. مطالعات بایاس می بایست دامنه کاربرد متد را پوشش داده و ممکن است به آنالیز انواع نمونه ها و یا سطوح آنالیت مختلف نیاز باشد. لذا براي تعیین آن ممکن است به ترکیبی از رویکردهاي مختلف نیاز باشد.
در اینجا x مقدار میانگین نمونه نشانه دار و Xspike غلظت افزوده شده می باشد. با این حال، در بعضی از بخش هاي اندازه گیري تجزیه، از درصد بازیابی نسبی («بازیابی ظاهري») نیز استفاده می شود.
جهت تعیین بایاس با استفاده از یک RM ،میانگین و انحراف استاندارد یکسري از اندازه گیري هاي تکراري تعیین شده و نتایج با مقدار ویژگی اسمی RM مقایسه می شوند. RM ایده آل، یک ماده مرجع ماتریکس گواهی دار با مقادیر ویژگی نزدیک به نمونه هاي آزمایشی مورد نظر می باشد.
CRMها، عموما به خاطر فراهم آوردن مقادیر قابل ردیابی پذیرفته می شوند. همچنین یادآوري این نکته مهم است که هنگام مطالعه صحه گذاري، یک RM خاص تنها می بایست براي یک هدف، استفاده شود. براي مثال، RMي که براي کالیبراسیون استفاده می شود، نمی بایست براي ارزیابی بایاس استفاده شود.
دسترس پذیري RMها، با توجه به انواع زیاد نمونه ها و آنالیت هایی که در آزمایشگاه ها با آن ها مواجه می شویم، محدود است، با این حال مهم است که ماده انتخابی براي استفاده مورد نظر مناسب باشد. چنانچه هنگام تعیین ویژگی ماده، هدف روش تهیه نمونه، ارائه غلظت کل آنالیت نبوده و تنها مقدار استخراج شده تحت شرایط خاص مدنظر باشد، آنگاه ممکن است چگونگی تعیین ویژگی RM نیز ضروري باشد.
براي کارهاي نظارتی می بایست از یک ماده گواهی دار مرتبط، و در صورت دسترسی، از یک ماتریکس مشابه ایده آل استفاده شود. براي متدهایی که به شکل طولانی مدت در کار درون سازمانی استفاده می شوند، می توان از یک ماده درون سازمانی پایدار براي پایش بایاس استفاده کرد، هر چند که در ارزیابی اولیه حتما می بایست از یک CRM استفاده شود.
در غیاب RMهاي مناسب، می توان از مطالعات بازیابی (آزمایش هاي نشانه گذاري) براي ارائه شاخصی از سطح بایاس احتمالی استفاده کرد. آنالیت ها ممکن است به شکل هاي مختلف در نمونه حاضر بوده و بعضی اوقات فقط اشکال خاصی از آنالیت ها براي تجزیه گر مهم هستند.
بنابراین، متد ممکن است، آگاهانه براي شکل خاصی از آنالیت طراحی شده باشد. ناتوانی در تعیین بخشی از آنالیت و یا تمام آنالیت حاضر، ممکن است منعکس کننده مشکل ذاتی متد باشد. لذا، ارزیابی کارآیی متد براي تشخیص تمام آنالیت هاي حاضر لازم است.
از آنجا که معمولاً معلوم نیست چه مقدار از آنالیت خاص در یک بخش آزمایشی حاضر است، لذا تاحدي اطمینان از اینکه متد تا چه اندازه در استخراج آنالیت از ماتریکس یکسان موفق بوده، مشکل است. یک راه براي تعیین کارایی استخراج، نشانه گذاري بخش هاي آزمایشی با آنالیت در غلظت هاي مختلف و سپس استخراج بخش هاي آزمایشی نشانه گذاري شده و اندازه گیري غلظت آنالیت می باشد.
مشکل ذاتی این روش آن است که ممکن است آنالیت وارد شده به بخش آزمایشی با همان قدرتی که آنالیت در حالت طبیعی به ماتریکس بخش آزمایشی متصل می شود، به آن متصل نشود، که در این حالت، تکنیک به شکل غیرواقع بینانه اي به اثر کارآیی استخراج بالا منجر خواهد شد.
ارزیابی بایاس ممکن است با مقایسه نتایج متد نامزد با نتایج به دست آمده از متد جایگزین امکان پذیر باشد. دو نوع متد عمومی جایگزین وجود دارد. مورد اول، متد مرجع یا متدي است که در حال حاضر به شکل روتین در آزمایشگاه استفاده می شود. هدف متد مرجع، فراهم نمودن «مقدار مرجع پذیرفته شده» براي ویژگی اندازه گیري شونده بوده و عموماً به نتایجی منجر خواهد شد که عدم قطعیت آن ها کوچک تر از متد نامزد می باشد. نوع خاص متد مرجع، «متد اولیه» است. مورد دوم، زمانی مطرح می شود که هدف صحه گذاري، اثبات این موضوع باشد که متد نامزد، نتایجی می دهد که معادل با نتایج متد فعلی می باشند. در اینجا، هدف بیان این نکته است که بایاس معناداري در ارتباط با نتایج متد فعلی (گرچه این متد ممکن است خود داراي بایاس باشد) وجود ندارد.
در هر دو حالت، نتایج به دست آمده از متدهاي جایگزین و نامزد، براي نمونه یا نمونه هاي یکسان، مقایسه می شوند. نمونه(ها) ممکن است RMهاي درون سازمانی و یا خیلی ساده، نمونه هاي آزمایشی نوعی باشند. مزیت این رویکرد آن است که دیگر لازم نیست مواد حتما CRM باشند، چرا که متد جایگزین مقدار مرجع را فراهم می کند. بنابراین متد می تواند روي نمونه هاي «واقعی» که نماینده نمونه هایی هستند که به شکل روتین در آزمایشگاه مشاهده می شوند، آزمایش شود.
تفسیر اندازه گیري هاي بایاس
شکل 5 ،دو مؤلفه بایاس به نام هاي «بایاس متد» و «بایاس آزمایشگاه» را نشان می دهد.
بایاس متد، بدون توجه به این که کدام آزمایشگاه از آن استفاده می کند، از خطاهاي سیستماتیک ذاتی متد ناشی می شود. بایاس آزمایشگاه از خطاهاي سیستماتیک اضافی خاص آن آزمایشگاه و تفسیر متد ناشی می شود. آزمایشگاه فقط می تواند بایاس مرکب (کل) ناشی از این دو منبع را تخمین بزند.
با این حال، در بازبینی بایاس براي هدف خاص، آگاهی از قراردادهاي اجرایی مهم است. براي مثال، در بعضی از کاربردهاي غذایی، حدود نظارتی بر اساس نتایج به دست آمده از متد استاندارد تجربی خاص («تعریف شده به شکل عملیاتی») تنظیم می شوند. طبق تعریف، بایاس متد براي روش هاي اندازه گیري «تجربی» صفر است. در این حالت، از بایاس حاصل از متد خاص چشم پوشی شده و مقایسه پذیري اندازه شناسی با دیگر آزمایشگاه ها با استفاده از متد یکسان، سهم اصلی خواهد بود. در این وضعیت، آزمایشگاه می بایست بایاس را به طور ایده آل با استفاده از مواد مرجع گواهی دار و به کمک متد تجربی یا نظارتی خاص تعیین کند، در هر حالت، راهنماي معمول بازبینی و تفسیر بایاس نیز می بایست به کار گرفته شود. جایی که مواد مرجع در دسترس نباشند، یا نیاز به اطلاعات اضافی باشد، آزمایشگاه می تواند از مواد جایگزین استفاده کرده و هنگام تفسیر نتایج نیز می بایست تفاوت هاي آشکار بین متد تحت بررسی و متد(ها)ي مورد استفاده براي رسیدن به مقدار مرجع را مدنظر داشته باشد.
جهت برآورده نمودن الزام تجزیه اي خاص، آنالیت یکسان می تواند با استفاده از ابزارهاي اندازه گیري متفاوت در مکان هاي متعدد در همان سازمان اندازه گیري شود. در این مورد، منابع پیچیده و زیاد بایاس از درون سازمان ناشی می شوند. در این وضعیت معمول و پیچیده، سازمان می تواند براي تخمین عدم قطعیت نماینده ي پوشش دهنده تمام مکان ها/ ابزارها، روش هاي اجرایی را براي هر کاربرد ایجاد کند. در اینجا ترجیحاً از موادي استفاده می شود که همانند نمونه هاي هدف اندازه گیري بوده و داراي خواص یکسان، از جمله ماتریکس نمونه یکسان باشند. آنالیز مؤلفه واریانس می تواند براي شناسایی علل اصلی تغییر در عدم قطعیت اندازه گیري کل استفاده شود، بدین ترتیب امکان اقدام متعاقب جهت کاستن تفاوت ها در مجموعه سازمان برآورده خواهد شد.
با این حال در بیشتر موارد، پذیرش بایاس می بایست بر اساس بایاس کل اندازه گیري شده در برابر RMها، مواد نشانه دار و متدهاي مرجع مناسب و با در نظر گرفتن دقت متد و عدم قطعیت مقادیر مرجع و صحت مورد نیاز در استفاده نهایی، تصمیم گیري شود. در این رابطه آزمون هاي معناداري آماري پیشنهاد می شوند.
دقت
تکرار
تکرار، براي رسیدن به تخمین هاي قابل اعتماد از مشخصه هاي عملکردي متد، نظیر دقت و بایاس، ضروري می باشد. آزمایش هاي آنالیز تکراري می بایست طوري طراحی شوند که تمام تغییرات شرایط عملیاتی که انتظار می رود هنگام استفاده روتین متد به وجود آیند، در آن ها لحاظ شده باشند. هدف می بایست تعیین تغییرپذیري نوعی و نه تغییرپذیري حداقل باشد.
شرایط دقت
دقت (دقت اندازه گیري)، میزان نزدیکی نتایج به یک دیگر است و معمولاً بر حسب پارامترهاي آماري که پراکندگی نتایج را توصیف می کنند و نوعاً به شکل انحراف استاندارد (یا انحراف استاندارد نسبی) نتایج اندازه گیري هاي تکراري روي یک ماده مناسب تحت شرایط معین، بیان می شود. جنبه مهم ارزیابی دقت اندازه گیري، تصمیم گیري درباره «شرایط معین» است. شرایط، نوع تخمین دقت به دست آمده را تعیین می کند.
«تکرار پذیري اندازه گیري» و «تجدید پذیري اندازه گیري» بیانگر دو میزان اکستریم دقت هستند که می توانند به دست آیند. معمولا متدهاي استاندارد (براي مثال، متدهاي ISO)، هر جا که کاربرد داشته باشد، شامل داده هاي تکرار پذیري و تجدید پذیري نیز می باشند.
تکرارپذیري، که انتظار می رود کوچک ترین تغییر در نتایج را ارائه کند، هنگامی که اندازه گیري از سوي یک تجزیه گر و با استفاده از تجهیزات یکسان در مقیاس زمانی کوتاه انجام شود، معیاري از تغییرپذیري در نتایج است.
تجدید پذیري، که انتظار می رود بزرگترین تغییر در نتایج را ارائه دهد، معیاري از تغییر پذیري نتایج بین آزمایشگاه ها است.
بین این دو اکستریم، «دقت (اندازه گیري) میانی» وجود دارد که هنگامی که اندازه گیري ها در یک آزمایشگاه تک و تحت شرایط تغییر پذیرتر از شرایط تکرار پذیري انجام شوند، تخمینی از تغییر در نتایج را ارائه می کند. می بایست شرایط دقیق اجراي آزمایش در هر حالت بیان شود. هدف، رسیدن به تخمین دقتی است که تمام منابع تغییراتی را که در آزمایشگاه تک و تحت شرایط روتین (تجزیه گرهاي مختلف، مقیاس زمانی طولانی، تجهیزات مختلف و غیره) ، واقع می شوند را منعکس کند.
تخمین هاي دقت: جنبه هاي عمومی
به طور کلی، دقت به غلظت آنالیت بستگی داشته و می بایست در غلظت هاي مختلف و گستره ي مورد نظر تعیین شود. آن می تواند شامل غلظت خاص مورد نظر (نظیر حد نظارتی) به علاوه غلظت هایی در حدود بازه اندازه گیري باشد. اگر رابطه اي بین دقت و غلظت آنالیت وجود داشته باشد، این ارتباط می بایست تعیین شود. در مواردي که غلظت اندازه گیري شده به خوبی بالاي حد تشخیص واقع می شود، اغلب، دقت متناسب با غلظت آنالیت خواهد شد. در چنین مواردي، بهتر آن است که دقت به صورت انحراف استاندارد نسبی بیان شود، چرا که آن تقریباً در گستره ي مورد نظر ثابت باقی خواهد ماند.
براي متدهاي کیفی، دقت نمی تواند به شکل انحراف استاندارد یا انحراف استاندارد نسبی بیان شود و به صورت نرخ هاي مثبت (و منفی) درست و غلط، بیان می شود.
ارزیابی دقت، مستلزم اندازه گیري هاي تکراري کافی روي مواد مناسب می باشد. مواد می بایست نمایانگر نمونه هاي آزمایشی بر اساس ماتریکس و غلظت آنالیت، همگنی و پایداري باشند، اما الزاماً ضرورتی ندارد که حتما جزء CRMها باشند. تکرارها نیز می بایست مستقل باشند، بدین معنی که کل پروسه اندازه گیري، حتی مراحل تهیه نمونه نیز می بایست تکرار شوند. حداقل تعداد تکرارها، بسته به پروتوکل هاي مختلف تغییر می کند، اما نوعاً بین 6 و 15 تکرار براي هر ماده استفاده شده در مطالعه پیشنهاد می شود.
باید به خاطر داشت که تخمین انحراف استاندارد قابل اطمینان از مجموعه داده هاي با تعداد تکرارهاي کم، مشکل می باشد. اگر مجاز باشد، می توان براي رسیدن به تخمین هاي با درجات آزادي کافی، مقادیر محاسبه شده از چند مجموعه کوچک از اندازه گیري هاي تکراري را با یکدیگر ترکیب (ادغام) کرد.
بعضی از طرح هاي آزمایشی آنالیز شده با تحلیل واریانس (ANOVA)،براي رسیدن به تخمین هاي تکرار پذیري و دقت میانی با تعداد مناسب درجات آزادي، روش کارآمد تري می باشند.
دقت حدود
محاسبه «حد دقت» از انحراف استاندارد s مفید می باشد. حد دقت به تجزیه گر کمک می کند تا در مورد این که آیا بین نتایج آنالیزهاي دوبارتکرار از یک نمونه به دست آمده تحت شرایط معین، اختلاف معناداري در سطح اطمینان معین وجود دارد یا خیر، تصمیم گیري کند. حد تکرار پذیري (r) به شکل زیر محاسبه می شود:
در اینجا فاکتور 2 √ بیانگر اختلاف بین دو اندازه گیري، t ، مقدار tي استیودنت دودنباله براي تعداد معینی از درجات r مربوط می باشد آزادي (که به تخمین s) در سطح اطمینان مورد نیاز می باشند. براي تعداد درجات آزادي نسبتاً زیاد، t در سطح اطمینان %95 ،تقریباً 2 است، بدین ترتیب حد تکرار پذیري اغلب به صورت تقریبی زیر بیان می شود:
حد دقت میانی و حد تجدید پذیري (R) نیز به شکل مشابه با جایگزینی sr با به ترتیب sI و sR محاسبه می شود. معمولا، سند متدهاي استاندارد (براي مثال، اسناد ISO) در جایی که عملی باشد، داده هاي مربوط به حد تکرار پذیري و حد تجدید پذیري را نیز ارائه می کند.
تعیین همزمان دقت میانی و تکرار پذیري
رویکردهاي مربوط به تعیین همزمان دقت میانی و تکرارپذیري در 3-5725 ISO توصیف شده اند. به علاوه، طرحی بر پایه راهنماهاي هماهنگ شده براي صحه گذاري متدهاي آنالیزي درآزمایشگاه تک نیز، امکان تعیین تکرار پذیري و دقت میانی را از یک مطالعه مطرح می کند. زیرنمونه هاي مواد آزمایشی انتخاب شده، تحت شرایط تکرارپذیري و طی چند اجرا و با ماکزیمم تغییر در شرایط بین اجراها (روزهاي مختلف، تجزیه گرهاي مختلف، تجهیزات مختلف و غیره) آنالیز می شوند. تکرارپذیري می تواند به شکل دقت درون گروه و به کمک ANOVAي یکطرفه، محاسبه شود، در حالی که دقت میانی به صورت ریشه دوم مجموع مربعات دقت درون گروه و بین گروه به دست می آید. این طرح می تواند روش کارآمدي را براي دسترسی به تعداد درجات آزادي کافی براي تخمین هاي تکرار پذیري و دقت بین گروه فراهم کند. براي مثال، 8 گروه دوتکراري براي تخمین هاي تکرار پذیري و دقت بین اجرا، به ترتیب به 8 و 7 درجه آزادي منجر می شود. براي جزئیات، پیوست C را ببینید.
عدم قطعیت اندازه گیري
بحث جامع عدم قطعیت (اندازه گیري) خارج از چارچوب مورد نظر این راهنما است و اطلاعات مبسوط آن در منابع دیگر وجود دارد.
عدم قطعیت، بازه مرتبط با نتیجه اندازه گیري است که گستره ي مقادیري را که میتوانند به طور منطقی به کمیت اندازه گیري شونده نسبت داده شوند را بیان می کند. تخمین عدم قطعیت میبایست تمام اثرات شناخته شده ي تاثیرگذار روي نتیجه را لحاظ کرده باشد. عدم قطعیت هاي مرتبط با هر اثر، بر اساس روش هاي اجرایی قانون مند و مناسب با یکدیگر ترکیب می شوند.
رویکردهاي مختلفی براي تخمین عدم قطعیت نتایج اندازه گیري هاي شیمیایی توصیف شده اند.
این رویکردها موارد زیر را در نظر می گیرند:
- دقت طولانی مدت کل متد (یعنی، دقت میانی یا تجدید پذیري).
- بایاس و عدم قطعیتش، شامل عدم قطعیت آماري اندازه گیري هاي بایاس و عدم قطعیت مقدار مرجع.
- کالیبراسیون تجهیزات. عدم قطعیت هاي مرتبط با کالیبراسیون تجهیزات نظیر ترازوها، ترمومترها، پی پت ها و بالن ها، که اغلب در مقایسه با دقت کل و عدم قطعیت بایاس، کوچک و قابل چشم پوشی می باشند. اگر این موضوع تصدیق شود، دیگر لازم نیست تا از عدم قطعیت هاي کالیبراسیون در تخمین عدم قطعیت استفاده شود.
هر گونه اثرات معنادار تاثیرگذار بر نتیجه، به غیر از موارد ذکر شده در بالا. براي مثال، ممکن است در مطالعات صحه گذاري، گستره هاي دما و زمان مجاز متد به طور کامل تمرین نشده و نیاز به اضافه کردن اثر آن ها باشد. این اثرات می توانند به طور کمی از طریق مطالعات استحکام یا استواري یا مطالعات مرتبط که اندازه یک اثر معین بر نتیجه را مشخص می کنند، محاسبه شوند.
جایی که سهم اثرات منفرد مهم باشد، براي مثال در آزمایشگاه هاي کالیبراسیون، لحاظ کردن سهم هاي منفرد ناشی از تمام اثرات منفرد به طور جداگانه ضروري خواهد بود.
توجه داشته باشید که پیرو ملاحظه اضافی اثرات خارج از محدوده مطالعه مشترك، به شرطی که بایاس آزمایشگاهی اندازه گیري شده روي مواد مرتبط، نسبت به انحراف استاندارد تجدید پذیري کوچک باشد، آنگاه انحراف استاندارد تجدید پذیري، تخمین کاري عدم قطعیت استاندارد مرکب را تشکیل خواهد داد، در این حالت تکرار پذیري درون سازمانی با تکرار پذیري متد استاندارد قابل مقایسه بوده و دقت میانی آزمایشگاه بزرگتر از انحراف استاندارد تجدید پذیري منتشر شده نخواهد بود.
استحکام
تعریف «استحکام» (استواري) یک روش آنالیزي در واقع «میزان توانایی آن روش در بی تأثیر ماندن، ضمن اعمال تغییرات کوچک اما آگاهانه در پارامترهاي متد» است. استحکام، شاخص اعتماد پذیري متد را هنگام استفاده معمول فراهم می کند.
آزمون استحکام
در هر متد، مراحل معینی وجود دارد که چنانچه با دقت کافی انجام نشوند، اثر معناداري بر عملکرد متد داشته و حتی ممکن است به یک متد ناکارآمد منجر شوند. این مراحل معمولاً می بایست به عنوان بخشی از توسعه متد شناسایی شده و در صورت امکان، تأثیر آن ها بر عملکرد متد با استفاده از «آزمون استحکام» («آزمون استواري») ارزیابی شود. AOAC این واژه را تعریف کرده و چگونگی اجراي چنین آزمونی را با استفاده از طرح آزمایشی پلاکت ـ بورمن و در قالب یک تکنیک رسمی توصیف می کند.
«آزمون استحکام» شامل ایجاد تغییرات آگاهانه در متد و بررسی اثر حاصل از آن تغییر بر عملکرد می باشد. آنگاه امکان شناسایی متغیرهایی که مهم ترین اثر را در متد ایجاد می کنند، فراهم شده و هنگام استفاده از متد، این اطمینان حاصل خواهد شد که تمام متغیرها به دقت تحت کنترل می باشند.
هر جا که نیاز به اصلاح بیشتر متد باشد، بهبودها می توانند اغلب با تمرکز بر بخش هاي بحرانی متد انجام شوند.
استحکام روش اجرایی براي متدهاي توسعه یافته درون سازمانی، متدهاي برگرفته از مقالات علمی و متدهاي منتشر شده از سوي نهادهاي استانداردسازي که خارج از دامنه کاربرد متد استاندارد استفاده می شوند، می بایست ارزیابی شود. هنگامی که متدهاي منتشر شده از سوي نهادهاي استاندارد سازي در دامنه کاربردي متد استفاده شوند، معمولاً استحکام به عنوان بخشی از پروسه استاندارد سازي مطالعه خواهد شد. بنابراین، در اغلب موارد مطالعه استحکام در سطح آزمایشگاه تک الزامی نمی باشد. اطلاعات مربوط به استحکام در روش اجرایی آزمایشگاهی، می بایست به شکل حدود تولرانس براي پارامترهاي آزمایشگاهی بحرانی بیان شوند.