توزیع های احتمال عدم قطعیت اندازه گیری
توزیع احتمال بخشی از تجزیه و تحلیل عدم قطعیت اندازه گیری است که افراد به طور مداوم با آن دست و پنجه نرم می کنند. هدف من امروز این است که به شما کمک کنم بدون نیاز به کتاب درسی آمار، درباره توزیع احتمالات بیشتر بدانید. اگرچه صدها توزیع احتمال وجود دارد که می توانید از آنها استفاده کنید، من بر روی 6 موردی که باید بدانید تمرکز می کنم.
اگر دائماً با توزیع احتمال درگیر هستید، به خواندن این پست ادامه دهید. من قصد دارم توضیح دهم که توزیع های احتمال چیست، چرا آنها مهم هستند و چگونه می توانند در برآورد عدم قطعیت اندازه گیری به شما کمک کنند.
توزیع احتمال چیست؟
به طور ساده، توزیع های احتمال تابع، جدول یا معادله ای هستند که رابطه بین نتیجه یک رویداد و فراوانی وقوع آن را نشان می دهد.
توزیع های احتمال مفید هستند زیرا می توانند به عنوان نمایشی گرافیکی از توابع اندازه گیری و نحوه رفتار آنها استفاده شوند. هنگامی که می دانید عملکرد اندازه گیری شما در گذشته چگونه بوده است، می توانید به طور مناسب تری آن را تحلیل کرده و نتایج آینده را پیش بینی کنید.
قبل از اینکه به انواع مختلف توزیع های احتمال بپردازیم، اجازه دهید ابتدا کمی بیشتر درباره توزیع های احتمال بیاموزیم. در چند پاراگراف بعدی قصد دارم ویژگی هایی را که باید بدانید را توضیح دهم.
هیستوگرام
هیستوگرام یک نمایش گرافیکی است که برای درک نحوه توزیع داده های عددی استفاده می شود. به هیستوگرام توزیع گاوسی در زیر نگاه کنید.
به هیستوگرام نگاه کنید و ببینید که چگونه اکثر داده های جمع آوری شده در مرکز گروه بندی می شوند. به این حالت حد مرکزی می گویند.
اکنون به ارتفاع هر میله در هیستوگرام نگاه کنید. ارتفاع میله ها نشان می دهد که هر نتیجه چقدر تکرار می شود. هر چه نوار بلندتر باشد، این اتفاق بیشتر است.
چولگی
چولگی معیاری برای سنجش تقارن توزیعهای احتمال است. به نمودار زیر نگاه کنید تا به صورت بصری متوجه شوید که چگونه توزیع های احتمال می توانند به چپ یا راست منحرف شوند.
کورتوز
کورتوز اندازه گیری تیزی و دنباله توزیع نرمال است. همانطور که در تصویر زیر مشاهده می کنید، توزیع هایی با دنباله های پهن تر دارای قله های کوچک تری هستند در حالی که توزیع هایی با قله های بزرگتر دارای دنباله های باریک تر هستند. آیا رابطه را می بینید؟
چرا مهم است
می دانم که این طور به نظر می رسد که دارم شما را وادار می کنم اطلاعات بیشتری را که می خواهید بدانید، بخوانید، اما دانستن این جزئیات مهم است تا بتوانید توزیع احتمال مناسبی را که داده های شما را مشخص می کند انتخاب کنید.
اگر مطمئن نیستید که داده های خود چگونه توزیع می شوند، هیستوگرامی ایجاد کنید و آن را با توزیع های احتمالی زیر مقایسه کنید.
رایج ترین توزیع های احتمالی که برای تخمین عدم قطعیت اندازه گیری استفاده می شوند عبارتند از:
نرمال
مستطیل شکل
U شکل
مثلث
لگاریتمی-نرمال
ریلی
در زیر فهرستی از رایج ترین توزیع های احتمال مورد استفاده در تحلیل عدم قطعیت را مشاهده خواهید کرد. پس از خواندن این مقاله، باید بتوانید تشخیص دهید که از کدام توزیع های احتمالی باید استفاده کنید و چگونه مولفه های عدم قطعیت خود را به معادل های انحراف استاندارد تبدیل کنید.
توزیع گاوسی (با نام مستعار نرمال).
توزیع نرمال تابعی است که توزیع بسیاری از متغیرهای تصادفی را به صورت یک نمودار زنگوله ای متقارن نشان می دهد که در آن اوج در مرکز میانگین قرار دارد و به طور متقارن مطابق با انحراف استاندارد توزیع می شود.
توزیع نرمال رایج ترین توزیع احتمال برای ارزیابی داده های نوع A است. اگر نمی دانید داده های نوع A چیست، باید گفت داده هایی می باشند که از آزمایش های تجربی، مانند تکرارپذیری، تجدید پذیری، و آزمون پایداری جمع آوری می شوند.
برای درک بهتر، تصور کنید که می خواهید 100 نمونه اندازه گیری جمع آوری کنید و یک نمودار هیستوگرام با نتایج خود ایجاد کنید. هیستوگرام داده های شما باید شبیه شکلی نزدیک به توزیع نرمال باشد.
هر چه داده های بیشتری جمع آوری کنید، هیستوگرام شما به یک توزیع عادی نزدیک تر می شود.
اکنون، من انتظار ندارم که هر بار که آزمون تکرارپذیری و تجدید پذیری را انجام می دهید، 100 نمونه جمع آوری کنید. در عوض، من توصیه می کنم که با جمع آوری 20 تا 30 نمونه برای هر آزمون شروع کنید. این کار باید یک پایه خوب برای شروع به شما ارائه دهد و به شما این امکان را می دهد که داده های خود را با توزیع نرمال مشخص کنید.
برای تبدیل داده های توزیع شده نرمال به معادل انحراف استاندارد، از معادله زیر استفاده کنید. متغیر U مقدار مولفه عدم قطعیت شما و k مقدار ضریب فاکتور پوشش شما خواهد بود.
به عنوان مثال، اگر 20 نمونه را برای آزمون تکرارپذیری جمع آوری کنید و انحراف استاندارد را محاسبه کنید، مقدار k برابر 1 است. زیرا انحراف معیار شما قبلاً در سطح 1 سیگما است (یعنی 68.27 ٪). (سطح اطمینان).
بنابراین، اگر انحراف معیار محاسبه شده شما 1ppm باشد، پس؛
هنگام استفاده از مایکروسافت اکسل برای محاسبه عدم قطعیت اندازه گیری، از معادله زیر استفاده کنید:
برای مثال بعدی، تصور کنید که عدم قطعیت اندازه گیری را از گزارش کالیبراسیون خود ارزیابی می کنید. به احتمال زیاد، در جایی که k برابر با 2 است،سطح اطمینان برابر با 95٪ گزارش شده است (مطمئن هستم که قبلاً این را در جایی خوانده اید). اگر عدم قطعیت گزارش شده شما 1 ppm است، پس؛
هنگام استفاده از مایکروسافت اکسل برای محاسبه عدم قطعیت اندازه گیری، از معادله زیر استفاده کنید:
توزیع مستطیلی (معروف به یکنواخت).
توزیع مستطیلی تابعی است که توزیع یکنواخت پیوسته و احتمال ثابت را نشان می دهد. در یک توزیع مستطیلی، همه نتایج به یک اندازه ممکن است رخ دهند.
توزیع مستطیلی رایج ترین توزیع احتمال در تحلیل عدم قطعیت است. اگر می پرسید چرا، به این دلیل است که اکثر مولفه های عدم قطعیت را پوشش می دهد، در جایی که ارزیاب می گوید: «مطمئن نیستم که داده ها چگونه توزیع شده اند».
وقتی از نحوه توزیع داده های خود مطمئن نیستید، بهتر است آن را محافظه کارانه ارزیابی کنید. در این شرایط، توزیع مستطیلی یک گزینه پیش فرض عالی است، به همین دلیل است که اکثر ارزیابان ISO/IEC 17025 آن را توصیه می کنند. بنابراین، حتما توجه داشته باشید که از این توزیع احتمال زیاد استفاده خواهید کرد.
برای کاهش عوامل عدم قطعیت به معادل های انحراف استاندارد، باید مقادیر خود را بر ریشه مربع یا 3 تقسیم کنید.
برای مثال، اگر شما تجزیه و تحلیل عدم قطعیت اندازه گیری را انجام می دهید و سهم عاملی را ارزیابی می کنید که تأثیری معادل 1 در میلیون دارد و پیشنهاد می کنید که داده ها به طور یکنواخت توزیع شوند، آن وقت؛
هنگام استفاده از مایکروسافت اکسل برای محاسبه عدم قطعیت اندازه گیری، از معادله زیر استفاده کنید:
توزیع U شکل
توزیع U شکل تابعی است که نتایجی را نشان می دهد که به احتمال زیاد در انتهای محدوده رخ می دهد. توزیع شکل حرف U را تشکیل می دهد، اما لزوماً نباید متقارن باشد.
توزیع U شکل در جایی که رویدادها اغلب در منتهی الیه محدوده رخ می دهند مفید است. ترموستاتی را در نظر بگیرید که دمای آزمایشگاه شما را کنترل می کند. اگر از کنترل کننده PID استفاده نمی کنید، کنترل کننده ترموستات شما فقط با فعال سازی در نقاط مرزی سعی می کند دما را کنترل کند.
به عنوان مثال، تصور کنید که ترموستات آزمایشگاهی شما روی 20 درجه سانتیگراد تنظیم شده است و دما را تا 1 درجه سانتیگراد کنترل می کند. به احتمال زیاد، ترموستات شما تا زمانی که دمای آزمایشگاه به 19 درجه سانتیگراد یا 21 درجه سانتیگراد نرسد، سیستم HVAC شما را فعال نمی کند. این بدان معناست که دمای آزمایشگاه شما معمولاً 20 درجه سانتیگراد نیست. در عوض، قبل از فعال یا غیرفعال شدن، دمای آزمایشگاه شما در اطراف آستانه ترموستات شناور است.
به همین دلیل، بهتر است داده های دمای آزمایشگاه خود را با استفاده از توزیع U شکل مشخص کنید.
برای تبدیل عوامل عدم قطعیت به معادل های انحراف استاندارد، باید مقادیر خود را بر ریشه مربع یا 2 تقسیم کنید.
بنابراین، اگر شما تجزیه و تحلیل عدم قطعیت اندازه گیری را انجام می دهید و سهم مولفه ای را ارزیابی می کنید که تأثیر 1 در میلیون دارد و پیشنهاد می کنید که داده های این عامل به شکل u توزیع شده است، آن وقت؛
هنگام استفاده از مایکروسافت اکسل برای محاسبه عدم قطعیت اندازه گیری، از معادله زیر استفاده کنید:
=[Cell1]/SQRT(2)
توزیع مثلث
توزیع مثلث تابعی است که حداقل، حداکثر و مقدار مرکزی تخمین زده شده را نشان می دهد. معمولاً از آن به عنوان توزیع «عدم دانش» یاد می شود زیرا معمولاً در جایی استفاده می شود که رابطه بین متغیر ها مشخص است، اما داده ها ترسناک هستند.
علاوه بر این، توزیع مثلث معمولاً در مواردی استفاده می شود که جمع آوری داده ها دشوار یا گران است.
برای مثال در دنیای واقعی، تصور کنید آزمایشگاه شما با استفاده از یک کنترل کننده ترموستات PID کنترل می شود. کنترل کننده ترموستات PID دائما در تلاش است تا به نقطه تنظیم دمای مورد نظر دست یابد. به همین دلیل، دمای آزمایشگاه شما دائماً در حدود 20 درجه سانتیگراد شناور است و به ندرت به آستانه دما (یعنی حدود) یک کنترل کننده ترموستات معمولی می رسد.
این بدان معنی است که بیشتر داده های دمای آزمایشگاه شما حول دمای تنظیم شده شما متمرکز است. بنابراین، بهتر است با توزیع مثلثی مشخص شود، زیرا ما حدود و میانگین تخمین زده شده را می دانیم، اما مطمئن نیستیم که چگونه داده ها بین این نقاط توزیع می شود.
برای تبدیل عوامل عدم قطعیت به معادل های انحراف استاندارد، باید مقادیر خود را بر ریشه مربع یا 6 تقسیم کنید.
بنابراین، اگر شما تجزیه و تحلیل عدم قطعیت اندازه گیری را انجام می دهید و سهم عاملی را ارزیابی می کنید که تأثیر 1 در میلیون دارد و پیشنهاد می کنید که داده های این مولفه به صورت مثلثی توزیع شده است، با استفاده از معادله بالا، مقدار آن را کاهش می دهید.
اگر از مایکروسافت اکسل برای محاسبه عدم قطعیت اندازه گیری استفاده می کنید، از معادله زیر استفاده کنید:
=[Cell1]/SQRT(6)
توزیع لگاریتمی-نرمال
توزیع لگاریتمی-نرمال تابعی از یک لگاریتم نرمال است که به طور نرمال توزیع می شود.
توزیع لگاریتمی-نرمال توزیعی است که معمولاً با آن مواجه می شویم اما به ندرت استفاده می شود. بیشتر اوقات این نتیجه عدم دانش یا عدم ایجاد هیستوگرام برای داده های شما است.
برای مثال، اگر اندازهگیری هایی را انجام می دهید که محدود هستند، مانند طول، قد، وزن و غیره، به احتمال زیاد به داده هایی خواهید رسید که شبیه یک توزیع لگاریتمی-نرمال است. این مورد بیشتر در اندازه شناسی ابعادی و مکانیکی رایج است.
برای درک بهتر، به کالیبره کردن یک گیج بلوک فکر کنید. قبل از شروع کالیبراسیون، طول هدف را می دانید. اگر اندازه گیری های مکرر را در یک نقطه از گیج بلوک انجام دهید، اکثر نتایج اندازه گیری شما حول طول واقعی گیج بلوک متمرکز می شود. برخی از نتایج اندازه گیری، بزرگتر از مقدار واقعی گیج بلوک خواهند بود و نتایج اندازه گیری بسیار کمتر از مقدار واقعی گیج بلوک خواهد بود.
دلیل این اتفاق این است که نتایج اندازه گیری شما توسط طول گیج بلوک محدود شده است. در واقع، شما نمی توانید کمتر از طول بلوک را اندازه گیری کنید. بنابراین، نتایج اندازه گیری شما محدود است.
دفعه بعد که اندازه گیری هایی را انجام می دهید که متناهی هستند، مطمئن شوید که توزیع لگاریتمی-نرمال را در نظر می گیرید. ممکن است از مواجهه با خطاهای اندازه گیری و عدم قطعیت های اشتباه در محاسبه جلوگیری شود.
برای تبدیل مولفه های عدم قطعیت به معادل های انحراف استاندارد، باید از معادله زیر استفاده کنید.
توزیع ریلی
توزیع های ریلی زمانی استفاده می شوند که بزرگی یک بردار با مولفه های جهت آن مرتبط باشد (مانند x و y)، که می توانند مؤلفه های واقعی و موهومی نیز باشند (مانند i و j).
هنگامی که اجزای جهت متعامد و به طور معمول توزیع می شوند، بردار حاصل توزیع ریلی خواهد بود.
توزیع های ریلی معمولاً در مترولوژی الکتریکی برای توابع RF و مایکروویو استفاده می شود. علاوه بر این، آنها معمولاً در مترولوژی مکانیکی که بردار ها درگیر هستند استفاده می شوند.
به عنوان مثال، هنگامی که سرعت باد با مولفه های بردار دو بعدی آن، x و y آنالیز می شود، بردار حاصل توزیع ریلی است. برای اینکه این اتفاق بیفتد، x و y باید متعامد و به طور معمول توزیع شوند.
تبدیل مولفه های عدم قطعیت به معادل های انحراف استاندارد با توزیع های ریلی دشوار است. برای محاسبه عدم قطعیت اندازه گیری مولفه برداری، باید انحراف استاندارد هر جزء جهتی را بدانید. پس از آن، می توانید از معادله زیر برای تبدیل مولفه عدم قطعیت خود به معادل انحراف استاندارد استفاده کنید.
برای توضیح بیشتر، مقاله مایکل دابرت از Agilent (در حال حاضر Keysight) را بخوانید.
https://www.keysight.com/us/en/assets/7018-03163/white-papers/5990-9185.pdf
نتیجه
توزیع های احتمال بخش مهمی از درک رفتار توابع، تجزیه و تحلیل داده ها و پیش بینی نتایج آینده است. به همین دلیل است که آنها جزء حیاتی تحلیل عدم قطعیت هستند. اگر عدم قطعیت اندازه گیری را بدون در نظر گرفتن توزیع های احتمالی تخمین می زنید، مرتکب اشتباه خواهید شد. بنابراین هنگام محاسبه عدم قطعیت حتما از این راهنما به عنوان مرجع استفاده کنید.
علاوه بر این، استفاده از این نمودار هرگز ضرری ندارد.
امیدوارم که این پست برای تحلیل عدم قطعیت شما مفید بوده باشد. نظرات خود را کامنت کنید و توزیع های احتمالی را که در تحلیل عدم قطعیت خود استفاده می کنید به من بگویید.