پراکندگی در مقابل چولگی
در آمار و تئوری احتمال، اغلب تغییرات در توزیعها برای مقاصد مقایسه باید به صورت کمی بیان شود. پراکندگی و چولگی دو مفهوم آماری هستند که شکل توزیع در مقیاس کمی ارائه می شود.
بیشتر درباره پراکندگی
در آمار، پراکندگی تغییر یک متغیر تصادفی یا توزیع احتمال آن است. این معیاری است که نشان می دهد نقاط داده چقدر از مقدار مرکزی فاصله دارند. برای بیان این امر به صورت کمی، از معیارهای پراکندگی در آمار توصیفی استفاده می شود.
واریانس، انحراف استاندارد، و محدوده بین چارکی رایجترین معیارهای پراکندگی هستند.
اگر مقادیر داده دارای واحد معینی هستند، به دلیل مقیاس، اندازه گیری های پراکندگی نیز ممکن است واحدهای مشابهی داشته باشند. محدوده بین دهک، محدوده، اختلاف میانگین، انحراف مطلق میانه، میانگین انحراف مطلق، و فاصله استاندارد انحراف معیارهای پراکندگی با واحدها هستند.
در مقابل، معیارهایی برای پراکندگی وجود دارد که واحدی ندارد، یعنی بدون بعد. واریانس، ضریب تغییرات، ضریب ربع پراکندگی و اختلاف میانگین نسبی معیارهای پراکندگی بدون واحد هستند.
پراکندگی در یک سیستم می تواند از خطاهایی مانند خطاهای ابزاری و مشاهده ای ناشی شود. همچنین، تغییرات تصادفی در خود نمونه می تواند باعث تغییرات شود. مهم است که قبل از نتیجه گیری های دیگر از مجموعه داده ها، یک ایده کمی در مورد تغییرات داده ها داشته باشید.
بیشتر درباره Skewness
در آمار، چولگی معیاری برای عدم تقارن توزیعهای احتمال است. چولگی می تواند مثبت یا منفی و یا در برخی موارد وجود نداشته باشد. همچنین میتوان آن را بهعنوان اندازهگیری از توزیع نرمال در نظر گرفت.
اگر چولگی مثبت باشد، بخش عمده ای از نقاط داده در مرکز سمت چپ منحنی قرار می گیرند و دم سمت راست بلندتر است. اگر چولگی منفی باشد، بخش عمده ای از نقاط داده به سمت راست منحنی متمرکز شده و دم سمت چپ نسبتاً بلند است. اگر چولگی صفر باشد، جمعیت به طور معمول توزیع می شود.
در یک توزیع نرمال، یعنی زمانی که منحنی متقارن است، میانگین، میانه و حالت یک مقدار دارند. اگر چولگی صفر نباشد، این ویژگی برقرار نیست و میانگین، حالت و میانه ممکن است مقادیر متفاوتی داشته باشند.
ضریب چولگی اول و دوم پیرسون معمولاً برای تعیین چولگی توزیع ها استفاده می شود.
اولین کافه چولگی پیرسون=(میانگین – حالت) / (انحراف استاندارد)
ضریب چولگی دوم پیرسون=3 (میانگین – حالت) / (انحراف شنبه)
در موارد حساس تر، از ضریب گشتاور استاندارد فیشر-پیرسون تنظیم شده استفاده می شود.
G={n / (n-1)(n-2)} ∑i=1 ((y-ӯ)/s)3
تفاوت بین Dispersion و Skewness چیست؟
نگرانی پراکندگی در مورد محدوده ای که نقاط داده در آن توزیع شده اند، و چولگی مربوط به تقارن توزیع است.
هر دو معیار پراکندگی و چولگی معیارهای توصیفی هستند و ضریب چولگی نشاندهنده شکل توزیع است.
معیارهای پراکندگی برای درک محدوده نقاط داده و افست از میانگین استفاده می شود، در حالی که چولگی برای درک تمایل به تغییر نقاط داده در جهت خاصی استفاده می شود.