داده های دسته بندی در مقابل داده های عددی
داده ها حقایق یا اطلاعاتی هستند که به منظور ارجاع یا تجزیه و تحلیل جمع آوری می شوند. اغلب این داده ها به عنوان ویژگی موضوع مورد نظر جمع آوری می شوند. این ویژگی می تواند از یکی به دیگری متفاوت باشد، بنابراین این ویژگی متغیر می تواند به عنوان یک متغیر در نظر گرفته شود. متغیرها می توانند اشکال مختلفی از مقادیر را در نظر بگیرند و این مقادیر در داده های جمع آوری شده ذاتی هستند.
متغیرها می توانند کیفی یا کمی باشند. یعنی اگر متغیر کمی باشد، پاسخ ها اعداد هستند و بزرگی صفت اندازه گیری شده را می توان با درجه خاصی از دقت بیان کرد.نوع دیگر، متغیرهای کیفی ویژگیهای کیفی را اندازهگیری میکنند و مقادیر در نظر گرفته شده توسط متغیرها را نمیتوان از نظر اندازه یا بزرگی بیان کرد. خود متغیرها به عنوان متغیرهای طبقهای شناخته میشوند و دادههایی که با استفاده از متغیر طبقهای جمعآوری میشوند، دادههای طبقهای هستند.
بیشتر درباره داده های عددی
دادههای عددی اساساً دادههای کمی هستند که از یک متغیر به دست میآیند و مقدار دارای حس اندازه / بزرگی است. دادههای عددی بهدستآمده بر اساس تئوری استنلی اسمیت استیونز به سه دسته دیگر تقسیم میشوند. داده های عددی می توانند ترتیبی، فاصله ای یا نسبتی باشند. نوع داده ها با روش اندازه گیری مقادیر تعیین می شود و انواع آن به عنوان سطوح اندازه گیری شناخته می شود.
وزن یک نفر، فاصله بین دو نقطه، دما، و قیمت سهام نمونههایی از دادههای عددی هستند.
در آمار، اکثر روش ها برای تجزیه و تحلیل داده های عددی مشتق شده اند. برای تجزیه و تحلیل داده های عددی از آمار توصیفی پایه و رگرسیون و سایر روش های استنباطی استفاده می شود.
بیشتر درباره داده های طبقه بندی
داده های طبقه بندی مقادیری برای یک متغیر کیفی، اغلب یک عدد، یک کلمه یا یک نماد هستند. آنها این واقعیت را آشکار می کنند که متغیر در مورد مورد نظر به یکی از چندین گزینه موجود تعلق دارد. بنابراین، آنها به یکی از مقوله ها تعلق دارند; از این رو نام آن طبقه بندی است.
وابستگی سیاسی یک فرد، ملیت یک فرد، رنگ مورد علاقه یک فرد و گروه خونی یک بیمار از ویژگی های کیفی است. گاهی اوقات، یک عدد را می توان به عنوان یک مقدار طبقه بندی به دست آورد، اما خود عدد نشان دهنده بزرگی ویژگی اندازه گیری شده نیست. کد پستی یک مثال است.
همچنین، هر مقدار مقوله ای متعلق به نوع داده اسمی است که بر اساس سطوح اندازه گیری، نوع دیگری است. روشهای مورد استفاده برای تجزیه و تحلیل دادههای طبقهای با دادههای عددی متفاوت است، اما اصل اساسی ممکن است یکسان باشد.
تفاوت بین داده های طبقه ای و عددی چیست؟
• داده های عددی مقادیری هستند که برای متغیر کمی به دست می آیند و دارای حس بزرگی مرتبط با بافت متغیر هستند (از این رو، آنها همیشه اعداد یا نمادهایی هستند که دارای یک مقدار عددی هستند). داده های طبقه بندی مقادیری هستند که برای یک متغیر کیفی به دست می آیند. اعداد طبقه بندی داده ها حس بزرگی ندارند.
• دادههای عددی همیشه به نوع ترتیبی، نسبت یا فاصله تعلق دارند، در حالی که دادههای طبقهبندی متعلق به نوع اسمی هستند.
• روشهای مورد استفاده برای تجزیه و تحلیل دادههای کمی با روشهای مورد استفاده برای دادههای طبقهبندی متفاوت است، حتی اگر اصول یکسان باشند، حداقل کاربرد تفاوتهای قابل توجهی دارد.
• داده های عددی با استفاده از روش های آماری در آمار توصیفی، رگرسیون، سری زمانی و بسیاری موارد دیگر تجزیه و تحلیل می شوند.
• برای داده های طبقه بندی معمولاً از روش های توصیفی و روش های گرافیکی استفاده می شود. برخی از آزمونهای ناپارامتریک نیز استفاده میشوند.