رگرسیون خطی در مقابل لجستیک
در تجزیه و تحلیل آماری، شناسایی روابط بین متغیرهای مربوط به مطالعه مهم است. گاهی ممکن است این تنها هدف خود تحلیل باشد. یکی از ابزارهای قوی که برای تعیین وجود رابطه و شناسایی رابطه استفاده می شود، تحلیل رگرسیون است.
ساده ترین شکل تحلیل رگرسیون، رگرسیون خطی است که در آن رابطه بین متغیرها یک رابطه خطی است. از نظر آماری، رابطه بین متغیر توضیحی و متغیر پاسخ را نشان می دهد. به عنوان مثال، با استفاده از رگرسیون می توان رابطه بین قیمت کالا و مصرف را بر اساس داده های جمع آوری شده از یک نمونه تصادفی ایجاد کرد.تجزیه و تحلیل رگرسیون یک تابع رگرسیون از مجموعه داده را تولید می کند، که یک مدل ریاضی است که بهترین تناسب را با داده های موجود دارد. این را می توان به راحتی با یک نمودار پراکنده نشان داد. رگرسیون گرافیکی معادل یافتن بهترین منحنی برازش برای مجموعه داده داده شده است. تابع منحنی تابع رگرسیون است. با استفاده از مدل ریاضی، استفاده از یک کالا را می توان برای یک قیمت معین پیش بینی کرد.
بنابراین، تحلیل رگرسیون به طور گسترده ای در پیش بینی و پیش بینی استفاده می شود. همچنین برای ایجاد روابط در داده های تجربی، در زمینه های فیزیک، شیمی، و در بسیاری از علوم طبیعی و رشته های مهندسی استفاده می شود. اگر رابطه یا تابع رگرسیون یک تابع خطی باشد، این فرآیند به عنوان رگرسیون خطی شناخته می شود. در نمودار پراکندگی می توان آن را به صورت یک خط مستقیم نشان داد. اگر تابع ترکیبی خطی از پارامترها نباشد، رگرسیون غیرخطی است.
رگرسیون لجستیک با رگرسیون چند متغیره قابل مقایسه است و مدلی را برای توضیح تأثیر پیشبینیکنندههای متعدد بر یک متغیر پاسخ ایجاد میکند.با این حال، در رگرسیون لجستیک، متغیر نتیجه نهایی باید مقولهای باشد (معمولاً تقسیم میشود؛ به عنوان مثال، یک جفت پیامد قابل دستیابی، مانند مرگ یا بقا، اگرچه تکنیکهای ویژه امکان مدلسازی اطلاعات طبقهبندیشدهتری را فراهم میکنند). یک متغیر نتیجه پیوسته ممکن است به یک متغیر طبقهبندی تبدیل شود تا برای رگرسیون لجستیکی استفاده شود. با این حال، جمع کردن متغیرهای پیوسته به این روش عمدتاً منع می شود زیرا دقت را کاهش می دهد.
برخلاف رگرسیون خطی، نسبت به میانگین، متغیرهای پیشبینیکننده در رگرسیون لجستیکی مجبور نیستند به صورت خطی به هم متصل شوند، معمولاً توزیع میشوند یا در داخل هر خوشه واریانس یکسانی داشته باشند. در نتیجه، رابطه بین متغیرهای پیشبینیکننده و نتیجه احتمالاً یک تابع خطی نیست.
تفاوت بین رگرسیون لجستیک و خطی چیست؟
• در رگرسیون خطی، یک رابطه خطی بین متغیر توضیحی و متغیر پاسخ فرض میشود و پارامترهای رضایتبخش مدل با تجزیه و تحلیل پیدا میشوند تا رابطه دقیق را نشان دهند.
• رگرسیون خطی برای متغیرهای کمی انجام می شود و تابع حاصل یک کمی است.
• در رگرسیون لجستیک، داده های مورد استفاده می توانند مقوله ای یا کمی باشند، اما نتیجه همیشه مقوله ای است.