تفاوت اصلی بین خوشهبندی و طبقهبندی در این است که خوشهبندی یک تکنیک یادگیری بدون نظارت است که نمونههای مشابه را بر اساس ویژگیها گروهبندی میکند، در حالی که طبقهبندی یک تکنیک یادگیری نظارت شده است که برچسبهای از پیش تعریفشده را به نمونهها بر اساس ویژگیها اختصاص میدهد.
اگرچه خوشهبندی و طبقهبندی فرآیندهای مشابهی به نظر میرسند، بر اساس معنایشان تفاوتهایی بین آنها وجود دارد. در دنیای داده کاوی، خوشه بندی و طبقه بندی دو نوع روش یادگیری هستند. هر دوی این روش ها اشیاء را با یک یا چند ویژگی به گروه ها مشخص می کنند.
خوشه بندی چیست؟
خوشهبندی روشی است برای گروهبندی اشیا بهگونهای که اشیاء با ویژگیهای مشابه کنار هم قرار میگیرند و اشیایی با ویژگیهای متفاوت از هم جدا میشوند. این یک تکنیک رایج برای تجزیه و تحلیل داده های آماری برای یادگیری ماشین و داده کاوی است. تجزیه و تحلیل و تعمیم داده های اکتشافی نیز حوزه ای است که از خوشه بندی استفاده می کند.
شکل 01: خوشه بندی
خوشه بندی به داده کاوی بدون نظارت تعلق دارد. این یک الگوریتم خاص نیست، بلکه یک روش کلی برای حل یک کار است. بنابراین می توان با استفاده از الگوریتم های مختلف به خوشه بندی دست یافت.الگوریتم خوشه مناسب و تنظیمات پارامتر به مجموعه داده های فردی بستگی دارد. این یک کار خودکار نیست، اما یک فرآیند تکراری برای کشف است. بنابراین لازم است پردازش داده ها و مدل سازی پارامترها تا رسیدن به خواص مورد نظر اصلاح شود. خوشه بندی K-means و خوشه بندی سلسله مراتبی دو الگوریتم خوشه بندی رایج در داده کاوی هستند.
طبقه بندی چیست؟
طبقه بندی یک فرآیند طبقه بندی است که از مجموعه ای آموزشی از داده ها برای تشخیص، تمایز و درک اشیا استفاده می کند. طبقه بندی یک تکنیک یادگیری تحت نظارت است که در آن مجموعه آموزشی و مشاهدات به درستی تعریف شده در دسترس است.
شکل 02: طبقه بندی
الگوریتمی که طبقه بندی را پیاده سازی می کند طبقه بندی کننده است در حالی که مشاهدات نمونه هستند. الگوریتم K-Nearest Neighbor و الگوریتم های درخت تصمیم معروف ترین الگوریتم های طبقه بندی در داده کاوی هستند.
تفاوت بین خوشه بندی و طبقه بندی چیست؟
خوشه بندی یادگیری بدون نظارت است در حالی که طبقه بندی یک تکنیک یادگیری نظارت شده است. این نمونههای مشابه را بر اساس ویژگیها گروهبندی میکند در حالی که طبقهبندی برچسبهای از پیش تعریفشده را به نمونهها بر اساس ویژگیها اختصاص میدهد. خوشهبندی مجموعه داده را به زیر مجموعههایی تقسیم میکند تا نمونههایی با ویژگیهای مشابه گروهبندی شوند. از داده های برچسب دار یا مجموعه آموزشی استفاده نمی کند. از طرفی داده های جدید را با توجه به مشاهدات مجموعه آموزشی دسته بندی کنید. مجموعه آموزشی دارای برچسب است.
هدف از خوشهبندی گروهبندی مجموعهای از اشیاء است تا مشخص شود آیا رابطهای بین آنها وجود دارد یا خیر، در حالی که هدف طبقهبندی این است که یک شی جدید از مجموعه کلاسهای از پیش تعریفشده به کدام کلاس تعلق دارد.
خلاصه - خوشه بندی در مقابل طبقه بندی
خوشهبندی و طبقهبندی میتواند مشابه به نظر برسد، زیرا هر دو الگوریتم دادهکاوی مجموعه دادهها را به زیر مجموعهها تقسیم میکنند، اما آنها دو تکنیک یادگیری متفاوت در دادهکاوی برای به دست آوردن اطلاعات قابل اعتماد از مجموعهای از دادههای خام هستند. تفاوت بین خوشهبندی و طبقهبندی در این است که خوشهبندی یک تکنیک یادگیری بدون نظارت است که نمونههای مشابه را بر اساس ویژگیها گروهبندی میکند، در حالی که طبقهبندی یک تکنیک یادگیری نظارت شده است که برچسبهای از پیش تعریفشده را به نمونهها بر اساس ویژگیها اختصاص میدهد.
تقدیم به تصویر:
1."Cluster-2" توسط Cluster-2.gif: کار مشتق شده hellisp: (دامنه عمومی) از طریق Wikimedia Commons 2 "Magnetism" اثر جان آپلسد - کار شخصی. (دامنه عمومی) از طریق Wikimedia Commons