داده کاوی در مقابل OLAP
هر دو داده کاوی و OLAP دو فناوری متداول هوش تجاری (BI) هستند. هوش تجاری به روش های کامپیوتری برای شناسایی و استخراج اطلاعات مفید از داده های تجاری اشاره دارد. داده کاوی رشته ای از علوم کامپیوتر است که به استخراج الگوهای جالب از مجموعه های بزرگ داده می پردازد. این روش های بسیاری از هوش مصنوعی، آمار و مدیریت پایگاه داده را ترکیب می کند. OLAP (پردازش تحلیلی آنلاین) همانطور که از نام آن پیداست مجموعه ای از روش های جستجو در پایگاه های داده چند بعدی است.
داده کاوی به عنوان کشف دانش در داده ها (KDD) نیز شناخته می شود.همانطور که در بالا ذکر شد، رشته ای از علوم کامپیوتر است که به استخراج اطلاعات ناشناخته و جالب قبلی از داده های خام می پردازد. با توجه به رشد تصاعدی داده ها، به ویژه در زمینه هایی مانند تجارت، داده کاوی به ابزار بسیار مهمی برای تبدیل این حجم عظیم از داده ها به هوش تجاری تبدیل شده است، زیرا استخراج دستی الگوها در چند دهه گذشته به ظاهر غیرممکن شده است. به عنوان مثال، در حال حاضر برای کاربردهای مختلفی مانند تجزیه و تحلیل شبکه های اجتماعی، کشف تقلب و بازاریابی استفاده می شود. داده کاوی معمولاً با چهار کار زیر سر و کار دارد: خوشه بندی، طبقه بندی، رگرسیون و تداعی. خوشه بندی شناسایی گروه های مشابه از داده های بدون ساختار است. طبقه بندی قوانین یادگیری است که می تواند برای داده های جدید اعمال شود و معمولاً شامل مراحل زیر است: پیش پردازش داده ها، طراحی مدل سازی، یادگیری / انتخاب ویژگی و ارزیابی / اعتبار سنجی. رگرسیون یافتن توابعی با حداقل خطا برای مدل سازی داده ها است. و انجمن به دنبال روابط بین متغیرها است.داده کاوی معمولاً برای پاسخ به سؤالاتی مانند محصولات اصلی که ممکن است به کسب سود بالا در سال آینده در Wal-Mart کمک کند، استفاده می شود.
OLAP یک کلاس از سیستم ها است که به پرس و جوهای چند بعدی پاسخ می دهد. به طور معمول OLAP برای بازاریابی، بودجه بندی، پیش بینی و برنامه های کاربردی مشابه استفاده می شود. ناگفته نماند که پایگاه داده های مورد استفاده برای OLAP برای پرس و جوهای پیچیده و موقت با عملکرد سریع پیکربندی شده اند. معمولاً یک ماتریس برای نمایش خروجی یک OLAP استفاده می شود. سطرها و ستون ها با ابعاد پرس و جو تشکیل می شوند. آنها اغلب از روش های تجمیع در چندین جدول برای به دست آوردن خلاصه استفاده می کنند. مثلا میشه از فروش امسال وال مارت نسبت به پارسال اطلاع پیدا کرد؟ پیش بینی فروش در سه ماهه آینده چیست؟ با نگاه کردن به درصد تغییر در مورد روند چه می توان گفت؟
اگرچه بدیهی است که داده کاوی و OLAP شبیه به هم هستند زیرا آنها بر روی داده ها برای به دست آوردن اطلاعات کار می کنند، تفاوت اصلی در نحوه عملکرد آنها بر روی داده ها است.ابزارهای OLAP تجزیه و تحلیل دادههای چند بعدی را ارائه میکنند و خلاصهای از دادهها را ارائه میدهند، اما در مقابل، دادهکاوی بر نسبتها، الگوها و تأثیرات در مجموعه دادهها تمرکز دارد. این یک معامله OLAP با تجمیع است که به عملکرد داده ها از طریق "افزودن" خلاصه می شود، اما داده کاوی با "تقسیم" مطابقت دارد. تفاوت قابل توجه دیگر این است که در حالی که ابزارهای داده کاوی دادهها را مدلسازی میکنند و قوانین عملی را برمیگردانند، OLAP تکنیکهای مقایسه و کنتراست را در بعد تجاری در زمان واقعی انجام میدهد.