مقاله دسته بندی و خوشه بندی در داده کاوی

classification clustering data mining 1633 مقاله دسته بندی و خوشه بندی در داده کاوی

دسته بندی و خوشه بندی در داده کاوی

در این بخش در یک مقاله کوتاه و مختصر به و معرفی و کاربرد های دسته بندی و خوشه بندی در داده کاوی می پردازیم، و الگوریتم های دسته بندی در این زمینه را معرفی کرده ایم.

دسته بندی یا Classification چیست ؟

دسته بندی عمل نگاشت یک آیتم داد های به یکی از چند دسته از پیش تعریف شده است که این عمل یک فرآیند دو مرحل های است. در مرحله اول، براساس جمع آوری مجموعه داده های آموزشی، یک مدل برای توصیف ویژگی های یک مجموعه از کلاس های داده، ساخته می شود. از آنجا که کلاس ها از پیش تعریف شده هستند، این مرحله را یادگیری نظارت شده نیز می نامند. در مرحله دوم، این مدل برای پیشبینی دسته های اشیاء یا داده های آینده استفاده می شود.

الگوریتم های دسته بندی

دسته بندی می تواند با استفاده از الگوریتم های یادگیری استنتاجی نظارت شده از قبیل تولید درخت های تصمیم، الگوریتم های دسته بندی مثل الگوریتم ماشین بردار پشتیبان (SVM) ، k نزدیکترین همسایه (KNN) ، Bayesian naive و غیره انجام شود. برای مثال دسته بندی بر روی داده های یک وب سایت سفارش کالا ممکن است منجر به کشف قوانین مطلوب به این صورت شود که ۳۰ درصد از کاربرانی که سفارش آنلاین موزیک داشته اند در گروه سنی ۱۹ تا ۲۵ سال هستند.

خوشه بندی یا Clustering چیست ؟

خوشه بندی تکنیکی است برای گروه بندی یک مجموعه از آیتم هایی که ویژگی های مشابه دارند، به طوری که آیتم های درون یک خوشه باید خیلی به هم شبیه باشند، همچنین آنها باید غیر مشابه با اشیاء خوشه های دیگر باشند. شباهت بین آیتم ها توسط توابع شباهت تعیین می شوند. معمولا شباهت ها به طور کمی به عنوان فاصله یا معیار های دیگر با توجه به نظر متخصصین حوزه، مشخص می شوند.

مثالی از کاربرد خوشه بندی

برای مثال، براساس الگوهای پس انداز و برداشت مشتریان، یک بانک می تواند  افراد را به گروه های مختلفی خوشه بندی کند. برای گروه های مختلف، بانک می تواند سرویس بهتری ارائه دهد و همچنین مطمئن شود که تمام وام ها، باز پس گرفته می شوند. در خوشه بندی، برخلاف دسته بندی، هیچ خوشه ی از پیش تعریف شده ای وجود ندارد. به عنوان مثالی دیگر در حوزه کاوش استفاده از وب دو نوع خوشه مطلوب برای کشف شدن وجود دارد.

خوشه های کاربران و خوشه های صفحات

خوشه بندی کاربران برای ایجاد گروه هایی از کاربران است که الگوهای جستجوی مشابهی را نشان می دهند و علایق و عادات مشابه دارند. چنین دانشی به ویژه، معمولا برای پی بردن به آمار  کاربر به منظور انجام بخش بندی مارکت در کاربرد های تجارت الکترونیک یا تولید محتوای وب شخصی سازی شده برای کاربران، بکار می رود. از طرف دیگر خوشه بندی صفحات، گروه هایی از صفحات را کشف خواهد کرد که محتوای مرتبط دارند و یا براساس درک کاربر، مرتبط به نظر می رسند.


مشاهده ویدئو در این باره

خوشحال خواهیم شد اگر نظر خودتون رو درباره این مطلب ثبت کنید

خطا!دکمه ریفریش را بزنید
  1. تصویر آواتار کاربر 0
    نادیا جوادی دوشنبه , ۲۳ بهمن

    سلام اگه میشه در مورد داده کاوی یه فیلم آموزشی رایگان هم بزارید خیلی مجکرم.