دسته بندی و خوشه بندی در داده کاوی
در این بخش در یک مقاله کوتاه و مختصر به و معرفی و کاربرد های دسته بندی و خوشه بندی در داده کاوی می پردازیم، و الگوریتم های دسته بندی در این زمینه را معرفی کرده ایم.
دسته بندی یا Classification چیست ؟
دسته بندی عمل نگاشت یک آیتم داد های به یكی از چند دسته از پیش تعریف شده است که این عمل یک فرآیند دو مرحل های است. در مرحله اول، براساس جمع آوری مجموعه داده های آموزشی، یک مدل برای توصیف ویژگی های یک مجموعه از کلاس های داده، ساخته می شود. از آنجا که کلاس ها از پیش تعریف شده هستند، این مرحله را یادگیری نظارت شده نیز می نامند. در مرحله دوم، این مدل برای پیشبینی دسته های اشیاء یا داده های آینده استفاده می شود.
الگوریتم های دسته بندی
دسته بندی می تواند با استفاده از الگوریتم های یادگیری استنتاجی نظارت شده از قبیل تولید درخت های تصمیم، الگوریتم های دسته بندی مثل الگوریتم ماشین بردار پشتیبان (SVM) ، k نزدیكترین همسایه (KNN) ، Bayesian naive و غیره انجام شود. برای مثال دسته بندی بر روی داده های یک وب سایت سفارش کالا ممكن است منجر به کشف قوانین مطلوب به این صورت شود که 30 درصد از کاربرانی که سفارش آنلاین موزیک داشته اند در گروه سنی 19 تا 25 سال هستند.
خوشه بندی یا Clustering چیست ؟
خوشه بندی تكنیكی است برای گروه بندی یک مجموعه از آیتم هایی که ویژگی های مشابه دارند، به طوری كه آیتم های درون یک خوشه باید خیلی به هم شبیه باشند، همچنین آنها باید غیر مشابه با اشیاء خوشه های دیگر باشند. شباهت بین آیتم ها توسط توابع شباهت تعیین می شوند. معمولا شباهت ها به طور کمی به عنوان فاصله یا معیار های دیگر با توجه به نظر متخصصین حوزه، مشخص می شوند.
مثالی از کاربرد خوشه بندی
برای مثال، براساس الگوهای پس انداز و برداشت مشتریان، یک بانک می تواند افراد را به گروه های مختلفی خوشه بندی کند. برای گروه های مختلف، بانک می تواند سرویس بهتری ارائه دهد و همچنین مطمئن شود که تمام وام ها، باز پس گرفته می شوند. در خوشه بندی، برخلاف دسته بندی، هیچ خوشه ی از پیش تعریف شده ای وجود ندارد. به عنوان مثالی دیگر در حوزه کاوش استفاده از وب دو نوع خوشه مطلوب برای کشف شدن وجود دارد.
خوشه های کاربران و خوشه های صفحات
خوشه بندی کاربران برای ایجاد گروه هایی از کاربران است که الگوهای جستجوی مشابهی را نشان می دهند و علایق و عادات مشابه دارند. چنین دانشی به ویژه، معمولا برای پی بردن به آمار کاربر به منظور انجام بخش بندی مارکت در کاربرد های تجارت الكترونیک یا تولید محتوای وب شخصی سازی شده برای کاربران، بكار می رود. از طرف دیگر خوشه بندی صفحات، گروه هایی از صفحات را کشف خواهد کرد که محتوای مرتبط دارند و یا براساس درک کاربر، مرتبط به نظر می رسند.
سلام اگه میشه در مورد داده کاوی یه فیلم آموزشی رایگان هم بزارید خیلی مجکرم.
سلام شما واسه داده کاوی کتاب هم دارید یه دونه از بیرون خرید کردم خیلی مطالبش برام گنگه اگه هست آدرس میدید ببینمش مچکرم .
بله یک کتاب کامل برای داده کاوی از لینک زیر قابل دانلود است که می تونه کمکتون کنه:
کتاب آشنایی با مفاهیم و تکنیک های داده کاوی
با تشکر مطالب عالی و کاربردی است
سلام لطفا مقاله یا کار آماده در مورد خوشه بندی دارید اطلاع دهید ممنون ومتشکر