پیاده سازی الگوریتم خوشه بندی K-Means در نرم افزار متلب

پیاده سازی الگوریتم خوشه بندی K Means در نرم افزار متلب

الگوریتم خوشه بندی K-Means در متلب

در این بخش پیاده سازی الگوریتم خوشه بندی K-Means در نرم افزار MATLAB آماده کرده ایم که در ادامه به توضیحاتی در مورد معرفی این روش خوشه بندی و بهبود آن پرداخته و فیلم و تصاویر خروجی پروژه قرار داده شده است.

معرفی الگوریتم K-Means

الگوریتم خوشه‌ بندی کی میانگین (k-means clustering) یک روش در کمی ‌سازی بردارها می باشد که در اصل از پردازش سیگنال گرفته شده و در داده کاوی به جهت آنالیز خوشه بندی ، بسیار محبوب و مورد استفاده است. الگوریتم خوشه بندی K-Means با هدف تجزیه n مشاهدات به k خوشه می باشد که در آن هر یک از مشاهدات متعلق به خوش هایی با نزدیکترین میانگین آن می باشد که این میانگین به عنوان پیش‌ نمونه مورد استفاده قرار می گیرد. در این الگوریتم در ابتدا تعداد k نمونه به صورت اتفاقی از میان کل نمونه ها انتخاب می شوند. این نمونه ها به عنوان نماینده k خوشه شناخته خواهند شد. گاهی به آنها مرکز ثقل یا مرکز خوشه نیز اطلاق می شود. هر یک از نمونه های باقیمانده عضوی از خوش های خواهند بود که یکی از این نماینده ها (k نمونه) متعلق به آن است.

به عبارت دیگر با کمک معیارهایی همچون فاصله اقلیدسی تشابه هر یک از نمونه های باقیمانده را با k نماینده محاسبه می کنیم و نمونه مورد نظر به هر یک نزدیکتر بود، به عضویت آن خوشه در می آید. پس از آن برای هر خوشه، با محاسبه میانگین میان اعضای خوشه نماینده جدیدی انتخاب می گردد. این فرآیند تا پوشش معیاری جهت خاتمه کار تکرار می شود. برای مثال این فرآیند می تواند تا هنگامی که دیگر هیچ یک از نمونه ها خوشه های خود را تغییر ندهند، ادامه پیدا کند.

بهبود الگوریتم K-Means

به منظور بهبود الگوریتم K-Means پیشنهاد های متعددی وجود دارند که یکی از آنها که معمولا با نتیجه قابل قبولی نیز روبرو است، استفاده از الگوریتم های خوشه بندی سلسله مراتبی برای بدست آوردن مقدار k است و پس از به دست آمدن خوشه بندی ابتدایی، تکرارها در K-Means باعث بهبود در خوشه بندی های به دست آمده می شود. پیشنهاد دیگر استفاده از مُد و میانه به جای محاسبه میانگین بین نمونه های موجود در داده ها است. این روش ها که به ترتیب با نام های K-Modes و K-Medians شناخته می شوند و همانطور که از نامشان مشخص است با محاسبه مُد و میانه نمونه ها مرکز ثقل خوشه ها را بدست می آورند. استفاده از مُد باعث می شود تا داده ها به نوع داده های عددی محدود نباشند و بتوانیم ویژگی های طبقه بندی شده اسامی و ترتیبی را نیز در روش مزبور استفاده کنیم.

تصاویری از خروجی پروژه در محیط MATLAB

 پیاده سازی الگوریتم خوشه بندی K Means در نرم افزار متلب پیاده سازی الگوریتم خوشه بندی K Means در نرم افزار متلب

پیاده سازی الگوریتم خوشه بندی K Means در نرم افزار متلب

پیاده سازی الگوریتم خوشه بندی K Means در نرم افزار متلب

پیاده سازی الگوریتم خوشه بندی K Means در نرم افزار متلب


مشاهده ویدئو در این باره

خوشحال خواهیم شد اگر نظر خودتون رو درباره این مطلب ثبت کنید

خطا!دکمه ریفریش را بزنید