الگوریتم طبقه بندی درخت تصمیم C5 – آشنایی با C5.0 Decision Tree Algorithm

الگوریتم طبقه بندی درخت تصمیم C5 – آشنایی با C5.0 Decision Tree Algorithm

معرفی الگوریتم طبقه بندی درخت تصمیم C5

در این بخش به معرفی الگوریتم طبقه بندی درخت تصمیم C5 یا C5.0 Decision Tree Algorithm می پردازیم که یکی از تکنیک های مدلسازی در یادگیری ماشین (Machine Learning) می باشد. در ادامه ابتدا به توضیحاتی از درخت تصمیم‌ گیری پرداخته و سپس الگوریتم C5.0 معرفی می شود.

درخت تصمیم (Decision Tree)

درخت تصمیم‌ گیری (Decision Tree) یک ابزار برای پشتیبانی از تصمیم می باشد که از درخت ‌ها جهت مدلسازی استفاده می ‌کند. در تحقیقات و عملیات های مختلف از درخت تصمیم به صورت معمول استفاده می گردد. به‌ طور خاص در آنالیز تصمیم، به منظور مشخص کردن استراتژی که با بیشترین احتمال به هدف برسد مورد استفاده قرار می گیرد. از دیگر کاربرد های درختان تصمیم، توصیف محاسبات احتمال شرطی می باشد.

الگوریتم درخت تصمیم C5

الگوریتم C5.0 یک نوع درخت تصمیم گیری تک متغیره و بهبود یافته الگوریتم C4.5 می باشد که توسط محقق استرالیایی کوئین لن در سال ۱۹۹۳ طراحی شده است. الگوریتم درخت تصمیم گیری C5 یا C5.0 Decision Tree Algorithm مثل الگوریتم طبقه بند درخت تصمیم CART در ابتدا درختی کامل پر ایجاد می کند اما استراتژی هرس آن متفاوت می باشد. این الگوریتم کلاسه بندی را با تقسیم داده ها به زیر مجموعه هایی که شامل رکورد های همگن تر از والد خود می باشند انجام می دهد. در الگوریتم درخت تصمیم C5 تقسیم کردن نمونه ها براساس فیلدی که بیشترین بهره اطلاعات را شامل شود، صورت می گیرد. هر زیر نمونه بوسیله اولین انشعاب تعیین می گردد. سپس براساس فیلد جدیدی دوباره تقسیم بندی انجام می شود و این فرایند به تکرار خواهد شد تا زمانی که زیر نمونه ها امکان تقسیم شدن را نداشته باشند. در نتیجه انشعاب ها به پایین ترین سطح از نوآزموده می رسند و آن انشعاب هایی که ارز چندانی ندارند از مدل حذف می گردد.

استنتاج قانون به کمک الگوریتم C5.0 براساس درخت تصمیم گیری (Decision Tree) می باشد. احتمالا بیشتر از یک قانون به ازای هر رکورد خاص صدق کند و یا هیچ قانونی مورد استفاده قرار نگیرد. در صورتی که چندین قانون برای یک رکورد مناسب باشند، آنگاه هر قانون مبتنی بر اطمینان مربوط به هر قانون، وزن vote می گیرد که در این صورت براساس ترکیب وزن تمام قوانین مناسب برای رکورد، پیش بینی نهایی تعیین می گردد و در صورتی که هیچ قانونی مناسبی در کار نباشند، یک پیش گویی پیش فرض به آن رکورد نسبت داده می شود.


مشاهده ویدئو در این باره

خوشحال خواهیم شد اگر نظر خودتون رو درباره این مطلب ثبت کنید

خطا!دکمه ریفریش را بزنید