الگوریتم طبقه بندی درخت تصمیم C5 – آشنایی با C5.0 Decision Tree Algorithm

  • سه شنبه ۲۹ بهمن ۱۳۹۸
  • بازدید ۳,۳۳۳ نفر

تصویر c5-0-decision-tree-algorithm_3307 الگوریتم طبقه بندی درخت تصمیم C5 – آشنایی با C5.0 Decision Tree Algorithm

معرفی الگوریتم طبقه بندی درخت تصمیم C5

در این بخش به معرفی الگوریتم طبقه بندی درخت تصمیم C5 یا C5.0 Decision Tree Algorithm می پردازیم که یکی از تکنیک های مدلسازی در یادگیری ماشین (Machine Learning) می باشد. در ادامه ابتدا به توضیحاتی از درخت تصمیم‌ گیری پرداخته و سپس الگوریتم C5.0 معرفی می شود.

درخت تصمیم (Decision Tree)

درخت تصمیم‌ گیری (Decision Tree) یک ابزار برای پشتیبانی از تصمیم می باشد که از درخت ‌ها جهت مدلسازی استفاده می ‌کند. در تحقیقات و عملیات های مختلف از درخت تصمیم به صورت معمول استفاده می گردد. به‌ طور خاص در آنالیز تصمیم، به منظور مشخص کردن استراتژی که با بیشترین احتمال به هدف برسد مورد استفاده قرار می گیرد. از دیگر کاربرد های درختان تصمیم، توصیف محاسبات احتمال شرطی می باشد.

الگوریتم درخت تصمیم C5

الگوریتم C5.0 یک نوع درخت تصمیم گیری تک متغیره و بهبود یافته الگوریتم C4.5 می باشد كه توسط محقق استرالیایی كوئین لن در سال 1993 طراحی شده است. الگوریتم درخت تصمیم گیری C5 یا C5.0 Decision Tree Algorithm مثل الگوریتم طبقه بند درخت تصمیم CART در ابتدا درختی كامل پر ایجاد می كند اما استراتژی هرس آن متفاوت می باشد. این الگوریتم كلاسه بندی را با تقسیم داده ها به زیر مجموعه هایی كه شامل ركورد های همگن تر از والد خود می باشند انجام می دهد. در الگوریتم درخت تصمیم C5 تقسیم كردن نمونه ها براساس فیلدی كه بیشترین بهره اطلاعات را شامل شود، صورت می گیرد. هر زیر نمونه بوسیله اولین انشعاب تعیین می گردد. سپس براساس فیلد جدیدی دوباره تقسیم بندی انجام می شود و این فرایند به تكرار خواهد شد تا زمانی که زیر نمونه ها امکان تقسیم شدن را نداشته باشند. در نتیجه انشعاب ها به پایین ترین سطح از نوآزموده می رسند و آن انشعاب هایی كه ارز چندانی ندارند از مدل حذف می گردد.

استنتاج قانون به کمک الگوریتم C5.0 براساس درخت تصمیم گیری (Decision Tree) می باشد. احتمالا بیشتر از یک قانون به ازای هر ركورد خاص صدق كند و یا هیچ قانونی مورد استفاده قرار نگیرد. در صورتی که چندین قانون برای یک ركورد مناسب باشند، آنگاه هر قانون مبتنی بر اطمینان مربوط به هر قانون، وزن vote می گیرد که در این صورت براساس تركیب وزن تمام قوانین مناسب برای ركورد، پیش بینی نهایی تعیین می گردد و در صورتی که هیچ قانونی مناسبی در کار نباشند، یک پیش گویی پیش فرض به آن ركورد نسبت داده می شود.

 

مطالب مرتبط
بررسی چالش های داده کاوی
ثبت نظر
ریفریش کنید!
نظرات کاربران (۰ مورد)

هیچ نظری ثبت نشده است