طبقه بندی پایگاه داده ها
در این بخش یک مرور اجمالی بر طبقه بندی پایگاه داده ها در داده کاوی خواهیم داشت که امیدواریم برای علاقمندان به داده کاوی مفید باشد.
طبقه بندی پایگاه داده ها
طبقه بندی پایگاه داده ها منبع بسیار غنی از اطلاعات پنهان است که می توان به کمک این اطلاعات تصمیمات هوشمندی را اتخاذ نمود. در این میان طبقه بندی و تخمین دو شکل از تحلیل داده ها محسوب می شوند که می توان به کمک آنها مدلی جهت توصیف داده ها استخراج کرد و یا برای داده های بعدی جهتی متصور شد. بدین وسیله داده هایی با حجم بالا نیز بهتر فهمیده می شوند.
روش های نظارت شده در داده کاوی
روش های نظارت شده ای مانند طبقه بندی و تخمین تلاش می کنند تا رابطه میان صفات خاصه ی ورودی (که گاه متغیرهای مستقل نامیده می شوند) را با یک یا چندین صفت خاصه ی هدف) که گاه متغیر وابسته نامیده می شوند کشف کنند. در نهایت این رابطه با یک ساختار به عنوان مدل نمایش داده می شود. با کمک این مدل و با شرط داشتن صفات خاصه ی ورودی می توانیم مقدار صفت خاصه هدف را تخمین بزنیم. به عبارت دیگر با کمک مدل قادر هستیم نمونه ها را به یکی از چندین طبقه ی تعریف شده منتسب و یا مقدار تعیین شده ای را برای صفت خاصه هدف تعیین کنیم.
فرایند ساخت مدل
فرایند ساخت مدل یک فرایند دو مرحله ای است، که در مرحله ی اول با کمک مجموعه داده های آموزشی که برچسب کلاس تمام نمونه های آن مشخص است، مدل ساخته می شود. این مرحله به نام مرحله ی یادگیری شناخته می شود. در مرحله ی دوم با کمک مجموعه داده های آزمایشی که در آن معمولا برچسب کلاس ها نامعلوم است، مدل بدست آمده اعتبارسنجی می شود. در واقع ارزشیابی مدل با توجه به اینکه کلاس چه تعداد از نمونه داده های آزمایشی درست تخمین زده شده است، محاسبه می شود.
سلام جزوه طراحی پایگاه داده دانشگاه پیام نورو می خواستم اگه هست. ممنون موفق باشید.