بررسی انواع داده ها برای داده کاوی (Data Mining)

بررسی انواع داده ها برای داده کاوی (Data Mining)

انواع داده ها برای داده کاوی

در این بخش یک مقاله کوتاه به صورت متنی در مورد بررسی انواع داده ها برای داده کاوی را آماده کرده ایم که امیدواریم برای علاقمندان به داده کاوی مفید بوده باشد. در ادامه با ما همراه باشید تا چند مورد از داده ها را جهت داده کاوی مورد بررسی قرار دهیم.

عملیات داده کاوی

عملیات داده کاوی به یک نوع از داده ها محدود و محصور نمی گردد و اغلب داده های مختلفی بوسیله این سیستم ها پذیرفته می شوند. توجه داشته باشید روش های مختلفی برای نوع های متفاوتی از داده ها مناسب هستند و پیدا کردن یک راهکار کلی، تلاشی بیهوده به نظر می رسد. تکنیک های داده کاوی را می توان روی داده های غیرساخت یافته (مثل متون)، نیمه ساخت یافته (مثل اسناد) و ساخت یافته (مثل جداول در مدل رابطه ای) اعمال کرد. در این مقاله داده کاوی کوتاه به صورت خلاصه بعضی از آنها را مورد بررسی قرار می دهیم.

انواع داده ها برای داده کاوی

پایگاه داده رابطه ای

جداول در پایگاه داده رابطه ای یکی از رایج ترین شکل های ورودی برای الگوریتم های داده کاوی هستند. در جداول، سطرها نماینده نمونه ها و ستون ها ویژگی و صفات خاصه نمونه ها را تشکیل می دهند. اغلب روش های داده کاوی با این شکل از داده ها مشکلی ندارند. حتی در برخی از کاربردها کاربران ابتدا داده های خود را به این شکل تبدیل و پس از آن الگوریتم های داده کاوی را بر روی این شکل تبدیل یافته اجرا می کنند.

بررسی انواع داده ها برای داده کاوی (Data Mining)

داده های ساخت یافته

اکثر روش های داده کاوی بر روی داده های ساخت یافته مانند جداول متمرکز هستند، حال آنکه حجم وسیعی از اطلاعات در دسترس در دنیای واقعی به صورت نیمه ساخت یافته و یا غیرساخت یافته ذخیره شده اند. این پایگاه داده شامل مجموعه ی بزرگی از مستندات متنی مانند کتاب ها، مقالات و صفحات وب می شوند. این موضوع اهمیت استفاده از تکنیک های داده کاوی را برای این نوع از داده ها دوچندان کرده است. عموما این داده ها نیمه ساخت یافته هستند. برای مثال یک مقاله را در نظر بگیرید، این سند شامل برخی از ویژگی های ساخت یافته مانند عنوان، نویسنده، تاریخ چاپ و… و همچنین شامل واژه هایی است که از هیچ ساختاری (صرف نظر از ساختمان یک جمله) پیروی نمی کنند.

بررسی انواع داده ها برای داده کاوی (Data Mining)

انبار داده ها

انبار داده ها شکل دیگری از داده ها تلقی می شوند که از آنها می توان به تنهایی نیز جهت تحلیل داده ها استفاده نمود. یک انبار داده ها مخزنی از اطلاعات جمع آوری شده از چندین منبع داده ای تحت یک شِمای واحد است. به دلیل آنکه این داده ها از منابع متفاوتی جمع آوری می شوند، عملیاتی چون پالایش داده ها، حذف نویز و داده های ناقص و تبدیل داده ها به شکل های مناسب برای داده کاوی بر روی آن انجام می گردد.

بررسی انواع داده ها برای داده کاوی (Data Mining)

پایگاه داده تراکنشی

پایگاه داده تراکنشی شکل دیگری از داده هاست و همانطور که از نام آن مشخص است، حاوی مجموعه رکوردهایی است که هر یک از آنها دلالت بر یک تراکنش واحد همراه با اطلاعات دیگر دارد. تحلیل سبد خرید مشتریان فروشگاه ها نمونه ای بارز از این نوع از داده ها است.

بررسی انواع داده ها برای داده کاوی (Data Mining)

صفت خاصه زمان

بدون شک صفت خاصه زمان ویژگی بسیار مهمی برای مجموعه داده ها محسوب می شود. پایگاه داده ای که شامل صفت خاصه زمان است، اطلاعات مفیدتر و دقیق تری را تحت اختیار کاربران قرار می دهد. چنین پایگاه داده ای که حاوی رخدادهایی است که با زمان تغییر می کند، پایگاه دادهی سری های زمانی می نامیم. تکنیک های داده کاوی می توانند رفتار محتویات تراکنش ها را در رابطه با زمان بررسی کنند.

بررسی انواع داده ها برای داده کاوی (Data Mining)

وب کاوی (Web Mining)

امروزه وب یک مخزن دادهای پویا و نیز ناهمگن محسوب می شود که در آن می توان انواع داده ها از جمله متن، صدا و تصویر را یافت. وب کاوی پیوند تکنیک های داده کاوی با این مجموعه از داده ها است. کاوش در داده های چندرسانه ای نیز می تواند به وب کاوی کمک کند. یک سیستم مدیریت پایگاه داده چندرسانه ای مجموعه وسیعی از داده های چندرسانه ای را ذخیره و مدیریت می کند. این داده ها می توانند صدا، تصویر، ویدئو، گرافیک، متن و حتی داده هایی مانند صفحات وب باشند. برای کاوش در میان داده های چندرسانه ای، ذخیره و بازیابی موثر و سریع داده ها از اهمیت بالایی برخوردار است.

بررسی انواع داده ها برای داده کاوی (Data Mining)

پایگاه داده مکان محور (SDI)

یک پایگاه داده مکان محور شامل مجموعه داده های زیادی در رابطه با مکان است. نقشه ها، تصاویر پزشکی و لایه های تراشه های VLSI نمونه ای از این داده ها به شمار می روند. این نوع از پایگاه داده ها دارای یک سری از ویژگی ها هستند که می توان آن را از پایگاه داده نوع رابطه ای تشخیص داد. امروزه داده کاوی این نوع از پایگاه داده بطور گسترده ای مورد استفاده کاربران قرار می گیرد.

بررسی انواع داده ها برای داده کاوی (Data Mining)

خوشحال خواهیم شد اگر نظر خودتون رو درباره این مطلب ثبت کنید

خطا!دکمه ریفریش را بزنید
  1. تصویر آواتار کاربر 0
    محمدرضا امیری یکشنبه , ۴ آذر

    با سلام خدمت شما و تیم خیلی خوبتون. لطفا تشکر صمیمانه من از ته قلبم را پذیرا باشید . نمیدونم چه طوری تشکر کنم از این همه فایلای با ارزشتون و با حالتون. واقعا عالیه و دمتون گرم. میخواستم اگه لطف کنید و آموزش gui در متلب هم بزارید ممنون میشم. و اگه میشه برام ایمیل کنید.