بررسی چالش های داده کاوی
در این بخش در قالب یک مقاله کوتاه به بررسی چالش های داده کاوی در قالب چهار بخش می پردازیم. در ادامه با ما همراه باشید.
تنوع داده ها، عملیات و تکنیک های داده کاوی
تنوع داده ها و عملیات و تکنیک های داده کاوی چالش های تحقیقاتی بسیاری را برای داده کاوی ایجاد نموده است. توسعه ی روش ها و سیستم های داده کاوی کارآ، ساخت محیط های داده کاوی مجتمع و تعاملی، طراحی زبان های داده کاوی و به کار بستن تکنیک های داده کاوی جهت حل برنامه های کاربردی عظیم از مهمترین وظایف پژوهشگران و توسعه دهندگان این حوزه کاری محسوب می شوند. در ادامه برخی از گرایش های داده کاوی که منعکس کننده این چالش ها است را بررسی می کنیم.
چالش های داده کاوی
- ایجاد سیستم های داده کاوی خاص یا تک منظوره. معمولا برنامه های موجود داده کاوی برای رقابت در حوزهی تجارت طراحی و پیاده سازی شده اند. بدون شک حوزه های دیگری مانند بیوانفورماتیک بسیار مستعد استفاده از راهکارهای داده کاوی هستند. به همین دلیل توسعه ی سیستم های خاص جهت این کاربردها یک نیاز محسوب می شود.
- توسعه روش های مقیاس پذیر و تعاملی. حجم بسیار زیاد داده ها و همچنین نرخ رشد بالای آن باعث شده است تا خصوصیت مقیاس پذیر بودن الگوریتم ها از توجه بیشتری میان محققان برخوردار باشد. تعامل بیشتر کاربران با سیستم های داده کاوی نیز از چالش های این حوزه محسوب می شود، هر چند برخی از سیستم ها با پذیرفتن محدودیت های کاربران، خروجی الگوریتم انتخابی را به سمت دلخواه کاربران هدایت می کنند.
- استاندارد سازی زبانه ای داده کاوی؛ وجود یک زبان استاندارد برای داده کاوی توسعه ی سیستماتیک اینگونه سیستم ها را تسهیل می کند. در ضمن آموزش ساده تر و ارتباط میان چند سیستم داده کاوی را نیز بهبود می بخشد. کوشش هایی در این زمینه انجام شده است.
- طراحی و پیاده سازی روش های جدید برای انواع داده های پیچیده. مجموعه داده های ورودی در الگوریتم های حال حاضر معمولا از ساختار ساده ای برخوردارند. جداول در مدل رابطه ای، انبار داده ها و پایگاه داده ی تراکنشی از این ساختارها به شمار می روند. رشد بی رویه ی داده ها در شکل ها و ساختارهای پیچیده تر، روش های داده کاوی را نیز تحت تأثیر خود قرار داده است. چگونگی برخورد تکنیک های داده کاوی با این نوع از داده های خاص مانند متون، داده های چندرسانه ای، گراف ها و… چالش بزرگی است. توسعه ی داده کاوی توزیع شده و بلادرنگ. بسیاری از الگوریتم های موجود داده کاوی برای محیط های توزیع شده مناسب نیستند. این در حالی است که امروزه سیستم های توزیع شده بسیار محبوب و رایج هستند. داده کاوی پویا نیز یکی از بایدهایی است که راهکارهایی را جهت استفاده در این گونه محیط ها می طلبد.
چالش ها و موضوعات دیگری مانند امنیت و داده کاوی، داده کاوی بصری، داده کاوی و مهندسی نرم افزار و غیره وجود دارند که هر یک به طیف وسیعی از مفاهیم و تعاریف نیاز دارند و می توانند موضوع پژوهشی مناسبی برای محققین به شمار آیند.
سلام من یه کتاب دقیق و جامع در مورد داده کاوی نیاز داشتم از سایت شما دوستان می تونم اونو تهیه کنم.
بله یک کتاب کامل برای داده کاوی از لینک زیر قابل دانلود است که می تونه کمکتون کنه:
کتاب آشنایی با مفاهیم و تکنیک های داده کاوی