کتاب آشنایی با مفاهیم و تکنیک های داده کاوی به صورت PDF فارسی

کتاب آشنایی با مفاهیم و تکنیک های داده کاوی به صورت PDF فارسی

آشنایی با مفاهیم و تکنیک های داده کاوی

در این بخش دانلود رایگان کتاب آشنایی با مفاهیم و تکنیک های داده کاوی را به زبان فارسی در قالب ۱۰ فصل و ۳۱۵ صفحه به صورت فایل PDF آماده کرده ایم که یک کتاب جامعی در این زمینه می باشد. در ادامه به معرفی کتاب پرداخته و لینک دانلود رایگان آن قرار داده شده است.

داده کاوی

پیشرفت های صورت گرفته در جمع آوری داده ها و امکان ذخیره سازی در طول دهه های اخیر باعث رویارویی ما با بسیاری از علوم با حجم بزرگی از اطلاعات شده است. داده کاوی تلاشی به منظور بدست آوردن اطلاعات مفید از بین این داده می باشد و رشد بی رویه داده ها در سطح جهان اهمیت داده کاوی را دو چندان کرده است.

معرفی کتاب

فصل اول کتاب به مقدمه ای در رابطه با مفاهیم داده کاوی پرداخته است این فصل توضیحی کاملی برای مطالب موجود در کتاب بوده و روش های آماده سازی داده ها، فصل بعدی کتاب را تشکیل می دهد. فصل سوم توضیحی کوتاهی برای انبار داده ها و OLAP دارد و فصل چهار و پنجم نیز به قوانین انجمنی و موضوعات پیشرفته پیرامون آن اختصاص دارد. روش های طبقه بندی داده ها و همینطور نحوه ارزیابی آنها در فصل شش و هفت پوشش داده شده اند. الگوریتم های مختلف خوشه بندی نیز در فصل هشت و نهم مورد بررسی قرار می گیرند. سه موضوع قوانین انجمنی، طبقه بندی و خوشه بندی مفاهیم محوری کتاب حاضر هستند که برای هر کدام دو فصل تخصیص یافته است. در فصل پایانی نیز به بعضی از موضوعات مرتبط با داده کاوی به اختصار اشاره شده است.

فهرست مطالب کتاب آشنایی با مفاهیم و تکنیک های داده کاوی

فصل اول: مقدمه

  • استخراج دانش
  • انواع داده ها جهت داده کاوی
  • داده کاوی و تکنیک های آن
    • قوانین انجمنی
    • طبقه بندی
    • خوشه بندی
  • چالش های داده کاوی
  • سازماندهی کتاب
  • خلاصه فصل
  • مراجع و منابع جهت مطالعه بیشتر

فصل دوم: آماد سازی داده ها

  • انواع داده ها و خصوصیات آنها
    • متغیرهای کمّی
    • متغیرهای کیفی
  • ابعاد بالای داده ها
  • آمار
    • شاخص های مرکزی
    • میانگین
    • میانه
    • نما یا مُد
    • شاخص های پراکندگی
    • دامنه تغییرات و میانگین انحرافات
    • انحراف چارکی
    • واریانس و انحراف استاندارد
  • کوواریانس و ضریب همبستگی
  • توزیع نرمال
  • لزوم آماده سازی داده ها
  • تکنیک های آماده سازی داده ها
  • پالایش داده ها
    • تحلیل داده های خارج از محدوده
    • دسته بندی داده ها
    • خوشه بندی
    • رگرسیون
  • جمع آوری داده ها
  • تغییر شکل داده ها
  • کاهش داده ها
    • کاهش صفات خاصه
    • بررسی صفات خاصه بصورت مجزا برای کاهش ابعاد
    • محاسبه آنتروپی برای رتبه بندی صفات خاصه
    • الگوریتم تحلیل مولفه های اصلی (PCA)
    • کاهش نمونه ها
    • تکنیک های نمونه گیری
    • کاهش مقادیر یک صفت خاصه
    • روش آماری کای دو
    • گسسته سازی مبتنی بر آنتروپی
  • خلاصه فصل
  • مراجع و منابع جهت مطالعه بیشتر

فصل سوم: انبار داده ها و تکنولوژی OLAP

  • سیستم های تصمیم ساز
  • تحلیل داده ها و OLAP
    • OLAP
    • پیاده سازی OLAP
  • انبارسازی داده ها
    • شِما های انبار داده ها
  • خلاصه فصل
  • مراجع و منابع جهت مطالعه بیشتر

فصل چهارم: الگوهای مکرر و قوانین انجمنی

  • تحلیل سبد خرید
  • قوانین انجمنی
  • تولید الگوهای مکرر
    • الگوریتم Apriori
    • بهبود کارایی الگوریتم Apriori
    • الگوریتم FP-Growth
  • تولید قوانین انجمنی
  • پایگاه داده تراکنشی و قالب های متفاوت داده ها
  • مجموعه اقلام ماکسیمال و بسته
  • خلاصه فصل
  • مراجع و منابع جهت مطالعه بیشتر

فصل پنجم: مباحث پیشرفته در قوانین انجمنی

  • ارزیابی قوانین انجمنی
  • نکاتی پیرامون معیار پشتیبان
  • الگوهای غیرمکرر
    • الگوهای منفی و الگوهایی با همبستگی منفی
    • تکنیک هایی برای کاوش الگوهای غیرمکرر
    • تکنیک های مبتنی بر کاوش الگوهای منفی
    • تکنیک های مبتنی بر مقدار پشتیبان
  • انواع دیگری از قوانین انجمنی
  • صفات گسسته و قوانین انجمنی
  • قوانین انجمنی مقداری
  • سلسله مراتب مفهومی و قوانین انجمنی
  • توالی ها
  • کاوش توالی های مکرر
  • خلاصه فصل
  • مراجع و منابع جهت مطالعه بیشتر

فصل ششم: طبقه بندی داده ها

  • مفاهیم و تعاریف اولیه
  • اندازه گیری خطای روش تخمین
  • ارزیابی مدل
    • تکنیک Holdout
    • تکنیک Random Subsampling
    • تکنیک k-fold cross-validation
    • تکنیک Bootstrap
  • روش های مقایسه مدل ها
    • تخمین فاصله اطمینان
    • مقایسه عملکرد دو مدل
    • روشی دیگر برای تخمین فاصله اطمینان
    • منحنی ROC
  • استفاده از چند مدل
    • Bagging
    • Boosting
  • معیارهای دیگر جهت ارزشیابی روش ها
  • خلاصه فصل
  • مراجع و منابع جهت مطالعه بیشتر

فصل هفتم: روش های طبقه بندی و تخمین

  • درخت های تصمیم
    • معیارهای انتخاب صفت خاصه
    • معیار Information Gain
    • معیار Gini Index
    • معیار Gain Ratio
    • معیار Likelihood Ratio
    • معیار DKM
    • چند موضوع دیگر در مورد درختان تصمیم
    • چند الگوریتم درخت تصمیم
    • الگوریتم ID3
    • الگوریتم C4.5
    • الگوریتم CART
    • الگوریتم CHAID
  • طبقه بندی با کمک قانون بیز
  • روش های طبقه بندی مبتنی بر یافتن شروط
    • الگوریتم های یادگیری قوانین
    • معیارهای سنجش قوانین
    • بهینه نمودن قوانین
  • الگوریتم های SVM
    • تفکیک پذیری خطی
    • تفکیک پذیر غیرخطی
  • طبقه بندی براساس تشابه نزدیک
    • الگوریتم K نزدیکترین همسایه (KNN)
  • رگرسیون
    • رگرسیون خطی
    • رگرسیون غیرخطی و دیگر رگرسیون ها
  • روش های دیگر برای طبقه بندی
    • شبکه های عصبی
    • الگوریتم های ژنتیک
    • مجموعه های فازی
  • خلاصه فصل
  • مراجع و منابع جهت مطالعه بیشتر

فصل هشتم: خوشه بندی

  • اهمیت و انگیزه خوشه بندی
  • الگوریتم های خوشه بندی
  • معیارهای تشابه و انواع داده ها
    • معیارهای تشابه در داده های پیوسته
    • معیارهای تشابه در داده های دودویی (باینری)
    • معیارهای تشابه در داده های کیفی
  • تکنیک های خوشه بندی مبتنی بر افراز داده ها
    • الگوریتم k-Means
    • الگوریتم k-Medoids
    • الگوریتم های دیگر مبتنی بر افراز داده ها
  • تکنیک های خوشه بندی سلسله مراتبی
    • معیارهای تشابه میان خوشه ها
    • انتخاب دو نمونه با کمترین تشابه
    • میانگین تشابه (عدم تشابه) میان زوج نمونه ها
    • روش های مبتنی بر نمایندگان خوشه ها
  • الگوریتم BIRCH
  • الگوریتم CURE
  • الگوریتم ROCK
  • الگوریتم Chameleon
  • الگوریتم DIANA
  • خلاصه فصل
  • مراجع و منابع جهت مطالعه بیشتر

فصل نهم: مباحث پیشرفته در خوشه بندی

  • تکنیک های مبتنی بر تراکم
    • الگوریتم DBSCAN
    • الگوریتم OPTICS
    • الگوریتم DENCLUE
  • تکنیک های مبتنی بر گرید
    • الگوریتم STING
    • الگوریتم CLIQUE
  • تکنیک های خوشه بندی مبتنی بر مدل
    • الگوریتم EM
    • خوشه بندی مفهومی
  • یافتن الگوهای مکرر و خوشه بندی
  • استفاده از محدودیت ها در خوشه بندی
  • ارزشیابی روش های خوشه بندی
    • بررسی ساختار داده ها
    • تعداد خوشه ها
    • سنجش کیفیت خوشه بندی
  • خلاصه فصل
  • مراجع و منابع جهت مطالعه بیشتر

فصل دهم: مباحثی چند در داده کاوی

  • چند مثال کاربردی در داده کاوی
  • نکاتی در مورد محصولات تجاری داده کاوی
    • موضوعاتی چند جهت چگونگی انتخاب یک سیستم
    • چند بسته نرم افزاری داده کاوی
  • شکل های دیگری از داده کاوی
    • متن کاوی
    • وب کاوی
    • گراف کاوی
    • کاوش در داده های چند رسانه ای
    • داده کاوی مکان محور
  • خلاصه فصل
  • مراجع و منابع جهت مطالعه بیشتر

مشاهده ویدئو در این باره

خوشحال خواهیم شد اگر نظر خودتون رو درباره این مطلب ثبت کنید

خطا!دکمه ریفریش را بزنید
  1. تصویر آواتار کاربر 0
    ابوالفضل شنبه , ۱۷ شهریور

    سایت عالی دارید ممنون از مطالف ارائه شده، مفید بودن تشکر

  2. تصویر آواتار کاربر 0
    امینی چهارشنبه , ۴ مهر

    کتاب عالی است ممنون از شما

  3. تصویر آواتار کاربر 0
    افشین حسینی پنج شنبه , ۸ آذر

    سلام در مورد نرم افزار های داده کاوی می تونید چند بند توضیح بدین مجکرم.