کشف کلاهبرداری در بانکداری الکترونیکی با MATLAB
در این بخش پروژه کشف کلاهبرداری در بانکداری الکترونیکی با الگوریتم های داده کاوی در نرم افزار MATLAB به همراه گزارش کار آماده کرده ایم که در ادامه توضیحاتی از معرفی پروژه ارائه شده و فیلم و تصاویر خروجی پروژه در محیط متلب قرار داده شده است.
داده کاوی در بانکداری الکترونیکی
داده کاوی تلاش برای استخراج دانش از حجم گسترده ای از داده های موجود می باشد. داده کاوی (Data Mining) با استفاده از مجموعه ای از روش های آماری و مدل سازی، می تواند الگوها و روابط پنهان موجود در پایگاه های داده را شناسایی کند. تا به امروز ابزارها و روش های مختلفی جهت پردازش اطلاعات ساخت یافته، توسعه داده شده که در نتیجه آنها ساخت پایگاه های اطلاعاتی و همینطور ایجاد انبار های داده به آسانی انجام می شود. سازمان ها می توانند با هزینه کم اطلاعات بسیار زیادی را از وضعیت کسب و کار خود جمع آوری و نگهداری کنند که این موضوع باعث شده تا استفاده از روش های داده کاوی ارزش قابل توجهی را برای سازمان به دست آورد. امروزه به دلیل وجود بانکداری الکترونیکی ثبت اطلاعات تراکنشی راحت تر صورت می گیرد. همچنین تقلب های صورت های مالی نیز به شکل چشم گیری توجه عموم جامعه، رسانه ها، سرمایه گذاران را به خود جلب کرده است و موسسات مالی و پولی به شدت به دنبال تسریع و سرعت عمل در شناخت فعالیت کلاهبرداران و متقلبان هسند. با توجه به این موضوع مهم، بکارگیری روش های شناسایی تقلب برای جلوگیری از اقدامات متقلبانه در سیستم های بانکداری الکترونیکی لازم و ضروری می باشد.
معرفی پروژه
در این پروژه سه مدل مشهور داده کاوی به نام های الگوریتم بیز ساده (Naïve Bayes)، الگوریتم رگرسیون منطقی (Logistic Regression) و الگوریتم درخت تصمیم C5 یا C5.0 Decision Tree Algorithm برای ایجاد مدل هایی استفاده شده و معیار های مختلف در مجموعه داده هایی با نرخ های متفاوت تراکنش های کلاهبردارانه برای آنها با هم مورد ارزیابی قرار گرفته اند.
مدل سازی
روش های داده کاوی بسیاری برای مدل سازی وجود دارد. در این فاز با استفاده از تکنیک های مختلف داده کاوی به یافتن مدل و الگوی بهینه پرداخته می شود. در این پروژه روش KFOLD را با 4 تکرار به عنوان تخصیص داده آموزش و آزمایش انتخاب کردیم. شیوه انتخاب داده ها نیز به صورت تصادفی می باشد. نرم افزار مورد استفاده در این پروژه نرم افزار MATLAB نسخه 2015 می باشد. در این مرحله سه مدل کلاس بند درخت تصمیم، رگرسیون منطقی و Naïve Bayes که مشهور در داده کاوی می باشند مورد استفاده قرار گرفته است. برای هر کدام از k ها دو نمودار confusion و ROC در نظر گرفته شده است. و معیار های ارزیابی مدل های پیش بینی محاسبه گردیده است. به منظور بهبود کار و به جهت رسیدن به نتایج بهتر، یک روش هیبرید پیشنهاد می کنیم. برای الگوریتم هیبرید پیشنهادی بدین شکل عمل می شود که هر سه سیستم مرحله آموزش خود را انجام می دهند و به ازای هر داده سه خروجی کلاس داریم سپس فراوانی آن بررسی می شود و کلاسی که بیشترین فراوانی را دارد به عنوان کلاس خروجی و نهایی ذخیره می گردد.
هیچ نظری ثبت نشده است