تشخیص و ردیابی حرکت از فریم های ویدئویی با الگوریتم SLKCF
در این بخش پروژه تشخیص و ردیابی حرکت از فریم های ویدئویی با الگوریتم SLKCF در نرم افزار MATLAB را آماده کرده ایم که در ادامه به توضیحاتی از ردیابی بصری و معرفی الگوریتم SLKCF و پروژه پرداخته و فیلم و تصاویر خروجی قرار داده شده است. همچنین مقاله پایه الگوریتم SLKCF نیز برای دانلود قرار داده شده است.
ردیابی بصری (Visual tracking)
ردیابی بصری (Visual tracking) یکی از اساسی ترین کارها در زمینه بینایی ماشین (Computer vision) می باشد که دارای چندین کاربرد عملی از جمله پهپادها، کنترل ترافیک، تعامل انسان و رایانه و نظارت تصویری (دوربین های مدار بسته) است. پارامترهای مختلفی وجود دارد که باید در طراحی سیستم ردیابی مورد بررسی قرار گیرد، مانند ردیابی بلادرنگ (Real-time)، سازگاری و پایداری. اگرچه فناوری ردیابی بصری پیشرفت های چشمگیری در طی سال های اخیر داشته است اما به دلیل وجود عوامل مختلفی مانند انسداد، تغییر شکل، تغییر نور، تغییر در مقیاس و حرکت سریع اهداف، ردیابی شیء بصری به صورت طولانی مدت، بسیار چالش برانگیز است.
ردیابی بصری هدف با الگوریتم KCF بهبود یافته (SLKCF)
روش های مختلفی برای مقابله با مشکل ردیابی بصری (Visual tracking) ارائه شده است. ردیاب های مبتنی بر فیلتر همبستگی (Correlation Filter) در زمینه ردیابی هدف بصری مورد توجه زیادی قرار گرفته اند که از نظر دقت، پایداری و سرعت، مزایای چشمگیر را نشان داده اند. با این حال، هنوز هم برخی از چالش های موجود در روش های مبتنی بر فیلتر همبستگی، مانند تغییرات مقیاس هدف و انسداد وجود دارد. برای مقابله با این مشکلات، یک الگوریتم ردیابی فیلتر همبستگی هسته ای شده (KCF) بهبود یافته با نام SLKCF پیشنهاد شده است. الگوریتم SLKCF در مقاله An Improved Kernelized Correlation Filter Based Visual Tracking Method توسط جیانجون نی (Jianjun Ni) و همکاران ارائه شده است که این مقاله در ادامه برای دانلود قرار داده شده است.
معرفی پروژه
این پروژه پردازش تصویر در محیط نرم افزار MATLAB و با استفاده از مجموعه داده های Visual Tracker Benchmark انجام شده که به صورت پیش فرض از سه داده آن با ۱۶ تصویر به عنوان آزمون اولیه استفاده می شود که می توان تعداد فریم های بیشتری را نیز بکار برد. در برخی از داده ها، گراند تراث وجود دارد و در بعضی نیز وجود ندارد. تعریف موقعیت اولیه جهت شناسایی، تشخیص و ردیابی هرگونه تحرک در فریم های ویدئویی به صورت یک موقعیت شناخته شده و با ایجاد یک ماتریس، موقعیت به برنامه داده شده است.
نتایج و خروجی ها
همانظور که در تصاور خروجی نیز دیده می شود، نرخ AUC به عنوان یک معیار ارزیابی که ناحیه زیر منحنی در ROC می باشد، حدود ۰٫۸۵۹۲ را نشان می دهد. همچنین حداکثر نرخ حساسیت به مقدار ۱۹۴، حداکثر نرخ ویژگی ها ۱۰۷ و نرخ بهره وری هزینه ۱۴۸ و همینطور حداکثر نرخ کارایی ۱۶۰ نیز می باشد. به طور میانگین برای کل این مجموعه داده ها، ضریب باتاچاریا (Bhattacharyya) برابر با ۰٫۹۹۴۸ و نرخ ارزیابی CLE برابر با ۰٫۹۹۴۹ می باشد. همچنین نرخ دقت در تشخیص نیز ۹۱ درصد به دست آمده است. قابل ذکر است که ضریب باتاچاریا (Bhattacharyya coefficient)، نشان دهنده اندازه گیری مقدار همپوشانی بین دو نمونه آماری یا جمعیتی از آنها می باشد.
ضریب می تواند جهت تعیین نزدیک بودن نسبی دو نمونه مورد نظر مورد استفاده قرار گیرد. از آن به منظور اندازه گیری جدایی کلاس ها در طبقه بندی استفاده می شود و از نظر فاصله زمانی Mahalanobis قابل اعتمادتر می باشد که دلیل آن نیز این است که فاصله Mahalanobis یک مورد خاص از فاصله باتاچاریا (Bhattacharyya) می باشد، وقتی که انحراف استاندارد دو کلاس یکسان باشد. در نتیجه، وقتی که در دو کلاس با معنی مشابه ولی با انحرافات استاندارد مختلف، فاصله Mahalanobis صفر می شود، فاصله باتاچاریا بسته به تفاوت بین انحراف استاندارد افزایش پیدا می کند.
هیچ نظری ثبت نشده است