استخراج متن از تصاویر منوی غذای رستوران (OCR)
در این بخش پروژه استخراج متن از تصاویر منوی غذای رستوران با نرم افزار MATLAB که یک نوع سیستم OCR نیز به شمار می رود قرار داده ایم که پروژه ای مناسب در زمینه پردازش تصویر، بینایی ماشین، شناسی الگو و هوش مصنوعی می باشد. در ادامه این مطلب به معرفی سیستم های OCR پرداخته می شود و همچنین تصاویر و فیلمی از چگونگی کار کرد این برنامه را می توانید مشاهده کنید.
معرفی پروژه
بسیاری از مردم در هنگام مسافرت کردن به کشور های خارجی، وقتی به یک رستوران می روند، با نام های موجود در منو رستوران آشنا نیستند، که این مشکل چند علت دارد که یکی متفاوت بودن زبان است و دیگری که مهم تر نیز می باشد تفاوت های فرهنگی است. این پروژه ایی که در این مطلب برای شما آماده شده است، به خوبی می تواند با استفاده از پردازش تصاویر و بینایی ماشین، متن موجود در تصاویر را استخراج کند و با استفاده از ابزار های مترجم آن را به زبانی که شما صحبت می کنید در آورد.
سیستم های استخراج متن از تصاویر یا OCR
کاری که سیستم های OCR (Optical character recognition) انجام می دهند، بازیابی متن از روی عکس مربوط به صفحه اسکن شده و یا عکس های دیجیتالی می باشد. سیستم های OCR زمینه تبدیل متن چاپ شده به فایل الکترونیکی را به صورت مستقیم فراهم می سازد، حال کیفیت این فایل الکترونیکی به قدرت الگوریتم های پردازش تصویر و شناسایی الگو استفاده شده در سیستم بستگی دارد. کاربرد های مهم سیستم های استخراج متن از تصاویر یا استخراج ویژگی های تصاویر، در زمینه کمک به نابینا و کم بینا، اتوماسیون اداری و فرآیند تولید کتابخانه با منابع دیجیتالی و غیره است.
آینده ایی که در پیش روی سیستم OCR می باشد
سیستم های OCR، هنوز به طور صد در صد آماده نشده اند، اما این سیستم ها روز به روز در حال پیشرفت و تکامل هستند. الگوریتم هایی که جدیدا شاهد ارائه شدن آنها در مقالات مختلف هستیم، تلاش می کنند تا اصلی ترین مشکل این سیستم، که چسبیدن کاراکتر ها در کنار هم یا بریده شدن استروک ها در تصاویر و اسناد با کیفیت پایین می باشد، را حل کنند. می توان گفت که سیستم OCR یکی از گسترده ترین موضوعات پژوهشی و تحقیق در زمینه بازشناسی الگو یا Pattern Recognition می باشد. یکی از کار های مهم در امر تحلیل اسناد شناسایی و تفسیر گرافیک می باشد زیرا در یک سند عناصر گرافیکی به صورت های مختلفی در کنار متن قرار می گیرند، به عنوان نمونه، دیاگرام هایی که مفاهیم متن را روشن و واضح تر می کنند، لوگو های شرکت ها در سربرگ نامه های اداری، خط های جدا کننده فیلد ها در جداول و همینطور قسمت های متنی. هدف اصلی سیستم این است که با اطلاعاتی که بدست می آورد بتواند محتوای مدجود در اسناد را توصیف کند.
بنده خیلی تلاش کردم تا برنامه استخراج متن از تصاویر رو با متلب بنویسم اما نتونستم و سایت ها و کتاب ها هم کمکی در این زمینه بهم نکردند. ولی این پروژه کمک بسزایی به من در یادگیری این مبحث کرد با تشکر از شما
با سلام این فیلمی که گذاشتید اصلا صدا نداره. بعدش هم اینکه ظاهرا این فایل نتوانسته متن را به طور کامل تشخیص دهد و استخراج کند که اگر این گونه است، آیا راهی وجود دارد که متن را به طور کامل استخراج کند؟
سلام، بله فیلم بدون صدا هست و فقط نحوه اجرا کردن برنامه رو نشون میده. در مورد سوال دومتون باید عرض کنم که کارایی الگوریتم برنامه در این حد است.