Abstract
Automated systems for understanding display boards are finding many applications useful in guiding tourists, assisting visually challenged and also in providing location aware information. Such systems require an automated method to detect and extract text prior to further image analysis. In this paper, a methodology to detect and extract text regions from low resolution natural scene images is presented. The proposed work is texture based and uses DCT based high pass filter to remove constant background. The texture features are then obtained on every 50×50 block of the processed image and potential text blocks are identified using newly defined discriminant functions. Further, the detected text blocks are merged and refined to extract text regions. The proposed method is robust and achieves a detection rate of 96.6% on a variety of 100 low resolution natural scene images each of size 240×320
چکیده
سیستم های خودکار برای درک صفحه نمایش، برای بسیاری از برنامه های کاربردی در زمینه ی هدایت گردشگران، کمک رسانی بصری به چالش کشیده شده و نیز در ارائه ی اطلاعات آگاه از مکان مفیدند. چنین سیستم هایی نیاز به یک روش خودکار برای شناسایی و استخراج متن قبل از تحلیل بیشتر تصویر دارند. در این مقاله، یک روش برای شناسایی و استخراج نواحی متن از تصاویر مناظر طبیعی با وضوح کم ارائه شده است. کار پیشنهادی مبتنی بر بافت است و از فیلتر مبتنی بر DCT با گذار بالا به منظور حذف پس زمینه ی ثابت استفاده می نماید. سپس ویژگی های بافت بر روی هر بلوک 50x50 از تصویر پردازش شده به دست میآیند و بلوک های متنی بالقوه با استفاده از توابع تفکیک تازه تعریف مشخص می شوند. علاوه بر این، بلوک های متنی تشخیص داده شده با هم ادغام و برای استخراج نواحی متن تصفیه می شوند. روش ارائه شده قوی می باشد و به نرخ تشخیص 96.6٪ در 100 تصویر منظره ی طبیعی با وضوح (کیفیت) پایین مختلف هر یک با اندازه ی 240x320 می رسد.
-1مقدمه
همانطور که مردم در سراسر جهان برای کسب و کار، آثار درست و / یا لذت حرکت می کنند ، آنها متنهای نوشته شده ای روی صفحات نمایش در محیط های خارجی پیدا می کنند که درکشان دشوار است. در چنین شرایطی، مردم راهنما و یا دستگاه های هوشمندی را جستجو می کنند که می تواند به آنها در ارائه ی اطلاعات ترجمه شده به زبان مادری خودشان کمک نماید. از آنجا که اکثر افراد دوربین تعبیه شده ای، در دستگاه دستی خود مانند تلفن های همراه و PDA ها حمل می کنند، امکان یکپارچه سازی راه حل های تکنولوژیک در این سیستم ها به منظور ارائه تسهیلات برای درک خودکار صفحه نمایش در محیط خارجی وجود دارد. این تسهیلات ممکن است به عنوان یک راه حل انتگرالی از طریق وب سرویس به عنوان تابع محاسباتی ضروری ارائه شود، که در سیستم های دستی در دسترس نیست. چنین سیستم های دستی مبتنی بر وبی باید فعال باشند تا تصاویر مناظر طبیعی موجود در صفحه نمایش را ضبط کنند و وب سرویسی برای بازیابی اطلاعات محلی ترجمه شده از متن نوشته شده بر روی صفحه نمایش را درخواست نمایند…