Abstract
We describe a binarisation method designed specifically for OCR of low quality camera images: background surface thresholding or BST. This method is robust to lighting variations and produces images with very little noise and consistent stroke width. BST computes a "surface" of background intensities at every point in the image and performs adaptive thresholding based on this result. The surface is estimated by identifying regions of low-resolution text and interpolating neighbouring background intensities into these regions. The final threshold is a combination of this surface and a global offset. According to our evaluation BST produces considerably fewer OCR errors than Niblack's local average method while also being more runtime efficient
چکیده
در این مقاله یک روش دوتایی یا دودویی سازی نوین را تشریح می کنیم که به طور اختصاصی برای OCR تصویر دوربین کیفیت پایین طراحی شده است: آستانه سازی سطح پس زمینه یا BST. این روش برای تغییرات نورپردازی بسیار قوی بوده و تصاویری با نویز یا صدای بسیار کم و پهنای قلم مستمر یا ثابت تولید می کند. BST یک " سطح " از شدت های پس زمینه در هر نقطه از تصویر را محاسبه کرده و آستانه سازی سازگار مبتنی بر این نتیجه اجرا می کند. سطح، با استفاده از شناسایی نواحی متن با رزولوشن پایین و درون یابی شدت های پس زمینه همسایه در این نواحی ، تخمین زده می شود. بر طبق ارزیابی های ما، BST خطاهای OCR بسیار اندکی را نسبت به روش میانگین محلی نیبلک تولید می کند، در حالی که از بازده اجرایی بالاتری هم برخوردار است.
1- مقدمه
انگیزه کار و تحقیق ما از راحتی استفاده از دوربین های تصویری در مقابل دستگاه های اسکن مرسوم نشات می گیرد. دوربین ها فضای کمی را در میز کار کاربر اشغال می کنند، بازخورد عالی برای تطبیق ارائه می نمایند، ثبت و ضبط را بسیار سریع انجام داده و اسناد را به صورت رو به بالا اسکن می کنند. هرچند، از آن جایی که دوربین ها تصاویر را تحت شرایط کم محدود تری می گیرند در مقایسه با دستگاه هایی که به طور اختصاصی برای ثبت و ضبط اسناد کیفیت –بالا طراحی شده اند، می توانند تغییرات و تنزلات تصویری شدید را به همراه داشته باشند. این امر دستیابی به نتیجه OCR قابل اعتماد از این تصاویر را دشوار می سازد...