Abstract
Most existing bottom-up algorithms measure the foreground saliency of a pixel or region based on its contrast within a local context or the entire image, whereas a few methods focus on segmenting out background regions and thereby salient objects. Instead of only considering the contrast between salient objects and their surrounding regions, we consider both foreground and background cues in this work. We rank the similarity of image elements with foreground or background cues via graph-based manifold ranking. The saliency of image elements is defined based on their relevances to the given seeds or queries. We represent an image as a multi-scale graph with fine superpixels and coarse regions as nodes. These nodes are ranked based on the similarity to background and foreground queries using affinity matrices. Saliency detection is carried out in a cascade scheme to extract background regions and foreground salient objects efficiently. Experimental results demonstrate the proposed method performs well against the state-of-the-art methods in terms of accuracy and speed. We also propose a new benchmark dataset containing 5,168 images for large-scale performance evaluation of saliency detection methods
چکیده
بیشتر الگوریتمهای پایینبهبالا، برجستگی پیشزمینهی یک پیکسل یا ناحیه را بر اساس تمایز آن در یک زمینهی محلی یا کل تصویر میسنجند. در حالی که روشهای کمی بر روی قطعهبندی نواحی پسزمینه و درنتیجه اشیاء برجسته تمرکز میکنند. ما در این کار به جای این که فقط تمایز بین اشیاء برجسته و نواحی پیرامون آنها را در نظر بگیریم، هم نشانههای پسزمینه و هم نشانههای پیشزمینه را مد نظر قرار قرار میدهیم. از طریق رتبهبندی manifold مبتنی بر گراف، شباهت اجزاء تصویر را با نشانههای پیشزمینه یا پسزمینه رتبهبندی مینماییم. برجستگی اجزاء تصویر بر اساس ارتباط آنها با seedها یا پرسوجوهای مفروض تعریف میشوند. تصویر را به صورت یک گراف چندمقیاسه بازنمایی میکنیم که رئوس آن ابرپیکسلهای ریز و نواحی درشت هستند. این رئوس با استفاده از ماتریسهایaffinity بر اساس شباهت به پرسوجوهای پسزمینه یا پیشزمینه رتبهبندی میگردند. تشخیص برجستگی به یک روش آبشاری برای استخراج کارای نواحی پسزمینه و اشیاء برجستهی پیشزمینه انجام میشود. نتایج تجربی نشان میدهند که عملکرد روش پیشنهادی از نظر دقت و سرعت نسبت به روشهای مدرن خوب است. همچنین یک مجموعهدادهی محک جدید حاوی 5,168 تصویر برای ارزیابی مقیاس بزرگ کارایی روشهای تشخیص برجستگی ارائه میکنیم.
1- مقدمه
سامانهی بینایی انسان با استفاده از توجه دیداری انتخابی میتواند اشیاء برجسته را در یک صحنهی دیداری درهم تشخیص دهد. این توانایی در سامانههای محاسباتی دیداری برای اداره کردن مسألهی اطلاعات بیش از حد، اهمیت فراوانی دارد. هدف از تشخیص برجستگی، شبیهسازی توجه دیداری انتخابی انسان برای شناسایی مهمترین و بامعنیترین بخشهای یک صحنه است. تشخیص برجستگی به طور گسترده بر روی مسائل بینایی زیادی شامل مواردی مانند قطعهبندی تصویر [1]، تشخیص اشیاء [2]، فشردهسازی تصویر [3] و بازیابی مبتنی بر محتوای تصویر [4] اعمال شده است.
به طور کلی میتوان تشخیص برجستگی را به مدلهای پایینبهبالا یا بالابهپایین دستهبندی کرد. روشهای پایینبهبالا [1]، [5]-[21] سریع، دادهمحور و پیشتوجه هستند. این روشها به وسیلهی تمایز یا نادر بودن دیداری و با استفاده از اطلاعات سطح پایین تصویر مانند تمایز (کنتراست)، رنگ، بافت و مرز، برجستگی را مدل میکنند. مدلهای بالابهپایین [22]، [23] توجه دیداری وظیفهمحور را تحلیل مینمایند که اغلب مستلزم یادگیری نظارتی از روی علامت دسته از مجموعهای از نمونههای آموزشی است. یادآوری میکنیم که مدلهای برجستگی برای پیشبینی توجه دیداری با تثبیت چشم (خیره شدن به یک نقطه) در بینایی انسان [5]-[10]،[24] و تشخیص اشیاء برجسته در بینایی رایانه [13]، [14]، [16] و [23] ایجاد شدهاند. ما در این کار یک مدل پایینبهبالا برای تشخیص اشیاء برجسته در تصاویر ارائه میکنیم....