چکیده
با توسعه فناوری بدون راننده، ما به شدت نیاز به روشی برای درک صحنههای ترافیکی داریم. با این حال هنوز شناسایی علائم راهنمایی و رانندگی به دلیل مقیاس کوچک این نشانهها در تصاویر جهان واقعی، وظیفهای دشوار است. در سناریوهای پیچیده برخی علائم راهنمایی و رانندگی به دلیل شرایط آب و هوایی بسیار بد و شرایط نورپردازی میتواند بسیار اغفالکننده باشد. برای پیادهسازی یک سیستم تشخیص و شناسایی جامعتر ما یک شبکه دو مرحلهای را توسعه میدهیم. در مرحله پیشنهاد ناحیه، ما یک معماری عرمی ویژگی عمیق را با اتصالات جانبی به کار میگیریم که سبب میشود ویژگیهای معنایی شی کوچک حساستر شوند. در مرحله طبقهبندی شبکه پیچیشی که به شکل متراکم متصل شده است به منظور تقویت انتقال و تسهیم ویژگی مورد استفاده واقع شده است که این شبکه منجر به طبقهبندی دقیقتر با تعداد پارامترهای کمتر خواهد شد. ما بر روی بنچمارک تشخیص GTSDB و همچنین بر روی بنچمارک چالش برانگیز k100 Tsinghua-Tencent نیز آزمایش کردیم که برای اکثر شبکههای سنتی بسیار مشکل است. آزمایشات نشان میدهند که روش پیشنهادی ما عملکردی بسیار عالی را کسب میکند و از سایر جدیدترین روشها نیز بهتر است.
1-مقدمه
شناسایی و تشخیص شییکی از رایجترین وظایف بینایی کامپیوتری است. اخیرا، رویکردهای یادگیری عمیق مانند شبکههای عصبی پیچشی (CNNها) عملکردی عالی را برای بسیاری از وظایف درک تصویر از خود به نمایش گذاشتهاند. بسیاری از تشخیصدهندههای کنونی شی را میتوان به دو دسته تقسیم کرد: تشخیص دهنده یک مرحلهای و تشخیص دهنده دو مرحلهای. برای تشخیص دهنده یک مرحلهای مانند RetinaNet [22]، SSD [23] و YOLov2 [32] از لنگرهایی با اندازههای متفاوت به منظور پیشبینی داده مرجع کادرهای محصورکننده استفاده شده است که معادل با فاز اول fasterRCNN هستند [29]....
میتوانید از لینک ابتدای صفحه، مقاله انگلیسی را رایگان دانلود فرموده و چکیده انگلیسی و سایر بخش های مقاله را مشاهده فرمایید