چکیده
بازشناسی شخص (re-ID) بر مبنای ویدئو را می توان به عنوان فرآیند تطبیق تصویر یک فرد از طریق دیدهای مختلف دوربین که به وسیله ی تصاویر ویدئویی ناهم راستا گرفته شده است، در نظر گرفت. روش هایی که برای اینکار وجود دارند، از سیگنال های نظارتی برای بهینه سازی فضای پیش روی دوربین استفاده نموده که تحت این شرایط، فاصله ی بین ویدئوها بیشینه سازی/کمینه سازی می شود. البته این کار باعث شده تا برچسب گذاری افراد در سطح دید های ویدئو بسیار زیاد شده و باعث شده تا نتوان آنها را به خوبی بر روی دوربین های شبکه بندی شده ی بزرگ مقیاس بندی کرد. همچنین خاطر نشان شده است که یادگیری نمایش های مختلف ویدئویی و آن هم به وسیله ی عدم تغییر دید دوربین را نمی توان انجام داد چرا که ویژگی های تصویر، هر کدام دارای توزیع های مختلف مختص به خود می باشند. بنابراین تطبیق ویدئوها برای باز شناسی افراد، نیاز به مدل هایی انعطاف پذیر برای بدست آوردن پویایی های موجود در مشاهدات ویدئویی و یادگیری دیدهای ثابت از طریق دسترسی به نمونه های آموزشی برچسب دار و محدود دارد. در این مقاله قصد داریم یک روش مبتنی بر یادگیری عمیق چند مرحله ای را برای باز شناسی یک فرد بر مبنای ویدئو ارائه دهیم و بتوانیم به یادگیری دیدهای قابل قیاسی از این فرد که متمایز هستند بپردازیم. روش پیشنهادی را بر روی شبکه های عصبی باز رخداد گر متغیر (VRNN) توسعه داده ایم و آنرا به منظور ایجاد متغیر های پنهان با وابستگی های موقت که بسیار متمایز بوده ولی در تطبیق تصاویر فرد از نظر دید ثابت می باشد، مورد یادگیری قرار داده ایم. آزمایش های وسیعی را بر روی سه مجموعه ی داده ای بنچ مارک انجام داده ایم و به صورت تجربی به اثبات قابلیت روش پیشنهادی مان در ایجاد ویژگی های موقتی و با یک دید ثابت و کارائی بالایی که به وسیله ی آن بدست آمده است خواهیم پرداخت.
1-مقدمه
یکی از وظایف مهمی که در سامانه های نظارت تصویری صورت می گیرد این بوده که باید بتوان تصاویر افراد را به صورت خودکار بر روی دید های مختلف از دوربین های مجزا تطبیق داد که این فرآیند را باز شناسی فرد (re-ID) گویند. این روش در حوزه ی نظارت ویدئویی، چند رسانه ای و سیستم های امنیتی مورد توجه گسترده ای قرار گرفته است چرا که در این روش به دنبال جستجوی افراد مد نظر و آن هم از طریق دنباله های ویدئویی زیاد هستیم. بسیاری از روش های موجود، بر روی تطبیق تصاویر ثابتی که دارای یک ظاهر بصری فضایی ( شکل، بافت و رنگ ) می باشند متمرکز می باشند....
میتوانید از لینک ابتدای صفحه، مقاله انگلیسی را رایگان دانلود فرموده و چکیده انگلیسی و سایر بخش های مقاله را مشاهده فرمایید