منبع پایان نامه ارشد با موضوع قابلیت پیش بینی و تصویر استفاده


Widget not in any sidebars

هدف
وجود اهداف، تکمیل کننده فرآیند ردیابی می باشد. نوع اهداف، تعداد آن ها و همچنین تغییر شکل ظاهری آن ها در دنباله فریم ها عوامل تعیین کننده ای در انتخاب روش ردیابی متناسب با سیستم می باشد. با توجه به این تفاوت های موجود در ساختار اهداف، روش های متفاوتی نیز ایجاد شده اند.
در برخی موارد ردیابی، هدف دارای خصوصیات خاص ظاهری می باشد. به عنوان نمونه گاهی ردیابی چهره انسان مد نظر است. چهره انسان دارای غالب مشخصی متشکل از چشم ها، بینی و لب در صورتی با ظاهر بیضی گون می باشد. در آشکارسازی این موارد، الگوریتم تنها به دنبال نواحی از تصویر است که دارای قابلیت انطباق با غالب مورد نظر برای چهره انسان است. به این ترتیب همان گونه که دیده می شود، روش ارائه شده مخصوص ردیابی در همین حالت می باشد و با سایر روش های ردیابی به صورت کلی متفاوت است.
تعداد اهداف موجود در تصویر نیز یکی از عوامل مهم و تعیین کننده در الگوریتم های کاربردی ردیابی می باشد. با افزایش تعداد اهداف، مشکلات جدید و عمده ای در زمینه های آشکارسازی و ردیابی به وجود می آید. از مهمترین این مشکلات محو شدگی اهداف و همچنین قرار گرفتن اهداف در موقعیت مشابه می باشد. الگوریتم های ارائه شده با تمرکز بر این مشکلات، راه هایی برای حل آن ها ارائه کرده اند.
تغییر شکل ظاهری هدف از عمده ترین مشکلات مرتبط با شرایط ظاهری آن است. به این معنی که گاهی اهداف دارای ساختار صلب نیستند. بنابراین در فریم های متوالی ظاهر متفاوتی دارند. برای مثال ظاهر یک عابر پیاده در فریم های متوالی، دچار تغییرات ظاهری مختلفی می شود. این تغییرات در ظاهر اجسام صلبی مانند اتومبیل دیده نمی شود. بنابراین روش های پیشنهادی باید به گونه ای باشند که توانایی وفق یافتن با این تغییرات شرایط ظاهری اهداف را نیز داشته باشند.
نحوه عملکرد سیستم های ردیابی
اگر چه در مطالب قبل اشاره شد که تغییرات در ساختار سیستم های ردیابی می تواند به تغییرات عمده در روش های ردیابی مورد استفاده منجر شود، این روش ها از بسیاری جهات و اصول اولیه دارای اشتراکات فراوانی هستند. عمده تفاوت این روش ها در نحوه اجرای مراحل کلی می باشد. در این پایان نامه به طور کلی الگوریتم های مورد استفاده در سیستم های ردیابی اهداف را بر اساس استفاده از قابلیت پیش بینی به دو دسته اصلی تقسیم می کنیم. در ادامه به معرفی هر کدام از این دو دسته خواهیم پرداخت و مزایا و معایب آن ها را بیان می کنیم.
الگوریتم های فاقد خاصیت پیش بینی
اساس کار این دسته از الگوریتم ها بر تطبیق می باشد. به این معنی که با مشخص شدن ناحیه هدف در هر فریم و رسیدن فریم بعدی، ناحیه ای از فریم بعدی که بیش ترین شباهت را با ناحیه مذکور دارد به عنوان ناحیه هدف در فریم بعدی در نظر گرفته می شود. به عبارت دیگر اگر موقعیت هدف در فریم شماره k در دسترس بود، ناحیه ای به عنوان ناحیه هدف در این فریم نظر گرفته می شود. با رسیدن فریم k+1 ضمن جستجو در اطراف موقعیت قبلی هدف، سعی در یافتن ناحیه ای در فریم k+1 داریم که بیش ترین شباهت با ناحیه هدف در فریم k را داشته باشد. ملاک شباهت عموما کمینه خطای مجموع مربعات در نظر گرفته می شود. به این ترتیب در این روش ها از اطلاعات مربوط به نحوه حرکت هدف استفاده زیادی نمی شود. به عبارت دیگر با توجه به جهت حرکت هدف، پیش بینی در مورد موقعیت آن در فریم آینده صورت نمی پذیرد.
این الگوریتم ها عموما به خاطر حجم عملیات کم، دارای سرعت بسیار بالایی می باشند. ولی به دلیل این که معمولا از خصوصیات کلی ناحیه هدف برای ایجاد تطبیق استفاده می کنند، در بعضی موقعیت ها دارای خطا نسبتا زیادی می باشند. همچنین با توجه به این که خصوصیات کلی در این روش ها مورد استفاده قرار می گیرد، دارای مقاومت بسیار کمی در برابر تغیرات شرایط هدف هستند. با این حال با توجه به مزایای مذکور، روش های این دسته هنوز از محبوبیت بسیار زیادی برخوردار می باشند. الگوریتم هایی مانند Mean Shift و CAM Shift از معروف ترین مثال های این دسته از روش ها می باشند.
الگوریتم های دارای خاصیت پیش بینی
در این دسته از روش ها از موقعیت هدف در فریم شماره k، برای ایجاد پیش بینی از موقعیت هدف در فریم k+1 استفاده می شود. به این ترتیب مکان حدودی هدف در فریم آینده مشخص بوده و جستجو برای یافتن بهترین ناحیه متناظر هدف، در ناحیه بسیار کوچک تری صورت می گیرد. البته لازم به ذکر است که محاسبه پیش بینی موقعیت هدف در فریم آینده باعث افزایش حجم محاسبات در این دسته از روش ها می شود. روش های متعددی برای پیش بینی موقعیت هدف در فریم آینده ایجاد شده که عمده آن ها مبتنی بر فیلتر های خانواده بیز می باشند.
الگوریتم های مبتنی بر فیلترهای بیزین عموما عملکرد مشابهی دارند. عملکرد کلی آن ها به این صورت است که در لحظه k موقعیت هدف در فریم k مشخص است. در این حال سیستم می تواند با توجه به نوع حرکت هدف پیش بینی از موقعیت هدف در لحظه k+1 داشته باشد. این پیش بینی بر اساس نوع حرکت و با در نظر گرفتن فرض های مختلف برای مدل سیستم ردیابی می باشد. با رسیدن فریم شماره k+1 سیستم با به دست آوردن موقعیت واقعی هدف، مقدار پیش بینی قبلی خود را اصلاح می کند.
روش های مذکور از نقطه نظر دقت، از کارایی بسیار بالایی برخوردار هستند. هر چند از نقطه نظر کاربردی از محبوبیت چندانی برخوردار نیستند. عمده ترین دلیل این امر نیز بالا بودن حجم عملیات مورد نیاز می باشد که باعث ایجاد محدودیت هایی در کاربرد این روش ها می باشد. الگوریتم های ردیابی مبتنی بر فیلتر کالمن و یا فیلتر پارتیکل مثال های معروفی برای این دسته از الگوریتم ها می باشد.
همان گونه که پیش تر نیز ذکر کردیم، دسته بندی انجام شده بر اساس وجود و یا فقدان وجود خاصیت پیش بینی در روش ها صورت گرفته است. البته این به این معنا نیست که این دو دسته از روش ها همواره به صورت کاملا مجزا مورد استفاده قرار می گیرند. به عبارت دیگر گاهی ممکن است روش هایی به صورت ترکیبی از این دو دسته روش شکل بگیرند. در این روش ها سعی بر آن است که در حد امکان از مزایای هر دو روش استفاده شود. به عنوان نمونه روش های ردیابی مبتنی بر تطبیق که دارای خاصیت پیش بینی نیز می باشند از این دسته به شمار می روند.
تعریف مساله و مشکلات پیش رو
موضوع این پایان نامه در مورد ردیابی اهداف چندگانه در تصاویر دوربین متحرک می باشد. همان گونه که در مقدمه نیز ذکر کردیم، منظور از اهداف چندگانه وجود بیش از یک هدف به طور هم زمان در هر فریم از تصویر است. چندگانه بودن اهداف باعث به وجود آمدن چالش های جدی در ردیابی می شود که محوشدگی و قرار گرفتن اهداف در موقعیت مشابه از جمله مهم ترین آن ها می باشند.
از طرفی نبودن فرض خاصی در مورد خصوصیات هدف و همچنین نداشتن هیچ اطلاعات قبلی در مورد هدف مساله را پیچیده تر می کند. به عبارت دیگر در یک تصویر به دست آمده از یک دوربین مرئی، هر جز از تصویر می تواند دارای حرکت باشد و بنابراین می تواند به عنوان هدف در نظر گرفته شود. در این موارد برای آشکارسازی اهداف ملزم به استفاده از روش های در طول فریم هستیم. در این روش ها اهداف و اجسام متحرک تصویر تنها در صورتی قابل آشکارسازی هستند که دنباله ای از فریم ها را در اختیار داشته باشیم. در واقع با مقایسه فریم های متوالی و با توجه به جابجایی اجزا تصویر، اهداف قابل آشکارسازی می باشند. در نتیجه این مقایسه ها حجم محاسبات به طور قابل ملاحظه ای افزایش می یابد. همچنین زمان لازم برای رسیدن فریم های آینده باعث می شود که کارایی این دسته از روش های در کاربرد های برخط تحت تاثیر قرار گیرد.
علاوه بر این با توجه به عنوان پایان نامه می توان دریافت که دنباله تصاویر مربوط به یک دوربین می باشد. مساله اصلی در رابطه با این موضوع حرکت دوربین می باشد که باعث به وجود آمدن مشکلات عمده ای در ردیابی می گردد. این مشکلات عمدتا مربوط به ایجاد تمایز میان پیکسل های مربوط به ناحیه هدف و پیکسل های مربوط به پس زمینه است. همان گونه که می دانیم اگر هنگام فیلم برداری دوربین دارای حرکت باشد، تمام اجزا درون تصویر نیز دارای حرکت خواهند بود. در این موارد باید در مرحله اول به شناسایی حرکت جداگانه هرکدام از اجزا تصویر بپردازیم. سپس با بررسی هر حرکت باید تعیین کنیم که آیا حرکت متناظر هر جز تصویر، ناشی از حرکت دوربین می باشد و یا این که خود جسم به طور ذاتی دارای حرکت بوده است. نواحی که به واسطه حرکت دوربین دارای جابجایی بوده اند را می توان به عنوان نواحی پس زمینه و همچنین نواحی را که به طور ذاتی دارای حرکت بوده اند را می توان به عنوان کاندید برای ناحیه مربوط به اهداف در نظر گرفت.
مسائلی که تا به امروز در مباحث ردیابی مطرح شده اند و همچنین الگوریتم هایی که برای حل این مسائل پیشنهاد شده اند عمدتا با در نظر گرفتن شرایط ثابت بودن دوربین بوده اند. در این موارد غالبا از روش های مبتنی بر روش تفریق پس زمینه در راستای آشکارسازی اهداف و اجزا متحرک تصویر استفاده می شود. اساس این روش ها بر به دست آوردن تصویری از پس زمینه با استفاده از فریم های ابتدایی می باشد. این کار با توجه به این فرض صورت می گیرد که نواحی مربوط به پس زمینه در طی فریم های متوالی تقریبا دارای شدت نور ثابت می باشند. درنتیجه پیکسل هایی که در فریم های ابتدایی تغییر شدت نور چندانی ندارند به عنوان پس زمینه معرفی می شوند. به این ترتیب تصویر پس زمینه ایجاد خواهد شدت. سپس برای مشخص کردن نواحی متحرک تصویر در فریم های جدید، از اعمال عملگر تفریق میان تصویر پس زمینه و فریم جدید استفاده می نماییم. همان گونه که پیش تر گفتیم حرکت دوربین باعث ایجاد حرکت در تمام اجزا تصویر در طی فریم های متوالی خواهد شد. این حرکت نیز به نوبه خود باعث تغییر در شدت نور تمام پیکسل های تصویر در فریم ها می گردد. در نتیجه، در این موارد روش های مبتنی بر فلسفه تفریق پس زمینه عملا کاربرد خود را از دست خواهند داد. لزوم شکل گیری روشی برای حل این مشکل به عنوان نقطه آغازی برای تعریف این پایان نامه در نظر گرفته شد.
نحوه حل مساله
با توجه به این که پیش تر به توضیح چالش های پیش رو پرداختیم، در این قسمت سعی بر آن است که بتوانیم با انتخاب روش های مناسب در جهت حل مشکلات مذکور اقدام نماییم. ذکر این نکته الزامی ست که تاکنون روش کامل و جامعی به طور خاص برای ردیابی در شرایط دوربین متحرک ارائه نشده است. در این پایان نامه ضمن ارائه دو روش ردیابی کاملا متفاوت، سعی بر آن شده که بتوانیم تا حد امکان مشکلات ذکر شده را بر طرف نماییم.
روش اول عمدتا بر اساس الگوریتم های تطبیق بلوکی شکل گرفته است. در این روش فرض بر آن شده که تمام پیکسل های هر بلوک دارای حرکت یکسان هستند. در نتیجه در ابتدا به وسیله الگوریتم های تطبیق بلوکی جبران سازی حرکتی دوربین صورت می پذیرد. در مرحله بعد نوع حرکت تمام بلوک های تصویر شناسایی خواهد شد. در نتیجه پس زمینه و همچنین نواحی که به عنوان کاندید برای اهداف هستند، مشخص خواهند شد. سپس با استفاده از تصویر به دست آمده از الگوریتم های قطعه بندی، اهداف متحرک تصویر به طور دقیق و واضحی به دست می آیند. توضیحاتی که تا این جا ارائه شده مربوط به مرحله آشکارسازی اهداف بوده است. پس از آشکارسازی، با اعمال فیلتر های خانواده بیز می توان مرحله ردیابی را نیز با موفقیت انجام داد.
روش دوم بر پایه یک الگوریتم بسیار پرکاربرد پردازش تصویر می باشد. این الگوریتم عموما در مسائل شناسایی اشیا، رباتیک و سه بعدی سازی تصاویر مورد استفاده قرار می گیرد. در این پایان نامه با کاربرد متفاوتی از این الگوریتم روبرو هستیم. استفاده از این روش در ردیابی اهداف متحرک دلیلی دیگر بر جامعیت این الگوریتم می باشد. مراحل این الگوریتم به این صورت است که در ابتدا به وسیله این روش نقاط مورد علاقه موجود در تصویر تعیین می شوند. سپس در ادامه مراحل، به ردیابی این نقاط خواهیم پرداخت. خواص منحصر به فرد این الگوریتم باعث ایجاد روش بسیار مناسبی جهت ردیابی در شرایط دوربین متحرک شده است. روشی با مزایای ویژه ای که آن را از سایر روش هایی که قابل به کارگیری در این شرایط هستند، متمایز می کند.

Share this post

Post navigation

You might be interested in...