منبع پایان نامه ارشد با موضوع تصویر استفاده و فیلتر کالمن

در مورد اول باید به این نکته اشاره کرد که تصاویر به دست آمده از مرحله آشکار سازی لزوما بسیار مشخص نمی باشند. به عبارت بهتر ممکن است پس زمینه تصویر نیز دارای آشفتگی های بسیاری باشد. در این صورت تصویری که پس از مرحله آشکار سازی حاصل می شود، شامل آشفتگی های فراوانی می باشد. در این شرایط مناطق بسیار زیادی از تصویر می توانند به عنوان ناحیه هدف تلقی شوند و تعیین ناحیه واقعی مربوط به هدف بسیار دشوار است. استفاده از فیلتر کالمن در این مرحله می تواند نقش بسیار موثری را داشته باشد. با استفاده از فیلتر کالمن نواحی از تصویر که احتمال حضور هدف در آن ها بیش تر است، مشخص خواهد شد. این عمل به نوبه خود باعث افزایش دقت الگوریتم خواهد شد. به علاوه کاهش قابل توجهی در حجم محاسبات به وجود خواهد آمد که عمدتا به دلیل کم شدن نواحی مورد جستجو می باشد.
در مورد دوم باید به نقش فیلتر کالمن در ردیابی اهداف چندگانه اشاره کرد. در این موارد ابتدا مرحله آشکار سازی اهداف انجام خواهد شد. پس از این مرحله چندین هدف در تصویر مشخص خواهد شد. در این جا هدف آن است که بتوانیم اهداف این مرحله را به اهداف مرحله قبل تخصیص بدهیم. به این معنی که متناظر هر هدف در فریم قبلی را بیابیم. در این مواردفیلتر کالمن نقش تعیین کننده ای در تخصیص داده ها خواهد داشت.
Widget not in any sidebars

به این ترتیب همان طور که پیش تر و در معادله (4-6) نیز ذکر کردیم، روابط مربوط به مدل فرآیند فیلتر کالمن را به صورت زیر قابل بازنویسی خواهند بود.
(4-8)
در رابطه بالا منظور از T فاصله میان دو فریم متوالی می باشد. مقدار T با توجه به بیشینه میزان جابجایی اهداف در دو فریم متوالی در نظر گرفته خواهد شد. همچنین بردار V نشان دهنده میزان انحراف حالت سیستم از رابطه خطی تعریف شده می باشد. از آن جایی که روابط در عمل واقعا به این صورت خطی قابل تعریف نمی باشند، این میزان خطا باعث افزایش مقاومت مدل ارائه شده می گردد. لازم به ذکر است که در فیلتر کالمن این خطا لزوما دارای توزیع گاوسی در نظر گرفته می شود.
به علاوه مطابق رابطه شماره (4-7)، روابط مربوط به مدل فرآیند مشاهدات فیلتر کالمن نیز به صورت زیر قابل نمایش است.
(4-9)
در رابطه بالا نیز بردار W نشان دهنده میزان انحراف روابط از حالت خطی می باشد.
پس از آن که سیستم را مطابق روابط (4-8) و (4-9) مدل کردیم، می توان با استفاده از رابطه (4-6) و همچنین روابط I و II ، عمل پیش بینی را انجام داد. به علاوه رابطه (4-7) و همچنین روابط III و IV نیز برای تخمین موقعیت هدف مورد استفاده قرار می گیرند.
در عمل موقعیت هدف در فریم اول توسط کاربر تعیین خواهد شد. پس از آن و به صورت پی در پی در فریم های بعدی مراحل پیش بینی موقعیت هدف، آشکار سازی موقعیت واقعی هدف و همچنین تخمین موقعیت اصلی آن به صورت تکرار شونده انجام می شود.
مطابق مطالب بخش های قبل، مدل حرکت در این پایان نامه نسبت به متغیرهای حالت خطی است. با این حال می توان سایر متغیرهای مربوط به هدف را نیز در ردیابی در نظر گرفت و یا مدل حرکت را تغییر داد. با توجه به این که مدل حرکت در فضای دو بعدی غالبا به صورت مدل ارائه شده فوق می باشد، برای بهبود سیستم تغییر پارامترها راه منطقی تری به نظر می رسد. یکی از رایج ترین متغیرهایی که در ردیابی اهداف در نظر گرفته می شود، زاویه می باشد. با وارد شدن متغیر زاویه به سیستم ردیابی، حالت خطی بودن مدل از بین خواهد رفت. برای در تعریف هدف در این حالت از مدل غیر خطی بر مبنای زاویه استفاده خواهیم کرد. به علاوه برای انجام ردیابی نیز نیاز به استفاده از یکی دیگر از فیلترهای خانواده بیز می باشد. فیلتر پارتیکل شناخته شده ترین عضو غیر خطی خانواده بیز می باشد ]35، 36[.
فصل پنجم
شبیه سازی و مقایسه
مقدمه
در فصل های گذشته به توضیح روش های مختلفی برای ردیابی اهداف در شرایط دوربین متحرک پرداختیم. برای ارزیابی بهتر در مورد نحوه عملکرد این روش ها، از دنباله فریم های متفاوتی با خصوصیات مختلف استفاده شده است. روش های مورد ارزیابی شامل الگوریتم های ارائه شده در این پایان نامه و همچنین الگوریتم های CAM Shift و Mean Shift می باشد. نتایج حاصل از اعمال این روش ها هم به صورت جدول و هم به صورت تصویری در ادامه نشان داده شده است. جدول ها نشان دهنده میزان خطای روش های مختلف در ردیابی اهداف می باشد. همچنین برای درک بهتر از قابلیت روش های مختلف، تعدادی از فریم ها به صورت نمونه در ادامه آورده شده است.
مطابق آن چه که پیش تر ذکر کردیم، در این پایان نامه هیچ فرض خاصی در مورد ظاهر اهداف در نظر گرفته نشده است. از طرفی روش های پیشین دارای پیاده سازی های بسیار مختلفی می باشند. به این معنی که پیاده سازی موجود در این پایان نامه، لزوما بهینه ترین حالت روش های گذشته را مشخص نمی کند. در نتیجه نتایج به دست آمده از جدول ها و تصاویر، قابل بسط دادن به حالت کلی نمی باشد. این مساله زمانی بیش تر قابل توجه می شود که این نکته را در نظر بگیریم که با توجه به نبودن مجموعه داده خاص برای حالت دوربین متحرک، دنباله فریم ها توسط نویسنده ایجاد شده است. در نتیجه همان گونه که انتظار نیز می رود بازده روش ها در دنباله فریم های متفاوت به طور محسوسی دارای نوسان می باشد. اگر چه که نتیجه به دست آمده در این قسمت در حالت کلی قابل بسط دادن نیست، ولی به عنوان تفسیری بر نتایج شبیه سازی های روش های مختلف روی دنباله فریم های موجود قابل ارائه می باشد.
برای مقایسه عملکرد روش های مختلف نیاز به استفاده از یک معیار می باشد. در این پایان نامه از معیار میانگین مجموع مربعات خطا برای این کار استفاده شده است. منظور از خطا اختلاف میان موقعیت واقعی اجسام و موقعیت نشان داده شده توسط هر کدام از روش ها می باشد. لازم به ذکر است که موقعیت واقعی اجسام به صورت دستی و جداگانه در هر فریم توسط نویسنده به دست آمده است.
(5-1)
در رابطه بالا منظور از موقعیت واقعی هدف و همچنین منظور از موقعیت به دست آمده به وسیله هر کدام از روش ها می باشد.
علاوه بر میزان خطا برای درک بهتر از عملکرد روش ها، میزان خطا در هر فریم نیز به صورت جداگانه در نمودار آورده شده است. محور عمودی هر کدام از نمودارها نشان دهنده میزان MSE و همچنین محور افقی معرف شماره فریم ها می باشد.
در این پایان نامه نتایج حاصل از بررسی پنج دنباله فریم نشان داده شده است. هر دنباله فریم در یک بخش مجزا بررسی شده است و نمودارها و همچنین تصاویر آن نیز به صورت جداگانه در بخش مربوطه نمایش داده شده است.
دنباله های تصاویر مورد استفاده
برای بررسی عملکرد روش های موجود، از پنج دنباله تصویر استفاده شده است. تمام فریم های موجود در دنباله ها به ابعاد 1280 * 720 می باشند. دنباله فریم ها به گونه ای طراحی شده که شرایط مختلف حرکت دوربین را در شامل شوند. به علاوه موقعیت های مختلف قرار گرفتن اهداف نسبت به هم در این دنباله ها مورد بررسی قرار گرفته اند.
دنباله فریم اول