منبع پایان نامه ارشد با موضوع موقعیت جغرافیایی و برنامه ریزی شهری


Widget not in any sidebars

شکل3-12 الف) نماش سه بعدی تابع Greiwank ب) نمایش contour تابع Greiwank …………………. 65
شکل 41نمونه های گلهای زنبق از مجموعه دادهIris ………………………………………………………………………………… 72
فصل اول : مقدمه
مقدمه
داده و الگو یکی از شاخصهای بسیار مهم در دنیای اطلاعات هستند و خوشهبندی یکی از بهترین روشهایی است که برای کار با دادهها ارائه شده است. قابلیت آن در ورود به فضای داده و تشخیص ساختار آنها باعث گردیده که خوشه بندی یکی از ایدهآلترین مکانیزمها برای کار با دنیای عظیم دادهها باشد.
در خوشهبندی، نمونهها به دستههایی تقسیم میشوند که از قبل معلوم نیستند. بنابراین، خوشهبندی یک روش یادگیری است که بدون دانش پیشین و مشاهده نمونههای از قبل تعریف شده، دادهها را به صورت خود مختار و مستقل دسته بندی میکند.
خوشه بندی در واقع یافتن ساختار در مجموعه دادههایی است که طبقه بندی نشدهاند. به بیان دیگر خوشهبندی قراردادن دادهها در گروههایی است که اعضای هر گروه از زاویهی خاصی به هم شباهت دارند. در نتیجه شباهت بین دادههای درون هر خوشه حداکثر و شباهت بین دادههای درون خوشههای متفاوت حداقل میباشد. معیار شباهت در اینجا، فاصله بوده یعنی نمونههایی که به یکدیگر نزدیکترهستند، در یک خوشه قرار میگیرند. لذا محاسبهی فاصلهی بین دو داده در خوشهبندی بسیار مهم میباشد؛ زیرا کیفیت نتایج نهایی را دستخوش تغییر قرار خواهد داد.
فاصله که همان معرف عدم تجانس است حرکت در فضای دادهها را میسر میسازد و سبب ایجاد خوشهها میگردد. با محاسبهی فاصلهی بین دو داده، میتوان فهمید که چقدر این دو داده به هم نزدیک هستند و در یک خوشه قرار می گیرند یا نه؟ توابع ریاضی مختلفی برای محاسبهی فاصله وجود دارند؛ فاصله اقلیدسی، فاصله همینگ و ….
1-1-بیان مسأله
خوشهبندی یافتن ساختار، درون مجموعهای از دادههای بدون برچسب است و میتوان آن را به عنوان مهمترین مسأله در یادگیری بدون نظارت در نظر گرفت. ایدهی خوشهبندی اولین بار در دههی 1935 مطرح شد و امروزه با پیشرفتها و جهشهای عظیمی که در آن بهوجود آمده در کاربردها و جنبههای مختلفی حضور یافته است. یک جستجوی ساده در وب یا حتی در پایگاه داده یک کتابخانه، کاربرد شگفت انگیز آن را برای ما آشکار میسازد. الگوریتمهای خوشهبندی در زمینههای مختلفی کاربرد دارد که به عنوان نمونه میتوان موارد زیر را برشمرد:
داده کاوی: کشف اطلاعات و ساختار جدید از داده‌های موجود
تشخیص گفتار: در ساخت کتاب کد از بردارهای ویژگی، در تقسیم کردن گفتار بر حسب گویندگان آن یا فشرده‌سازی گفتار
تقسیم‌بندی تصاویر: تقسیم‌بندی تصاویر پزشکی یا ماهواره‌ای
وب (WWW): دسته‌بندی اسناد و یا دسته‌بندی سایتها و …
زیست‌‌‌شناسی: دسته‌بندی حیوانات و گیاهان از روی ویژگی‌های آنها
برنامه ریزی شهری: دسته‌بندی خانه‌ها بر اساس نوع و موقعیت جغرافیایی آنها
مطالعات زلزله‌نگاری: تشخیص مناطق حادثه‌خیز بر اساس مشاهدات قبلی
کتابداری: دسته‌بندی کتابها
بیمه: تشخیص افراد متقلب
بازاریابی: دسته‌‌بندی مشتریان به دسته‌هایی بر حسب نیاز آنها از طریق مجموعه آخرین خرید‌های آنان.
با توجه به کاربرد روزافزون خوشهبندی، امروزه شاهد ارائهی روشهای جدید و کارآمدتری هستیم که هر یک برای کاربردی خاص ارائه میشود. ولی با همه این تلاشها هنوز خوشهبندی در بسیاری از علوم آنچنان که باید مورد استفاده قرار نگرفته است و قابلیت گسترش بسیار زیادی برای آن وجود دارد.
1-2-پیشینه تحقیق
ما در جهانی پر از داده زندگی میکنیم و هر روز با حجم وسیعی از ذخیره یا نمایش اطلاعات روبهرو هستیم. یکی از روشهای حیاتی کنترل و مدیریت این دادهها، خوشهبندی میباشـد. در این روش دادههایی که دارای خواص مشابه میباشند، درون یک دسته یا یک خوشه قرار میگیرند. اولین بار ایدهی خوشهبندی در دههی 1935 ارائه شد و امروزه با پیشرفتها و جهشهای عظیمی که در آن پدید آمده مورد توجه بسیاری از محققــان قرار گرفته است. لذا در کاربردها و جنبههای مختلفی حضور یافته و روشهای مختلفی برای بهرهبرداری از آن مطرح گردیده است [1]. از یک نظر، الگوریــتمهای خوشه بندی می تواند در دو دسته کلی تقسیمبندی شوند: خوشه بندی سخت و خوشه بندی فازی. در خوشهبندی سخت یک داده به یک و فقط یک خوشه تعلق میگیرد، درحالیکه در خوشهبندی فازی یک داده ممکن است بطور همزمان به دو خوشه یا بیشتر تعلق داشته باشد [2]، [3]، [4]. الگوریتم Fuzzy c-means یکی از روشهای معروف خوشهبندی فازی محسوب میگردد که به سادگی قابل پیادهسازی میباشد. متأسفانه نسخهی اصل آن دارای محدودیتهایی از جمله وابستگی به مقادیر اولیه و همگرایی به پاسخ بهینه محلی میباشد [5]، [6]. در الگوریتم ژنتیک این محدودیتها از بین رفته است. در عین حال با ترکیب این دو الگوریتم نتایج قابل توجهی حاصل شده است که سرعت همگرایی آن نیز به مراتب از نمونههای قبل بیشتر گردیده است [7]. Kao و همکارانش با ترکیب دو الگوریتم ژنتیک و PSO روشی را ابداع نمود که در آن از عملگر جهش و تقاطع برای ژنتیک بهره گرفته است. این روش توانست مشکلات مختلف توابع پیوسته را رفع نماید. همچنین در یافتن جواب بهینهی سراسری و نسبت همگرایی تغییرات چشمگیری حاصل شده است [8]. با استفاده از ترکیب الگوریتم ژنتیک و روش فازی، روشی توسط عسگریان در سال 1386 مطرح شد. در این روش مشکل وابستگی به تعداد اولیه خوشهها و مکان اولیه مراکز آنها مرتفع و با عدم تو
انایی خوشهبندی دادههایی که فاصلهی آنها از مراکز چند خوشه به یک اندازه میباشد؛ مقابله گردید. از مزایای دیگر این ترکیب کاهش پیچیدگی محاسبات میباشد [9]. یکی دیگر از روشهای ترکیبی که در مسائل دادهکاوی کاربرد دارد استفاده از ترکیب Fuzzy c-means و PSO میباشد که توانست مشکل همگرایی به بهینهی محلی و سرعت همگرایی را بهبود بخشد [10] ،[11]. از دیگر روشهای ترکیبی جدید ترکیب الگوریتمFCM و الگوریتم مِمتیک فازی است. در راستای بهبود عملکرد خوشهبندی، نتایج حاصل از این تکنیک نشان میدهد که جوابهای بهتری داشته و پایداری آن نیز بالاتر میباشد [12]. ترکیب FCM و SA نمونهای دیگر از روشهای ترکیبی است که در تشخیص سرطان استفاده میشود [13]،[14]،[15]،[16]. در راستای تلاشهای ذکر شده، در این پایاننامه سعی بر آن است تا با استفاده از ترکیب الگوریتمFCM و الگوریتم خفاش از مزایای دو الگوریتم در حل مسائل خوشهبندی بهره گرفته شود.
1-3-هدف تحقیق