منبع پایان نامه ارشد با موضوع موقعیت جغرافیایی و شبکههای اجتماعی


Widget not in any sidebars

در فصل پنجم، نتیجهگیری و پیشنهادات برای کارهای آینده آورده خواهد شد.
فصل دوم: خوشهبندی بر مبنای الگوریتم
Fuzzy c-means

2-1- مقدمه
خوشه به مجموعهای از دادهها گفته میشود که از زاویهی خاصی به هم شباهت دارند. به دسته بندی طبیعی دادههای نامتجانس به تعدادی خوشه بر اساس خصوصیات مشابه نیز خوشهبندی میگویند. اغلب از خوشهبندی به عنوان اولین گام دادهکاوی یاد میشود که قبل از سایر فرآیندها بر روی رکوردها اعمال میشود تا گروهی از رکوردهای مرتبط به هم به عنوان نقطه آغاز تحلیلها شناسایی شوند. هدف از خوشه بندی این است که دادههای موجود را به چندین گروه تقسیم کنند و در این تقسیمبندی دادههای گروههای مختلف باید حداکثر تفاوت ممکن را با هم داشته باشند و دادههای موجود در یک گروه باید بسیار به هم شبیه باشند.
در این فصل، بعد از مقایسه روش خوشهبنـدی با روش طبقهبندی، روشهای مختلف خوشهبندی معرفی میگردد و در آخر به توضیح در مورد الگوریتم Fuzzy c-means که این تحقیق بر پایه آن بنا شده است، خواهیم پرداخت.
2-2- خوشهبندی اطلاعات
در حالت کلی یادگیری را میتوان به دوگروه اصلی تقسیم کرد: یادگیری با نظارت و یادگیری بدون نظارت. در یادگیری با نظارت از ابتدا دستهها مشخص هستند و هر یک از دادههای آموزشی به دستهای خاص نسبت دادهشدهاست. اصطلاحاٌ گفته میشود که ناظری وجود دارد که در هنکام آموزش اطلاعاتی علاوه بر دادههای آموزش در اختیار یادگیرنده قرار میدهد. ولی در یادگیری بدون نظارت هیچ اطلاعاتی بهجز دادههای آموزشی در اختیار یادگیرنده قرار ندارد و این یادگیرنده است که باید درون دادهها به دنبال ساختاری خاص بگردد. خوشهبندی را میتوان بهعنوان مهمترین مسأله در یادگیری بدون نظارت درنظر گرفت. شکل2-1(الف)، خوشهبندی اطلاعات بر اساس معیار شباهت بین دادهها و شکل2-1 (ب)، طبقهبندی اطلاعات بر اساس تعداد کلاس معین از قبل تعیین شده را نشان میدهد.
شکل 21 تفاوت خوشه بندی و طبقه بندی.
خوشه‌بندی همانگونه که بیان شد، بدون دانش قبلی، درون مجموعهای از دادهها به کشف گروههای مشابه میپردازد. در واقع، الگوریتمهای خوشهبندی اغلب بدینگونهاند که یک سری نماینده اولیه برای نمونههای ورودی در نظر میگیرند سپس با توجه به میزان تشابه نمونهها با این نمایندهها، مشخص میشود که نمونه به کدام خوشه تعلق دارد و بعد از این مرحله نمایندههای جدید برای هر خوشه محاسبه میشود و دوباره نمونهها با این نمایندهها مقایسه میشوند تا مشخص شود که به کدام خوشه تعلق دارند و این کار آنقدر تکرار میشود تا زمانیکه نمایندههای خوشهها تغییری نکنند.
انواعی از روشهای خوشهبندی تاکنون ارائه شدهاند که وابسته به کاربرد میتوان از آنها استفاده کرد. با این حال، با وجود گوناگونی روش‌های خوشه‌بندی، هنوز روش یکتایی وجود ندارد که بتواند انواع خوشه‌ها را به خوبی شناسایی کند؛ از این رو، این کاربر است که باید با توجه به نیاز‌هایش روش مناسب را بر‌گزیند.‌
2-2-1- تفاوت خوشهبندی و طبقهبندی
در طبقهبندی هر داده به یک کلاس از پیش تعیین شده ، تخصیص مییابد. در واقع، سیستمهایی که بر اساس طبقهبندی کار میکنند دو مجموعه ورودی دارند. مجموعهی آموزشی، که در آن دادههایی که به طور پیش فرض در دسته های مختلفی قرار دارند، همراه با ساختار دسته بندی خود وارد سیستم میشوند و سیستم بر اساس آنها آموزش می بیند یا به عبارتی، پارامترهای دسته بندی را برای خود مهیا میکند. گروه دیگر، ورودیهایی هستند که پس از مرحله آموزش و برای تعیین دسته وارد سیستم می شوند.
خوشهبندی با طبقهبندی متفاوت است. در طبقه بندی نمونههای ورودی برچسب گذاری شدهاند ولی در خوشهبندی نمونههای ورودی دارای بر چسب اولیه نمیباشند و در واقع با استفاده از روشهای خوشهبندی است که دادههای مشابه مشخص و بهطور ضمنی برچسبگذاری میشوند. در واقع میتوان قبل از عملیات طبقهبندی دادهها یک خوشهبندی روی نمونهها انجام داد و سپس مراکز خوشههای حاصل را محاسبه کرد و یک بر چسب به مراکز خوشهها نسبت داد و سپس عملیات طبقه بندی را برای نمونههای ورودی جدید انجام داد.
2-2-2-کاربردهای خوشهبندی
در بسیاری از موارد با کمبود اطلاعات در مورد دادهها مواجه میباشیم و تصمیم گیرنده میبایست تا آنجا که ممکن است فرضیاتی را در مورد داده متصور شود . تحت این محدودیت است که متدلوژی کلاسترینگ بهعنوان یک راهکار مناسب برای کشف ارتباطهای معنائی میان دادهها به شمار میرود و میتوان از آن به عنوان یک دانش اولیه از دادهها یاد کرد. در حال حاضرخوشهبندی در زمینههای متنوعی به کارگرفته شده است که به عنوان نمونه میتوان موارد زیر را برشمرد:
1- مهندسی: بینش محاسباتی، یادگیری ماشین، تشخیص الگو، مهندسی مکانیک ، مهندسی برق. کاربردهای موضوعی خوشهبندی درمحدودهی مهندسی از شناسایی بیومتریک و شناسایی گفتار تا تحلیل سیگنال رادار، خلاصه کردن اطلاعات و رفع پارازیت می باشد .
2 – علوم کامپیوتر: کاربردهای  خیلی  زیادی از خوشه بندی در وب کاوی ( دسته‌ بندی اسناد و یا دسته ‌بندی مشتریان به سایتها )، تحلیل پایگاه داده فضایی ، بازیابی اطلاعات ، گردآوری مستندات متنی وپردازش تصویر ( تقسیم بندی تصاویر پزشکی و یا ماهواره‌ای) مشاهده کردهایم .
3 – علوم پزشکی و زندگی: ژنتیک ، زیست شناسی ( دسته ‌بندی حیوانات و گیاهان از روی ویژگی‌های آنها )، میکروب شناسی، دیرین شناسی، روانپزشکی، تکامل نژادی، آسیب شناسی. این حوزهها، در وهلهی اول شامل کاربردهای عمدهی خوشهبندی هستند و تا یکی از زمینه های اصلی الگوریتمهای خوشهبندی گردند؛ ادامه پیدا
میکنند. کاربردهای مهم شامل تعریف طبقه بندی، شناسایی کارکرد پروتئین و ژن ، تشخیص و درمان بیماری و … میباشند.
4 – علوم زمین و ستاره شناسی: جغرافیا، زمین شناسی، دریافت متحرک. خوشه بندی میتواند برای طبقهبندی کردن ستارهها و سیارات، تحقیق درمورد ساختار زمین، تفکیک کردن مناطق و شهرها (دسته‌بندی خانه‌ها براساس نوع و موقعیت جغرافیایی آنها)، مطالعهی رودخانه و کوهها، مطالعات زلزلهنگاری ( تشخیص مناطق حادثه‌ خیز بر اساس مشاهدات قبلی ) به کار رود .
5 – علوم اجتماعی: جامعه شناسی، روان شناسی، انسان شناسی، کتابداری ( دسته ‌بندی کتابها)، آموزش و پرورش. همچنین، کاربردهای جالب توجهای میتواند در تحلیل الگوی رفتاری، ساختار تاریخ تکاملی زبانها، تحلیل شبکههای اجتماعی، تشخیص باستان شناسی، طبقه بندی مصنوعی و مطالعه روان شناسی جنایی یافت شود.
6 – اقتصاد: بازاریابی، تجارت. کاربردهایی نظیر شناسایی الگوی خرید، گروه بندی شرکتها و تحلیل روند  ذخیرهسازی، همه از تحلیل خوشه بندی سودمند میگردند.
2-2-3- انواع خوشهها