آموزش با نظارت و شبکه های عصبی

دانلود پایان نامه

سادگی محاسبات: این معیار بویژه برای کنترل فازی که در آن کنترل کننده بصورت بهنگام عمل می‌کند، بسیار مهم است.
پیوستگی: یک تغییر کوچک در B نباید به تغییر بزرگ در منجر شود.
با توجه به اینکه سه نوع غیر فازی ساز داریم: مرکز ثقل، میانگین مراکز، ماکزیمم. غیر فازی ساز میانگین مراکز را انتخاب می‌کنیم. چون هر سه معیار بالا را دارا می‌باشد.

  • اگر برای روش غیر‌فازی‌سازی، میانگین مراکز انتخاب گردد،خروجی این لایه بصورت زیر خواهد بود:
    (4-6)
    که در واقع و ها مرکز مجموعه فازی l- ام خروجی می باشد که خاصیت تنظیم در شبکه عصبی- فازی را دارد. در حالت بدون استفاده از خاصیت تنظیم، این مقادیر بایست توسط فرد خبره تعیین شود.
    4-4-2- شبکه عصبی- فازی سوگنو
    اصولا قوانین فازی نوع سوگنو [19، 30]، دارای ساختار ساده‌تر و استنتاج از آنها آسانتر صورت می‌گیرد. بعلاوه اینکه طراحی و تحلیل پایداری این نوع سیستم‌ها بصورت منظم و رسمی، راحتتر قابل پیگیری و توسعه می‌باشد. شبکه عصبی- فازی سوگنو نیز در حالت کلی یک ساختار پنج لایه می‌باشد که لایه‌های اول تا چهارم آن کاملا مشابه شبکه عصبی- فازی ممدانی است و به همین دلیل فقط به شرح لایه پنجم می‌پردازیم. در این لایه تالی قوانین فازی سوگنو تحقق می‌یابد و ضمنا عمل غیر‌فازی کردن نیز صورت می‌گیرد. خروجی لایه پنجم و در نتیجه خروجی شبکه بصورت زیر است:
    (4-7)
    در رابطه بالا و ورودیهای سیستم عصبی- فازی هستند و کمیتهایی غیر‌ فازی بوده و ، و پارامتر‌های تالی قوانین هستند که باید توسط شخص خبره و یا بوسیله یادگیری تنظیم شوند. هر سه این پارامترها در شبکه عصبی- فازی دارای خاصیت تنظیم می باشند. پس می توان به روشنی فهمید که تفاوت مابین شبکه عصبی- فازی سوگنو و ممدانی در تعداد پارامترهای تالی می باشد. همچنین شبکه عصبی- فازی سوگنو با توجه به تعداد پارامترهای زیاد بخش تالی، دارای درجه آزادی بیشتری نسبت به ممدانی است.
    4-5- کنترل کننده عصبی- فازی بازوی انعطاف پذیر
    روش کنترل عصبی- فازی را به دلیل برخورداری از توانمندی منطق فازی در برابر نامعینی ها و ویژگی قانونمندی آن و همچنین برخورداری از توانایی تطبیقی بودن شبکه های عصبی در برابر تغییر در مدل و نقطه کار انتخاب کردیم.

      مقاله قانون آیین دادرسی کیفری و آیین دادرسی کیفری

    رویکرد ما در طراحی کنترل کننده عصبی- فازی، بدین گونه بوده است که از قوانین نوشته شده واطلاعات به دست آمده از کنترل فازی بازوی انعطاف پذیر در تنظیم اولیه شبکه عصبی- فازی استفاده کرده و سعی شود تا با تطبیقی کردن بخش تالی به ساختار شبکه عصبی- فازی ممدانی دست یابیم. در ادامه با تطبیقی کردن متغیر های توابع تعلق سعی در بهبود عملکرد سیستم حلقه بسته خواهیم داشت.
    در شکل (4-5)، شکل کلی این کنترلر با 32×2 قانون نمایش داده شده است. همانند آنچه در بخش 4-3 توضیح داده شد، ورودی های کنترل کننده مطابق جدول (4-1) در دو ساختار آرایش می یابند و قوانین نیز در هر ساختار مشابه با آنچه در جدول های (4-2)، (4-3)، (4-4) و (4-5) نشان داده شده است، می باشند.
    در فصل بعد، در مورد ساختار تطبیقی و روش تطبیق این کنترل کننده توضیح داده می شود.

    5-1- مقدمه
    به طور معمول از عواطف به عنوان یک عامل منفی در تصمیم گیری یاد می شود که به منظور رسیدن به تصمیم منطقی و درست باید از آن اجتناب کرد.اما برای یک تصمیم گیری منطقی و مستدل، اطلاعات کاملی از سیستم مورد نیاز است که در بسیاری از موارد در دسترس نمی باشد. علاوه بر این، در چنین تصمیم گیری هایی، حجم محاسبات یک مشکل اساسی محسوب می شود ]31، 32[. بنابراین در سال های اخیر، که روش های بر مبنای مدل جای خود را به روش های بر مبنای داده و قانونمند داده اند [42]، نه تنها در حوزه علم روانشناسی بلکه در حوزه هوش مصنوعی و رباتیک ]33-35[ نیز بر نقش مثبت عواطف تاکید شده است. وقتی به دلیل وجود عدم قطعیت ها و حجم محاسبات، یک تصمیم گیری کاملا منطقی و مستدل غیر ممکن می شود، آنگاه می توان از عواطف به عنوان یک روش تقریبی برای انتخاب کنش مناسب استفاده کرد ]36[.
    در ]37-41[، کاربردهای کنترلی از آموزش عاطفی آمده است. در واقع این روش حالت خاصی از روش رایج کنترل هوشمند یعنی آموزش تقویتی می باشد.
    در آموزش عاطفی، یک نسخه شناختی از آموزش تقویتی نشان داده می شود که در آن یک سیگنال نقاد به طور مداوم نتایج سیستمی را که با فرمان کنترلی انتخاب شده کار می کند، بر حسب معیار های عملکرد ارزیابی می کند و یک سیگنال نشانگر تقویتی می سازد که وظیفه آموزش کنترل کننده را بر عهده دارد ]41[. به سیگنال تقویتی که به این شیوه ایجاد می شود، یک نشانگر عاطفی گفته می شود. در واقع، عواطفی چون اضطراب، نگرانی، ترس، رضایت و خوشحالی و …هستند که با توجه به اهداف و امکانات، محیط اطراف را ارزیابی می کنند تا نشانگر های مناسب برای تنظیم مکانیزم انتخاب کنش را تولید کنند ]41، 43[.
    چه آن راکنترل عاطفی بنامیم و چه آموزش تقویتی با نقاد، کاربرد این روش توسط مهندسین کنترل، طراحان ربات و سیستم های تصمیم گیرنده روز به روز در حال افزایش است و نتایج خوبی هم بدست آمده است ]37، 38و40 -44[. از طرفی، این روش بسیار مشابه روش آموزش پس انتشار خطا می باشد که یکی از رایج ترین روش های آموزش شبکه های عصبی است ]45،46[. در این روش با عبور خطای خروجی کنترل کننده از سیستم مورد کنترل، قانون به روزرسانی وزن ها به دست می آید. اما این روش عیب هایی هم دارد، از جمله حساسیت به نویز، اغتشاش و نرخ آموزش وزن ها. برای بهبود این روش، توانمندی آموزش عاطفی را می توان به الگوریتم آموزش پس انتشار خطا افزود. در نتیجه یک روش آموزش با نظارت خواهیم داشت که یک سیگنال ناظر (نقاد) رفتار شبکه را کنترل می کند ]47[. در شکل (5-1) ساختار آموزش عاطفی دیده می شود.

      دانلود پایان نامه درباره امکان تولید و هیدرولیک

    5-2- آموزش عاطفی برای به روز رسانی پارامترهای کنترل کننده عصبی- فازی

    این نوشته در مقالات و پایان نامه ها ارسال شده است. افزودن پیوند یکتا به علاقه‌مندی‌ها.