پایان نامه با موضوع مدل احتمال خطی و منحنی S شکل


Widget not in any sidebars

به راحتی می‌توان دریافت که این منحنی S شکل بسیار به تابع توزیع تخمینی انباشته متغیرهای تصادفی شباهت دارد. بنابراین، به راحتی می‌توان شکلی از تابع توزیع تخمین انباشته (CDE) را برای مدلهای رگرسیونی دارای متغیر وابسته منقسم به دو گروه که مقادیر 0 و 1 را اختیار میکنند به کاربرد.
سوالی که در اینجا مطرح میشود این است که کدام شکل از تابع توزیع تخمین برای این کار مناسبتر است؟ اگر چه تمام CDE ها S شکل هستند اما برای هر متغیر تصادفی یک CDE منحصر بفرد وجود دارد. با در نظر گرفتن سابقه‌ی تاریخی و کاربردی CDE هایی که عموما برای ارائه مدل‌های دارای متغیر وابسته منقسم به دو طبقه(1-0) مورد استفاده قرار می‌گیرند. عبارتند از (1) لاجستیک (2) نرمالی که اولی را مدل لاجیت و دومی را پروبیت یا نرمیت را فراهم می‌آورد (ابریشمی، 1383).
3-7-2-مدل لاجیت
اگر تابع زیر به عنوان مثال وجود داشته باشد.
(3-3)
تابع را می‌توان به صورت روبرو بازنویسی کنیم
(3-4) که Zi=B1+B2Xi است.
معادله (3-3) تحت عنوان تابع توزیع تجمعی لاجستیک معرفی میگردد.
در این حالت هم‌چنانکه Ziبین تا تغییر میکند Piبین 0 و 1 مقادیر خود را اختیار میکند و نیزآنکه Piبه طور غیرخطی به Zi (یعنی Xi) مربوط است. ما علی رغم تامین دوشرط فوق مسالهای که در تخمین این مدل به وجودآمده وآن اینکه Pi نه تنها برحسبx بلکه برحسب Bها هم غیرخطی است. این مساله بدان معنی است که روش معمولیOLS برای تخمین پارامترهای مدل مذکور قابل کاربرد نیست. اما میتوان اثبات کرد که برخلاف ظاهر قضیه میتوان(3-3)را به صورت رابطه خطی برحسب پارامترها تبدیل کرد.
اگرPi یعنی احتمال دارابودن ویژگی و(1-Pi)احتمال عدم دارا بودن ویژگی به صورت زیر است.
(3-5) بنابراین
داریم (3-6)
که نسبت احتمال حادثه مورد نظر برآلترناتیوآن است. حال چنانچه از رابطه(3-6)لگاریتم طبیعی گرفته شود نتیجه جالب توجه است.
(3-7)
یعنی L که لگاریتم نسبت برتری یا مزیت است. نه تنها بر حسب x بلکه برحسب پارامترها نیز خطی است.L بنام لاجیت معروف است (ابریشمی،1383).
الف 3-7-2-بررسی ویژگی‌های مدل لاجیت
1- همچنانکه P بین 0 و 1 (یعنی Zبین تا )نوسان میکند Lلاجیت از تا تغییر میکند. یعنی اگرچه احتمال بین 0 و 1 قرار میگیرد اما مدلهای لاجیت در این فاصله محدود نیستند.
2- اگرچهL برحسبxخطی است. اما خود احتمالها این طور نیستند. یعنی این مدل برخلاف مدل احتمال خطی است که درآن احتمال‌ها به طور خطی همراه باX افزایش مییابند.
3- تعبیر مدل لاجیت به قرار ذیل است: B2 (ضریب زاویه) میزان تغییر درL را به ازاء یک واحد تغییر در x یا به عبارت دیگر میزان تغییر در لگاریتم نسبت برتری یا مزیت را به ازاء یک واحد تغییر درx اندازه میگیرد.
4- اگر منظور تخمین خود احتمال دارابودن ویژگی مدنظراست(و نه نسبت مزیت به نفع آن) در یک سطح معینی ازxآنگاه این امر مستقیما از(3-3)با در دست داشتن تخمینهای B1 و B2امکان پذیر است (گجراتی، 1383).
ب3-7-2-تخمین مدل لاجیت
به منظور تخمین مدل را به صورت زیربازنویسی میکنیم.
(3-8)
برای تخمین مدل فوق جدای از مقادیر xi به مقادیر لاجیت Li نیازمندیم. اما در اینجا مشکلی وجود دارد و آن اینکه اگر دادهها به صورت انفرادی باشند. نمیتوان توسط روش معمولOLS تخمین زد.لذا به روش حداکثر راستنمایی برای تخمین پارامترها متوسل می‌شویم. برای رفع مشکل متناظر با هر سطح Xi Ni واحد داریم که در میان آنها ni تای آنها دارای ویژگی موردنظر است بنابراین اگر فرض کنیم یعنی اگر فراوانی نسبی آن را بدست آوریم میتوان آن را به عنوان تخمینی از Pi حقیقی متناظر باxi به کاربرد. با استفاده ازPi تخمینی لاجیت تخمین زده شده به قرارذیل است
(3-9) که اگر تعداد مشاهدات Ni در هرسطح Xi به اندازه کافی بزرگ باشد. فوق تخمین خوبی از Li واقعی خواهد بود (ابریشمی،1383).
حال این سوال مطرح می شود که آیا در این مرحله می‌توان روش ols را برای مدل(3-3) به کار برد. از آن جا که هنوز اطلاعی راجع به خصوصیات جز اخلال استوکاستیک فوق نداریم. جواب منفی است. می‌توان استنباط کرد که اگر Ni به اندازه کافی بزرگ باشد. و هر مشاهده در هر سطح درآمد مشخص Xi به طور مستقل برطبق قانون توزیع دو جمله‌ای توزیع شده باشدآنگاه داریم.
(3-10)