پایان نامه ارشد درباره اثرات تصادفی و مدل ترکیبی

در صورتیکه در مدل ترکیبی F به صورت زیر محاسبه می‌گردد:

به وضوح مشخص است که مقدار F در مدل ترکیبی می‌تواند بزرگتر از مدل تنها سری زمانی باشد و لذا احتمال معنی‌دار بودن کل رگرسیون یعنی وجود متغیرهای توضیحی در مدل ترکیبی بیشتر خواهد بود.
ب- داده‌های ترکیبی امکان طراحی الگوهای رفتاری پیچیده‌تری نسبت به داده‌های مقطعی و سری‏های زمانی صرف را فراهم می‌کند. برای مثال بوسیله دادههای ترکیبی امکان بهتری برای بررسی و مدل‌سازی کارایی تکنیکی وجود دارد.
ج- داده‌های ترکیبی امکان بیشتری برای شناسایی و اندازه‌گیری اثراتی را فراهم می‌کند که بوسیله فقط آمارهای مقطعی و یا سری زمانی به سادگی قابل شناسایی نیست.
د- داده‌های ترکیبی از واحدهای کوچکی مثل افراد، شرکت‏ها و خانوارها گردآوری می‌شوند. خیلی از متغیرها را می‌توان در مقیاس کوچک با دقت بیشتری اندازه‌گیری نمود و انحراف‌های ناشی از تجمع افراد یا شرکت‏ها حذف می‌شوند.
ه- امتیاز دیگری که برای ترکیب کردن داده‌ها می‌توان در نظر گرفت این است که استفاده از مشاهدات مقطعی ممکن است منجر به برآوردهای اریبی از پارامترها شود. چنانچه از این برش‏های مقطعی طی زمان نمونه‌گیری شود و به اصطلاح داده‌های ترکیبی فراهم شود برآوردهای نااریب و سازگاری امکانپذیر است.
Widget not in any sidebars

3-8-3- روش‏های تخمین
برآورد روابطی که در آنها از دادههای ترکیبی (سری زمانی، مقطعی) استفاده میشود، غالباً با پیچیدگیهایی مواجه است. در حالت کلی، مدل زیر نشان دهنده یک مدل ترکیبی است:

که در آن i=1,2,…,n نشان دهنده واحدهای مقطعی (مثلا شرکت ها) وt=1,2,…,t بر زمان اشاره دارد. متغیر وابسته iامین واحد مقطعی در سال t و نیز k امین متغیر مستقل غیر تصادفی برای i امین واحد مقطعی در سال t ام است. فرض می‏شود جمله اخلال دارای میانگین صفر یعنی و واریانس ثابت است. پارامترهای مدل مجهول است که واکنش متغیر وابسته نسبت به تغییرات k امین متغیر مستقل در i امین مقطع و t امین زمان را اندازهگیری می‏کند.
با توجه به مدل فوق، بسته به اینکه ضرایب متغیرها و عرض از مبدأها ثابت یا متغیر باشند، حالت‏های مختلفی از مدل‏های ترکیبی رخ میدهد که مدلهای تلفیقی، تابلویی، تابلویی با اثرات ثابت و تابلویی با اثرات متغیر از آن جمله هستند. در ادامه به نحوه تمایز بین این مدل‏ها پرداخته میشود.
برای تخمین مدل‏ها، ابتدا با استفاده از آزمون F لیمر، مشخص می‏شود که بایستی از مدل تابلویی استفاده شود یا مدل تلفیقی. آماره این آزمون به صورت زیر است:

که در آن:
RRSS: مجموع مجذورات پسماندهای مقید
URSS: مجموع مجذورات پسماندهای غیرمقید
K : تعداد متغیرهای توضیحی
N: تعداد مقطعها
در آزمون F ، فرضیه صفر یکسان بودن عرض از مبدأها (دادههای تلفیقی) در مقابل فرضیه مخالف، ناهمسانی عرض از مبدأها (روش دادههای تابلویی) قرار میگیرد. لذا میتوان نوشت:
اگر F محاسبه شده از F جدول با درجه آزادیهای N-1 و NT–N-K بزرگتر باشد، فرضیه صفر رد شده و استفاده از روش دادههای تابلویی بهتر است. در غیر این صورت از روش داده‏های تلفیقی استفاده میشود .
اگر بر اساس آزمون F لیمر روش داده‏های تابلویی انتخاب گردید، سؤال اساسی دیگری که مطرح خواهد شد این است که آیا تفاوت در مقاطع مختلف می‌تواند بوسیله عرض از مبدأ خاص در واحد پاسخگو باشد. به عبارت دیگر آیا تفاوت در عرض از مبدأ واحدهای مقطعی به طور ثابت عمل میکند یا اینکه عملکردهای تصادفی می‌توانند این اختلاف بین واحدها را بطور واضح‌تری بیان نماید که به ترتیب این دو روش در ادبیات داده‌های ترکیبی به روش‏های ثابت و اثرات تصادفی مشهور هستند. برای تشخیص اینکه کدام مدل باید مورد استفاده قرار گیرد از آزمون هاسمن استفاده میشود. در واقع از آزمون هاسمن برای بررسی این موضوع که آیا عرض از مبدأ بصورت اثرات ثابت است یا اینکه در ساختار واحدهای مقطعی (شرکتها) بصورت تصادفی عمل میکند، استفاده میشود. فرضیه و آماره این آزمون به نحو زیر است:
:
:

در رابطه فوق: