Extfin = متغیر کنترلی است که برابر با جمع حقوق صاحبان سهام تقسیم بر جمع دارایی ها می باشد.
= متغیر کنترلی است که برابر با بازده دارایی ها می باشد.
۳-۹- روش تجزیه و تحلیل داده ها
به طور کلی در این تحقیق از دو دسته روش های آماری برای تجزیه و تحلیل داده ها استفاده شده است که عبارتند از:
(( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. ))
آمار توصیفی: مجموعه روشهایی است که در گردآوری، منظم کردن، و نشان دادن شکل های توزیع متغییرها به کار می رود. آمار توصیفی شامل محاسبه میانگین، میانه، مد و انحراف معیار داده ها می باشد.
آمار استنباطی: برای استنباط خصوصیت یک جامعه آماری از روی مشاهدات یک یا چند نمونه از آن جامعه بکار می رود. در آمار استنباطی ما از دو روش استفاده می کنیم. در ابتدا از روش همبستگی پیرسون برای اندازه گیری درجه ارتباط بین متغیرهای مختلف در این تحقیق مورد استفاده قرار می گیرد، در مرحله بعد از تحلیل رگرسیون برای تخمین رابطه بین متغیرها مورد استفاده قرار می گیرد.
مسأله آزمون فرضیه در مباحث آماری به این صورت توصیف می گردد که آیا مشاهدات یا یافته ای معین که می خواهیم آن را تحلیل کنیم به اندازه کافی به مقدار مفروضی که ما را به پذیرش فرضیه اظهار شده وارد می کند، نزدیک شده است یا خیر؟
در علم آمار فرضیه اظهار شده ، فرضیه عدم نامیده می شود که با نماد H0 نشان داده می شود. فرضیه عدم معمولاً در مقابل فرضیه آلترناتیو که با نماد H1 نشان داده می شود، آزمون می گردد. پس به طور کلی نظریه آزمون فرضیه ایجاد قوانین و روش هایی را برای تصمیم گیری درباره پذیرش یا عدم پذیرش فرضیه عدم بررسی می کند. به عبارت دیگر آزمون معنی دار بودن، روشی است که با بهره گرفتن از نتایج نمونه ای درستی یا نادرستی فرضیه عدم را تعیین (تحقیق) می کند.( ابریشمی ،۱۳۷۷)
معمولأ استفاده از داده های آماری به سه روش مقطعی[۷۱]، سری زمانی[۷۲] و ترکیبی[۷۳] امکان پذیر است:
۱- دادههای مقطعی: در داده های مقطعی، مقادیر یک یا چند متغیر برای چندین واحد اقتصادی (مشاهدات نمونه ای) برای یک زمان مشخص جمعآوری می شود.
۲- داده های سری زمانی: در داده های سری زمانی، مقدار یک یا چند متغیر در طول یک دوره زمانی مشاهده می شود.
۳- داده های ترکیبی: در داده های ترکیبی، عناصر هر دو دسته از داده های سری زمانی و مقطعی وجود دارد. یعنی اطلاعات مربوط به داده های مقطعی در طول زمان مشاهده می شود. به بیان دیگر، چنین دادههایی دارای دو بعد میباشند که یک بعد آن مربوط به واحدهای مختلف در هر مقطع زمانی خاص است و بعد دیگر آن مربوط به زمان میباشد. یعنی روش داده های ترکیبی، روشی برای تلفیق مشاهدات مقطعی در خلال چندین دوره زمانی است (گجراتی[۷۴]، ۱۹۹۵).
در این پژوهش با توجه به نوع داده ها و روشهای تجزیه و تحلیل موجود، از روش “داده های ترکیبی” استفاده می شود. منظور از داده های ترکیبی، مجموعه ای از دادههاست که متشکل از تعداد زیادی از متغیرهای مقطعی (N) است که در طول یک دوره زمانی مشخص (T) مورد بررسی قرار میگیرند. در این صورت تعداد مشاهدات N × T بوده که با بهره گرفتن از مدلهای مختلفی قابل تخمین است.
با بهره گرفتن از داده های ترکیبی، میتوان به تخمینهای کارا دست یافت. شکل کلی مدل داده های ترکیبی که به اجزاء خطا[۷۵] معروف است، به صورت زیر میباشد(دوقرتی[۷۶]،۲۰۰۴): ش به گونه خلاصه به صورت زیر نوشته میLn Sale, Age, DebtInt.,
در رابطه فوق Y نشاندهنده متغیر وابسته، X متغیرهای توضیحی مشاهده شده و Z نشاندهنده متغیرهای توضیحی غیرقابل مشاهده اثرگذار بر متغیر وابسته برای هر مقطع است که برای توضیح بهتر مدل داده های ترکیبی، این دسته از متغیرها از مقادیر اجزاء خطا جدا شده است. نماد i نشاندهنده مقطعها یا واحدهای مشاهده شده، t نشاندهنده دوره زمانی و j و p به ترتیب نشانگر تعداد متغیرهای مشاهده شده و مشاهده نشده است. نشاندهنده خطای برآورد داده های ترکیبی است که تمامی شرایط مربوط به جملات خطا تحت فروض گوس- مارکف[۷۷] را داراست. جمله روند () نشاندهنده تغییرات جمله ثابت در طول زمان است. این مدل به “مدل داده های ترکیبی دوطرفه[۷۸]“ معروف است(دوقرتی، ۲۰۰۴).
از آنجا که متغیرهای Z قابل اندازه گیری نیستند، میتوان مجموع همه آنها را به صورت یک متغیر نشان داد. در این صورت، معادله بالا را میتوان به صورت زیر بازنویسی کرد:
که در آن= است. اگر با هر کدام از متغیرهای توضیحی دیگر X وابسته باشد، برآورد و تحلیل از طریق این معادله، دارای تورش مربوط به متغیرهای برآورد نشده خواهد بود (دوقرتی، ۲۰۰۴).
اگر متغیرهای غیرقابل اندازه گیری کنترل شوند، میتوان با بهره گرفتن از روش “حداقل مربعات معمولی[۷۹]” یا “حداقل مربعات تعمیم یافته[۸۰]” به تخمینهای کارایی دست یافت. یکی از راههای کنترل به کارگیری “مدل اثر ثابت[۸۱]” است. در مدل اثر ثابت، اثرات مشاهده نشده در جمله ثابت رگرسیون وارد می شود. در این مدل با بهره گرفتن از روش متغیرهای مجازی یا روش تفاضلگیری، اثرات متغیرهای مشاهده نشدنی کنترل می شود.
بنابراین، در مدلهای اثر ثابت، برای دستیابی به تخمینهای کارا از روش حذف متغیرهای غیر قابل مشاهده اثرگذار در مدل استفاده می شود. به کارگیری این روش موجب حذف بسیاری از متغیرهای مهم می شود. از اینرو، میتوان به جای در نظر نگرفتن این متغیرها، آنها را در اجزاء خطا منظور کرد. این روش، به “مدل اثر تصادفی[۸۲]” معروف است. اولین شرط برای استفاده از مدل اثر تصادفی آن است که متغیرها به صورت تصادفی انتخاب شده باشند. در این صورت متغیری تصادفی است و مدل بالا را میتوان به صورت زیر بازنویسی کرد:
که در آن است (بالتاگی[۸۳]، ۲۰۰۵).
شرط لازم استفاده از این مدل، عدم وابستگی متغیرهای به سایر متغیرهای توضیحی در مدل است. اگر این شرط برقرار نباشد، تخمین مدل اثر تصادفی، غیرثابت و با تورش خواهد بود. در این صورت از مدل اثر ثابت استفاده می شود.
روش دادههای ترکیبی به دلیل مزایای زیر مورد استفاده محققین اعم از محققین حسابداری و مالی قرار گرفته است (هسیاو[۸۴]: ۲۰۰۳):
در اختیار محقق قرار گرفتن نقاط آماری بیشتر و افزایش درجه آزادی.
کنترل ناهمسانیهای منفرد[۸۵].
ایجاد دادههای قویتر، قابل اتکاتر و با هم خطی کمتر میان متغیرها و در نتیجه افزایش کارایی.
تعیین و اندازه گیری آثار متغیرهای حذف شده.
بدست آوردن نتایج نا اریب.
تفکیک جملات خطا به تغییرات سری زمانی و مکانی.
بنابراین وقتی که از داده های ترکیبی استفاده میشود، باید آزمونهای مختلفی برای تشخیص روش تخمین مناسب انجام داد. رایجترین آنها آزمون “هاسمن[۸۶]” برای انتخاب یکی از مدلهای اثر ثابت یا مدل اثر تصادفی و آزمون بروش-پاگان الام[۸۷] برای انتخاب یکی از مدلهای اثر تصادفی یا مدل داده های تلفیقی[۸۸] است. این مراحل بدین صورت است که اگر داده ها به صورت تصادفی از بین داده های زیادی انتخاب نشده باشد، از مدل اثر ثابت استفاده می شود. اما اگر داده ها به صورت تصادفی انتخاب شده باشند، هر دو مدل اثر ثابت و اثر تصادفی تخمین زده می شود. سپس آزمون “هاسمن” انجام میگیرد. چنانچه آماره این آزمون نشاندهنده برآورد با بهره گرفتن از مدل اثر ثابت باشد، این مدل برآورد می شود. اما چنانچه این آماره نشانگر برآورد مدل با بهره گرفتن از مدل اثر تصادفی باشد، باید آزمون بروش-پاگان الام برای انتخاب یکی ازمدلهای اثر تصادفی یا ادغام داده ها، انجام گیرد(بالتاگی، ۲۰۰۵).
برای استفاده از داده های پانلی با رویکرد اثرات ثابت، بایستی ابتدا آزمونهای زیر انجام شود Ibid, P.19):
آزمون هاسمن
هاسمن (۱۹۸۷)، آزمونی را برای انتخاب بین مدل اثر ثابت و مدل اثر تصادفی معرفی نموده است. در این آزمون، فرضیه صفر با در نظر گرفتن عدم وجود همبستگی بین اثرات واحدها () که بخشی از جمله اختلال است و غیر قابل مشاهده میباشد شکل میگیرد. اما ممکن است این دو با هم، همبسته باشند در این صورت تخمین زن GLS یعنی تخمین زنی تورشدار و ناسازگار از خواهد بود در حالیکه تبدیل درونی[۸۹] این ها را از بین میبرد و تخمین زن اثرات ثابت یا همان را تخمین زنی بدون تورش و سازگار از میسازد. فرضیات این آزمون به صورت زیر است:
که در این فرضیات، نشاندهنده واریانس اثر مقطعی مدل برآورد شده از طریق اثر تصادفی است. چنانچه واریانس اثرات مقطعی در مدل اثر تصادفی ناچیز باشد، میتوان از روش ترکیب کل داده ها (ادغام) و استفاده از تخمین حداقل مربعات معمولی برای برآورد روابط بین متغیرها استفاده کرد. برای محاسبه آماره از خطای برآورد داده های ادغام شده به صورت زیر استفاده می شود:
که در رابطه فوق خطای برآورد مدل داده های ادغام شده و متوسط خطا در زمان اول است. با درستی فرضیه اول این آماره دارای توزیع χ با یک درجه آزادی است.
به این ترتیب، با آزمونهای مختلف میتوان مدل مناسب تخمین را برگزید. پس از انتخاب مدل مناسب باید نسبت به پایا بودن سریهای زمانی و غیرکاذب بودن رگرسیون اطمینان حاصل کرد (بالتاگی، ۲۰۰۵).
ناهمسانی
یکی از مشکلاتی که می تواند وجود داشته باشد، ناهمسانی واریانسها میباشد. براساس دیدگاه بالتجای (۲۰۰۵) این مساله می تواند، یک فرض محدود کننده برای داده های پانلی باشد، زمانیکه واحدهای مقطعی دارای اندازه های متفاوت باشند و مانند نمایش یک نتیجه تغییرات متفاوت. برای آزمون ناهمسانی و بیانگر آناست که برای تمامi برابر نیست (همان منبع، ص.۱۰).
همبستگی پیاپی
همبستگی پیاپی به وضعیتی اشاره دارد، که باقیماندهها درطول زمان همبستگی دارند. نادیده گرفتن همبستگی پیاپی، درجاییکه وجود دارد، باعث ثبات میگردد. اما باعث ناکارایی برآوردها و سوگیری خطاهایاستاندارد می شود. برای آزمون کردن همبستگی پیاپی، اثرات ثابت داده ها، بهوسیله :
۰ρ =: و ۰< │ρ│ : انجام می شود. ρ یک تقریب خطی از رابطه بین باقیماندههای دوره جاری و دوره قبل است (همان منبع، ص.۱۰).
رگرسیون چند متغیره
در برخی از مسائل پژوهشی، به ویژه آنهایی که هدف پیشبینی دارند، تعیین همبستگی بین متغیر ملاک (که قصد پیشبینی آن را داریم) و ترکیب متغیرهای پیشبینی کننده، که هر کدام از آنها تا حدودی با این متغیر همبستگی دارند، دارای اهمیت زیادی است. روشی که از طریق آن متغیرهای پیشبینی کننده ترکیب میشوند، “رگرسیون چند متغیری” است. در این روش، یک معادله رگرسیون چند متغیری محاسبه میشود که ارزشهای اندازهگیری شده پیشبینی را در یک فرمول خلاصه میکند. ضرایب معادله برای هر متغیر، بر اساس اهمیت آن در پیشبینی متغیر ملاک محاسبه و معین میشود. درجه همبستگی بین متغیرهای پیشبینی کننده در معادله رگرسیون چند متغیری و متغیر ملاک، بهوسیله ضریب نشان داده میشود (دلاور، ۱۳۸۴).
رگرسیون چند متغیری دارای روشهای مختلفی است. تفاوت روشهای آن در نحوه انتخاب متغیرهای پیشبینی کننده است.
برای تعیین رگرسیون از رابطه زیر در این پژوهش استفاده میگردد؛
: عملکرد شرکت