:دانلود فایل متن کامل پایان نامه در سایت sabzfile.com
عنوان : برآوردیابی پارامترهای یک مدل خطی برای داده های سانسورشده
دانشگاه شیراز
دانشکده علوم
پایان نامه ی کارشناسی ارشد در رشته ی آمارریاضی
برآوردیابی پارامترهای یک مدل خطی برای داده های سانسورشده
اساتید راهنما
دکتر مینا توحیدی
دکتر عبدالرسول برهانی
آذر ماه1392
برای رعایت حریم خصوصی نام نگارنده پایان نامه درج نمی گردد
(در فایل دانلودی نام نویسنده موجود می باشد)
تکه هایی از متن پایان نامه به عنوان نمونه :
(ممکن می باشد هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود اما در فایل دانلودی همه چیز مرتب و کامل می باشد)
فهرست مطالب
عنوان صفحه
فصل اول:تعاریف و مقدمات اولیه
1.1 مدل خطی………………………………………………………………………………………………………………………………………………….. 1
2.1 انواع برآوردگرهای استوار……………………………………………………………………………………………………………………………. 5
1.2.1 برآورد M………………………………………………………………………………………………………………………………………………. 5
3.1 واکاوی بقا………………………………………………………………………………………………………………………………………………………. 6
1.3.1 برآوردگر کاپلان مایر…………………………………………………………………………………………………………………………….. 7
2.3.1 سانسور………………………………………………………………………………………………………………………………………………….. 9
4.1 مدل رگرسیون خطی با خطای اندازهگیری…………………………………………………………………………………………….. 14
فصل دوم : دادهای سانسور شده از راست و مدل های رگرسیونی
1.2 مقدمه و تاریخچه……………………………………………………………………………………………………………………………………… 21
2.2 برآوردگر Susarla _Van Ryzin_ Koul……………………………………………………………………………………….. 22
1.2.2 مزایایی و معایب برآوردگر KSV……………………………………………………………………………………………………… 24
3.2 اصلاحات و تعمیم های برآوردگر KSV…………………………………………………………………………………………………. 25
1.3.2 تبدیل های دیگر………………………………………………………………………………………………………………………………… 25
2.3.2 اصلاحات برآوردگر KSV…………………………………………………………………………………………………………………. 26
1.2.3.2 طبقه بندی…………………………………………………………………………………………………………………………………… 26
2.2.3.2 برآورد M……………………………………………………………………………………………………………………………………… 27
4.2 تحلیل باقیمانده……………………………………………………………………………………………………………………………………….. 29
5.2 مثال………………………………………………………………………………………………………………………………………………………….. 30
فصل سوم : برآورد مدل مدل های خطی خطا با داده های سانسور شده
1.3 مقدمه……………………………………………………………………………………………………………………………………………………….. 37
2.3 . مدل رگرسیون خطی با دادههای سانسور شده با وجود خطا در متغیرهای مستقل…………………………… 40
1.2.3 اصلاح روش حداقل مربعات……………………………………………………………………………………………………………….. 41
2.2.3 روش درستنمایی تجربی وساخت فاصله اطمینان…………………………………………………………………………….. 45
4.3 اثبات قضایا……………………………………………………………………………………………………………………………………………….. 50
فصل چهارم :مطالعات شبیه سازی
1.4 حالت یک بعدی………………………………………………………………………………………………………………………………………….. 6
پیوست
برآوردگر کاپلان مایر با وجود دادههای سانسور شده……………………………………………………………………………………… 66
نسبت لگاریتم درستنمایی تجربی…………………………………………………………………………………………………………………… 67
معرفی نمادهای و ……………………………………………………………………………………………………………….. 70
واژه نامه
واژه نامه انگلیسی-فارسی………………………………………………………………………………………………………………………………… 72
وژه نامه فارسی-انگلیسی…………………………………………………………………………………………………………………………………. 77
مراجع…………………………………………………………………………………………………………………………………………………………………. 82
فهرست جداول
عنوان صفحه
جدول شماره 2.1: مجموع مربعات باقیمانده……………………………………………………………………………………………………. 31
جدول شماره 2.2: مجموع مربعات باقیمانده…………………………………………………………………………………………………… 34
جدول شماره 3.2: ضرائب برآورد شده (برای مدل کامل)………………………………………………………………………………. 35
جدول شماره 1.3: متوسط طول و احتمالات پوشش فواصل اطمینان روش NA برای ……………………………. 62
جدول شماره 1.3: متوسط طول و احتمالات پوشش فواصل اطمینان روش AEL برای …………………………. 63
فهرست شکلها
عنوان صفحه
شکل شماره 1.2: نمودار باقیمانده ها برای داده های پیوند قلب استانفورد، برازش درجه دوم………………………. 20
شکل شماره 2.2: نمودار باقیمانده ها برای داده های پیوند قلب استانفورد، برازش خطی…………………………….. 21
فصل اول:
مقدمات
در این فصل تعاریف و مقدمات اولیه برای مدلهای خطی، مدلهای خطی با خطای اندازهگیری، برآوردگرهای استوار بهویژه برآورد M، واکاوی بقا، برآوردگر کاپلان مایر، دادههای سانسورشده و انواع سانسور ارائه میگردد.
1-1- مدل خطی
یکی از کاربردیترین روشها برای تحلیل دادهها در بین ابزارهای آماری، تحلیل رگرسیونی می باشد. تحلیل رگرسیونی،روشی کارآمد برای مطالعه و مدلسازی ارتباط بین متغیرها می باشد که از این مدل های رگرسیونی در توصیف دادهها، برآورد پارامترهای مجهول، پیشگویی و کنترل بهره گیری می گردد.
در بیشتر موردها، پاسخ یک آزمایش به چندین متغیر مستقل مثلا k متغیر مستقل، وابسته می باشد. در این صورت یک مدل خطی ارتباطای به صورت زیر را در نظر میگیرد:
که n اندازه نمونه میباشد. متغیرهای را متغیرهای توضیحی و متغیر تصادفی قابل نظاره y را متغیر پاسخ مینامند.
متغیر تصادفی غیرقابل نظاره متغیر خطا تلقی میگردد، بدین معنی که به عنوان متغیری تصادفی، انداره ناتوانی مدل در برازش دقیق دادهها را اندازهگیری میکند. این خطا ممکن می باشد به دلیل عدم حضور بعضی از متغیرهای مؤثر، خطاهای تصافی مربوط به مشاهدات و اندازهگیریها و غیره صورت پذیرد.
همچنین فرض میگردد که خطاها دارای توزیع نرمال با میانگین صفر و واریانس نامعلوم و ناهمبسته باشند.
پارامترهای و مجهول هستند و بایستی با بهره گیری از دادهها برآورد شوند. فرض میشوددادهها عبارتند از که در آن پاسخ متناظر با k سطح از متغیرهای مستقل می باشد. یعنی بنابر معادله (1.1.1) میتوان نوشت:
آنگاه هدف ما به دست آوردن برآوردهای برای به ترتیب به نامهای و در نتیجه به دست آوردن ارتباط زیر می باشد.
که در آن نشان دهنده مقدار برآورد شده y به ازای مقادیر می باشد. در این صورت معادله (3.1.1) به عنوان معادله پیش بینی کننده میتواند مورد بهره گیری قرار گیرد.
معمولترین روش در برآورد پارامترهای یک مدل خطی، بهره گیری از روش “کمترین مربعات معمول (OLS)” می باشد که روشی بسیار سودمند و کارا می باشد.
پایه و اساس روش کمترین مربعات به Gaussو Legendreباز میگردد. این روش (و تعمیمهای آن ) به دلیل راحتی محاسبات و جوابهای بسته مبتنی برآن مورد توجه بسیاری از آماردانان می باشد. جستجو در سایت :
برآوردهای را به گونهای برمیگزینیم که مجموع توان دوم انحرافها را کمینه کند، یعنی آنها را به گونهای به دست میآوریم که در معادله زیر هنگامی که به ترتیب جایگزین میشوند، کمترین مقدار ممکن را تولید کنند.
برآوردهای با مشتق گرفتن از معادله (4.1.1) نسبت به و مساوی صفر قرار دادن آنها به دست میآیند. ملاحظه میگردد که برای حل این معادله های نرمال بهتر می باشد که از روش ماتریسی بهره گیری گردد. می توان ارتباط (1.1.1) را به فرم ماتریسی زیرر در نظر گرفت.
بطوریکه .
فرم ماتریسی را میتوان بصورت زیر نوشت.
این مدل را یک مدل خطی گویند، زیرا نسبت به پارامترهای مدل، خطی می باشد.
در این مدل خطی Yیک ماتریس ، X یک ماتریس ، یک ماتریس و یک ماتریس هستند.
آنگاه میتوان معادلههای نرمال را به صورت زیر نوشت:
زیرا
زیرا یک ماتریس می باشد در نتیجه با ترانهاده خود برابر می باشد پس:
و خواهیم داشت:
با مشتق گرفتن از ارتباط (7.1.1) نسبت به بردار و جایگزین کردن به جای و مساوی صفر قرار دادن آن، معادلههای نرمال (6.1.1) به دست میآیند.
ماتریسهای و عبارتند از:
با فرض معکوسپذیر بودن ماتریس داریم:
که در این صورت معادله پیش بینی کننده عبارت می باشد از:
که در آن داریم:
اما زمانی که داده پرت داشته باشیم روش کمترین مربعات معمولی جوابگو نیست، به همین دلیل به معرفی برآوردگرهای استوار می پردازیم.
1-2- انواع برآوردگرهای استوار:
برآوردگرهای استوار برآوردهایی هستند که با بهره گیری از آنها میتوان حساسیت روش حداقل مربعات را نسبت به وجود دادههای پرت کاهش داد.
برای این مقصود روش کمی زیر را معرفی میکنیم:
میتوان را توسط تابع دیگری مانند جایگزین نمود. و با کمینه کردن به برآوردگری استوار دست پیدا نمود. برآوردهای ، برآوردهای M و برآوردهای GM با این روش حاصل میشوند. که در این پایان نامه فقط به معرفی برآورد M میپردازیم.
تذکر. جایگزین کردن مجموع یا میانگین با کمیتهای استوار نظیر آنها مانند میانه یا میانگین پیراسته می باشد. بر این اساس، روشهایی تحت عنوان LMS (کمترین میانه مربعات) یا LTS (کمترین میانگین پیراسته مربعات) معرفی شدهاند.
1-2-1- برآوردM
میتوان در ارتباط ی به جای توابع دیگری مانند را قرار داد و برآوردهای پارامترها را بهگونهای پیدا نمود که کمیت زیر حاصل گردد.
که یک تابع حقیقی با ویژگیهای زیر می باشد:
الف.
ب. تابع متقارن می باشد.
ج. تابع پیوسته می باشد.
د. اگر آنگاه می باشد.
ه. فرض کنید باشد، آنگاه می باشد.
و. اگر و ، آنگاه می باشد.
تذکر. میباشد.
تعداد صفحه :99
قیمت : 14700 تومان