:دانلود فایل متن کامل پایان نامه در سایت sabzfile.com

عنوان :   طراحی سیستم دسته‌بند فازی مبتنی بر بهینه سازی ازدحام ذرات برای تشخیص بیماری دیابت

وزارت علوم، تحقیقات و فناوری

دانشگاه علوم و فنون مازندران

 

پایان نامه

مقطع کارشناسی ارشد

رشته : مهندسی فناوری اطلاعات

عنوان :

  طراحی سیستم دسته‌بند فازی مبتنی بر بهینه سازی ازدحام ذرات برای تشخیص بیماری دیابت

 

استاد راهنما:

  دکتر جواد وحیدی

استاد مشاور:

  دکتر همایون موتمنی 

 

(زمستان 1392)

برای رعایت حریم خصوصی نام نگارنده پایان نامه درج نمی گردد

(در فایل دانلودی نام نویسنده موجود می باشد)

تکه هایی از متن پایان نامه به عنوان نمونه :

(ممکن می باشد هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود اما در فایل دانلودی همه چیز مرتب و کامل می باشد)

چکیده

تشخیص بیماری دیابت و یا آگاهی یافتن از احتمال بالای ابتلا به این بیماری همواره کار آسانی نخواهد بود. زیرا که این بیماری علائم متعددی را بروز می‌دهد که بعضی از این علائم در سایر بیماری‌های دیگر نیز وجود دارند. پس پزشک برای اتخاذ یک تصمیم مناسب، بایستی نتیجه‌ی آزمایش‌های بیمار و تصمیم‌هایی که در گذشته برای بیماران با وضیعت مشابه گرفته می باشد، را مطالعه کند.

در این پایان نامه از یک الگوریتم دسته‌بندی مبتنی بر قانون برای دسته‌بندی بیماران دیابتی بهره گیری شده می باشد. برای استخراج قوانین فازی از یک الگوریتم بهینه سازی ازدحام ذرات بهره گیری شده می باشد. این الگوریتم دارای ویژگی‌هایی می باشد که آن را از سایر الگوریتم مورد بهره گیری متمایز می کند. مانند‌ی این ویژگی‌ها می‌توان به تابع افزایش تنوع ذرات و تکامل هم‌زمان توابع عضویت و قوانین فازی تصریح نمود. برای ارزیابی کارایی الگوریتم از مجموعه داده‌ی دیابت بهره گیری شده می باشد. نتایج ارزیابی‌ها نشان می‌دهد که الگوریتم برای مجموعه داده‌ی دیابت دارای کارایی بسیار بالایی می‌باشد. همچنین کارایی الگوریتم پیشنهادی به علت بالا بردن قابلیت تفسیرپذیری دسته‌بند (کاهش تعداد قوانین فازی) بسیار مناسب می‌باشد.

کلمات کلیدی:

تشخیص بیماری دیابت، دسته‌بند مبتنی بر قانون، الگوریتم بهینه‌سازی ازدحام ذرات، تکامل همزمان توابع عضویت و قوانین فازی.

 

فهرست رئوس مطالب

عنوان                                                                                                       صفحه

فصل اول – مقدمه و کلیات پژوهش.. 1

1-1- مقدمه. 2

1-2- اظهار مسأله. 3

1-3- اهداف پژوهش.. 5

1-4- سوالات پژوهش.. 6

1-5- فرضیات مسأله. 6

1-6- نوآوری‌های پژوهش.. 7

1-7- تعریف واژگان. 7

1-8- ساختار پایان نامه. 8

 

فصل دوم – ادبیات و پیشینه پژوهش.. 10

2-1- مقدمه. 11

2-2- داده‌کاوی.. 11

2-3- دسته‌بندی.. 13

2-4- الگوریتم‌های رایج دسته‌بندی.. 15

2-4-1- شبکه‌های عصبی مصنوعی.. 15

2-4-2- درخت‌های تصمیم. 19

2-4-3- شبکه‌های بیزین.. 21

2-4-4- K نزدیک‌ترین همسایه. 23

2-4-5- ماشین بردار پشتیبان. 24

2-4-6- روش‌های مبتنی بر قانون. 28

2-5- الگوریتم بهینه‌سازی ازدحام ذرات… 32

2-5-1- پارامترهای پایه بهینه‌سازی ازدحام ذرات… 35

2-5-2- چالش‌ها و مسائل پیش روی الگوریتم بهینه‌سازی ازدحام ذرات… 39

2-5-2-1- مشکل ابعاد بالا. 40

2-5-2-2- مشکل همبستگی میان داده‌ها 43

2-5-3- گونه‌های مختلف PSO.. 47

2-5-3-1- بهینه‌سازی ازدحام ذرات مبتنی بر شبکه‌های جمعی.. 48

2-5-3-1-1- همسایگی مبتنی بر فاصله فضایی.. 48

2-5-3-1-2- همسایگی فزاینده 48

2-5-3-1-3- بهینه‌سازی ازدحام ذرات کاملاً آگاه (FIPS). 49

2-5-3-2- مدل پیوندی بهینه‌سازی ازدحام ذرات… 50

2-5-3-3- بهینه‌سازی ازدحام ذرات چند جمعیتی.. 53

2-6- سیستم‌های فازی.. 56

2-6-1- ساختار یک سیستم دسته‌بندی مبتنی بر قوانین فازی.. 57

2-6-2- دسته‌بندی بدون بهره گیری از درجه قطعیت… 58

2-6-3- دسته‌بندی با بهره گیری از درجه قطعیت… 62

2-6-4- استنتاج فازی.. 66

2-7- معیار‌های ارزیابی دسته‌بند‌ها 68

 

فصل سوم – روش پژوهش.. 72

3-1- مقدمه. 73

3-2- تبدیل داده‌های حقیقی به ترم‌های فازی.. 75

3-3- تولید توابع عضویت و قوانین فازی با بهره گیری از الگوریتم بهینه‌سازی ازدحام ذرات… 77

3-3-1- کدگذاری توابع عضویت فازی.. 78

3-3-2- کدگذاری قوانین فازی.. 80

3-3-3- PSO پیشنهادی.. 82

3-3-5- توابع برازش کیفیت قوانین.. 87

3-5- نتیجه‌گیری.. 90

 

فصل چهارم – محاسبات و یافته‌های پژوهش.. 91

4-1- داده‌های مورد بهره گیری 92

4-2- تنظیم پارامترها 94

4-3- روش‌های بهره گیری شده به مقصود مقایسه. 97

4-4- نتایج.. 98

4-5- نتیجه گیری.. 101

 

فصل پنجم – نتیجه گیری و پیشنهادات… 102

5-1- اختصار و نتیجه‌ گیری.. 103

5-2- پیشنهادات… 103

منابع: 105
جستجو در سایت :   


 

فهرست جداول

عنوان                                                                                                       صفحه

جدول 2-1: مجموعه داده‌های آموزش… 20

جدول 2-2: جدول توزیع احتمال گره تنگی نفس…. 23

جدول 2-3: توابع فاصله میان نمونه‌های x و y. 23

جدول 2-4: ماتریس اغتشاش دودویی.. 69

جدول 4- 1: خصیصه‌های مجموعه داده Pima Indian Diabetes. 92

جدول 4- 2: پارامترهای قابل تنظیم توسط کاربر. 94

جدول 4- 3: مقادیر در نظر گرفته شده برای پارامترهای الگوریتم. 96

جدول 4- 4: نتایج بدست آمده از الگوریتم پیشنهادی بر روی مجموعه داده Pima. 99

جدول 4- 5:مقایسه نتایج بدست آمده برای مجموعه داده Pima با سایر روش‌ها 99

جدول 4- 6: نتایج سایر مطالعات صورت گرفته بر روی مجموعه داده Pima. 100

 

فهرست تصاویر و نمودارها

عنوان                                                                                                       صفحه

شکل 2- 1: فرآیند داده‌کاوی و کشف دانش…. 12

شکل 2- 2: ساختار SLP. 17

شکل 2- 3: ساختار یک نرون (گره). 18

شکل 2- 4: درخت تصمیم جدول (2-1). 21

شکل 2- 5: مثالی از شبکه‌ی بیزین.. 22

شکل 2- 6: دسته‌بند ماشین بردار پشتیبان. 25

شکل 2- 7: دسته‌بند ماشین بردار پشتیبان با حاشیه نرم. 27

شکل 2- 8: شبه کد الگوریتم بهینه‌سازی ازدحام ذرات… 34

شکل 2- 9: تشریح هندسی مولفه‌های شخصی و اجتماعی در PSO.. 35

شکل 2- 10: ساختار یک سیستم قانونمند فازی.. 59

شکل 2- 11: ناحیه تصمیم هر قانون فازی.. 60

شکل 2- 12: مرزهای دسته‌بندی نُه قانون فازی.. 60

شکل 2- 13:مرز دسته‌بندی بعد از اصلاح توابع عضویت… 61

شکل 2- 14: ناحیه تصمیم هر قانون فازی در حالتی که جداول قانون فازی ناکامل باشد. 62

شکل 2- 15: ناحیه تصمیم هر قانون فازی با درجات… 63

شکل 2- 16: تنظیم مرزهای دسته‌بندی بدون بهره گیری از درجه قطعیت… 63

شکل 2- 17: تنظیم مرزهای دسته‌بندی با بهره گیری از درجه قطعیت… 64

شکل 2- 18: تعیین دسته نتیجه و درجه قطعیت… 65

شکل 2- 19: بیش برازش… 71

شکل 3- 1: نمای کلی مدل پیشنهادی برای واکشی سیستم فازی.. 74

شکل 3- 2: توابع عضویت فازی (S:Small, MS: Medium Small, M: Medium, ML: Medium Large, L: Large)  76

شکل 3- 3: نمایش گرافیکی پارامترهای توابع عضویت پیشنهادی.. 77

شکل 3- 4: نمایش گرافیکی فضای جستجو برای یک مسئله چهار بعدی با سه بازه فازی.. 78

شکل 3- 5: کدگذاری پارامترهای متغیرهای ورودی و خروجی.. 79

شکل 3- 6:کدگذاری هر ذره شامل پارامترهای توابع عضویت و مجموعه قوانین.. 80

شکل 3- 7: فلوچارتPSO.. 83

شکل 3- 8: تابع Membership_and_Rule_Learn. 86

شکل 4- 1: توزیع مقادیر خصیصه‌های مختل مجموعه داده Pima. 93

شکل 4- 2: توزیع خصیصه اول 20 نمونه‌ی اول pima. 94

شکل 4- 3: تأثیر پارامتر SwarmSize  بر کارایی.. 95

شکل 4- 4: تأثیر پارامتر w بر کارایی.. 96

این مطلب رو هم توصیه می کنم بخونین:   پایان نامه : طراحی و پیاده سازی سیستم خبره برای پیش بینی الگوی ماندگاری مشتریان مطالعه موردی گروه صنایع غذایی سولیکو (کاله) – شرکت پخش و توزیع غذایی ارومیه

مقدمه

افزایش بهره گیری از کامپیوترها در فعالیت‌های کسب و کار، منجر به رشد سریع پایگاه‌های اطلاعاتی و اجتماع داده‌ها توسط بیشتر سازمان‌ها شده می باشد. روزانه حجم عظیمی از داده‌ها تولید شده و در پایگاه‌های مختلف داده ذخیره می گردد. در سال‌های اخیر تمایل به جستجو برای کشف الگوهای تکرار‌پذیر به مقصود بهبود در تصمیم گیری افزایش چشمگیری داشته می باشد. همچنین کاوش در داده‌های تراکنشی جهت یافتن الگوهای پنهان و تکنیک‌های کشف دانش به مقصود شناخت دقیق‌تر و بیشتر تراکنش‌ها، اهمیت بسزایی یافته می باشد. [1]. در حوزه پزشکی و سلامت با افزایش بهره گیری از سیستم‌های جامع درمانی و پرونده‌های الکترونیک بیمار در بیمارستان‌ها و مراکز درمانی حجم انبوهی از اطلاعات مربوط بیماران و انواع بیماری‌ها مهیا می گردد. [2]. استخراج دانایی از حجم عظیم داده‌های مرتبط با سوابق بیماری و پرونده‌های پزشکی افراد با بهره گیری از فرآیند داده‌کاوی می‌تواند منجر به شناسایی قوانین حاکم بر ایجاد، رشد و افت بیماری‌ها گردیده و اطلاعات ارزشمندی را به مقصود شناسایی علل وقوع بیماری‌ها با در نظر داشتن عوامل محیطی حاکم در اختیار متخصصین و دست اندر کاران حوزه سلامت قرار دهد؛ که این امر در نهایت منجر به افزایش متوسط طول عمر افراد جامعه و ایجاد آرامش می گردد. [3].

آن چیز که مسلم می باشد با افزایش سیستم‌های الکترونیک سلامت حجم داده‌های پزشکی هر روزه در حال افزایش می باشد. اما این مجموعه داده‌های بزرگ به گونه خام هیچ کاربردی ندارد برای آنکه بتوان از این داده‌ها ارزشی را استخراج نمود نیاز به تحلیل داده‌ها و تبدیل آن به اطلاعات و دانش، یک نیاز اساسی می باشد. با در نظر داشتن چنین حجمی از داده‌ها بهره گیری از عامل انسانی به عنوان تشخیص دهنده الگوها و تحلیلگر داده‌ها پاسخگو نمی‌باشد؛ پس داده کاوی روی داده‌های پزشکی از اهمیت بالایی برخوردار می باشد. داده‌کاوی را می‌توان از جنبه‌های مختلف در پیشگیری یا تشخیص انواع بیماری، انتخاب روش‌های درمان بیماری، مدت زمان بستری بیمار و … به کار برد.

1-2- اظهار مسأله

دیابت یکی از بیماری‌های رایج در جوامع امروزی می باشد که دارای عوارض خطرناکی می‌باشد. این بیماری اگر چه گونه‌ای از بیماری‌های قلبی محسوب نمی‌گردد اما اغلب سبب بیماری‌های قلبی می گردد.

تشخیص بیماری دیابت و یا آگاهی یافتن از احتمال بالای ابتلا به این بیماری همواره کار آسانی نخواهد بود. زیرا که این بیماری علائم متعددی را بروز می‌دهد که بعضی از این علائم در سایر بیماری‌ها نیز وجود دارند. پس پزشک برای اتخاذ یک تصمیم مناسب، بایستی نتیجه‌ی آزمایش‌های بیمار و تصمیم‌های که در گذشته برای بیماران با وضیعت مشابه گرفته می باشد، را مطالعه کند. با در نظر داشتن حجم انبوه تعداد بیماران، می‌توان از یک ابزار داده‌کاوی برای شناخت الگوی بیماران قبلی بهره گیری نمود.

در این پایان‌نامه با در نظر داشتن ماهیت مسأله از یک الگوریتم دسته‌بندی برای تشخیص بیماری دیابت بهره گیری می‌کنیم سپس آن‌را با سایر روش‌ها ارائه شده مقایسه می‌کنیم. روش دسته بندی یک روش یادگیری با نظارت می باشد که داده‌های ورودی به دو بخش داده‌های آموزش و داده‌های آزمون تقسیم می شوند. هر الگوریتم کاندید، آغاز با بهره گیری از مجموعه داده آموزش یک مدل را که نشان دهنده الگوی حاکم بر داده‌ها می‌باشد را استخراج می کند و سپس با بهره گیری از مجموعه آزمون دقت مدل ارائه شده برای دسته‌بندی را مطالعه می کند.

الگوریتم‌های متعددی برای دسته بندی ارائه شده‌اند که از آن دسته می‌توان؛ به شبکه‌های بیزین [4]، روش‌های مبتنی بر درخت [5]، الگوریتم ماشین بردار پشتیبان [6]، روش‌های مبتنی بر مجموعه فازی [7]، الگوریتم‌های فرا اکتشافی [8] و شبکه‌های عصبی [9] تصریح نمود.

در این نوشتار قصد داریم برای استخراج قوانین فازی از یک الگوریتم آموزش دیده مبتنی بر هوش جمعی، بهینه‌سازی ازدحام ذرات (PSO) بهره گیری کنیم. خاصیت اصلی الگوریتم‌های هوش جمعی تبادل اطلاعات بین ذرات می باشد که در یافتن حالت بهینه بسیار موثر می‌باشند.

کوشش شده با در نظر گرفتن نقاط اشکال و قوت روش‌های مختلف داده کاوی یک الگوریتم ترکیبی برای تشخیص بیماری ارائه گردد. الگوریتم شبکه عصبی معمولاً نرخ دسته بندی مناسبی را ارائه می‌دهد اما از شفافیت لازم برخوردار نیست. پس نمی‌توان این اطلاعات را توسط سیستم‌های خبره مطالعه نمود. برای حل این مسئله بایستی یک ارائه قابل فهم انسانی از دسته‌بندی ایجاد نمود. این هدف می‌تواند با استخراج قوانین فازی تولید شده که برای کاربر قابل فهم می باشد بدست بیاید.

دو معیار اصلی برای برازش الگوریتم‌های دسته‌بندی؛ نرخ دسته بندی و قابلیت تفسیر می‌باشد. نرخ دسته بندی اندازه دقت کار الگوریتم در دسته بندی نمونه‌های آزمون را نشان می‌دهد و قابلیت تفسیر به معنی اندازه سادگی و قابلیت توسعه روش دسته بندی می‌باشد.

در سال‌های اخیر قوانین فازی از آن جهت که هم دقت مناسبی دارند وهم قابلیت تفسیر مناسبی را ارائه می‌دهند بیشتر مورد توجه قرار گرفته‌اند. یک الگوریتم فازی از آن جهت مورد توجه می‌باشد که شامل مجموعه‌ای از قوانین اگر-آنگاه فازی می گردد که تفسیر آن‌ها توسط بشر خبره امکان پذیر می باشد. مسئله اساسی در چنین سیستم‌هایی انتخاب مجموعه‌ای از قوانین فازی بهینه می باشد؛ پس این مسئله را می‌توان نوعی از بهینه سازی ترکیبی در نظر گرفت که با رشد ابعاد مسئله دسته بندی، تعداد جواب‌های بهینه محلی نیز به صورت نمایی افزایش می‌یابد و الگوریتم کاندید برای حل آن بایستی مجموعه‌ای از جواب‌های بهینه یا نزدیک به بهینه را ارائه دهد [10].

روش‌های مختلفی برای استخراج قوانین از مجموعه داده هست ازجمله آن‌ها می‌توان به روش‌های مبتنی بر شبکه‌های عصبی [11] و روش‌های مبتنی بر خوشه‌بندی [12] تصریح نمود. با در نظر داشتن قابلیت‌های روش‌های فرا اکتشافی برای پوشش فضای جستجو، این الگوریتم‌ها برای استخراج قوانین می‌توانند یک گزینه مناسب باشند. این روش‌ها با ایجاد یک راه حل اولیه در فضای جستجو آغاز می شوند و سپس به وسیله یک مجموعه قواعد جستجوی بهینه شروع می گردد. در هر مرحله از الگوریتم جستجو همواره یک راه حل یا یک مجموعه از راه حل‌ها وجود دارند که وضعیت فعلی الگوریتم را نشان می‌دهند. بعضی از روش‌های اکتشافی، روش‌های راه حل به راه حل هستند یعنی در فضای جستجوی مسئله از طریق یک راه حل به راه حل دیگر دست می‌یابند. بقیه روش‌ها بر پایه مجموعه می‌باشند که با اعمال تغییراتی در مجموعه فعلی به مجموعه جدید می‌رسیم. برای بهره گیری از روش‌های مکاشفه‌ای در برنامه‌های داده کاوی بایستی آن‌ها را با یک روش محلی ادغام کنیم. این روش‌های محلی، استراتژی کلی روش‌های مکاشفه‌ای را هدایت می‌کنند.

تعداد صفحه : 124

قیمت : 14700 تومان

بلافاصله پس از پرداخت لینک دانلود فایل در اختیار شما قرار می گیرد

و در ضمن فایل خریداری شده به ایمیل شما ارسال می گردد.

پشتیبانی سایت :        ****       [email protected]

در صورتی که مشکلی با پرداخت آنلاین دارید می توانید مبلغ مورد نظر برای هر فایل را کارت به کارت کرده و فایل درخواستی و اطلاعات واریز را به ایمیل ما ارسال کنید تا فایل را از طریق ایمیل دریافت کنید.

***  **** ***