برای نمایش این رویدادها از روابط شیگرا استفاده میکنیم یعنی کلاسها را اضافه میکنیم که حاصل ترکیب این دو روش مدلداده شی رابطهای است.که در این پروژه از نام EAV/CR استفاده میکنیم. در شکل زیر پیاده سازی یک EAV/CR ساده را نمایش میدهیم.
(( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. ))
شکل(۳-۲) : یک پیاده سازی ساده از EAV/CR
اما در این پایگاهداده روابط بین افراد و موجودیت ها به خوبی پشتیبانی نمی شود.یعنی برای متوجه شدن مسیر بین بیماری باید پرس و جوهای بازگشتی بنویسیم که این کار زمان بر است.
۳-۴-مدل داده گرافی برای بیماری های همه گیری
از این مدلداده برای ذخیره داده های مربوط به بیماری های همه گیری استفاده شده است . بیماریهای همهگیری یعنی انتشار یک بیماری یا یک ویروس در بین یک جامعه که این می تواند شامل جامعه انسان ها، حیوانات یا حتی بروز ویروس در سیستمهای کامپیوتری باشد. برای ذخیره این داده ها از پایگاهداده گرافی استفاده مینماییم. موجودیت انسان را به چهار وضعیت سالم، ظاهر شده، آلوده و بهبود یافته ذخیره میکنیم و برای هر موجودیت علاوه بر مشخصات عمومی بیمار باید زمان ورود به هر یک از این وضعیت ها مشخص شود. زمان ورود یعنی زمان بروز اولین علایم بیماری(ETime)،زمان شروع انتشار و پخش بیماری(ITime)و زمان بهبود (Rtime) . علاوه بر این ها باید فرد انتقال دهنده بیماری را نیز مشخص کرد]۶[.
در پایگاهداده گراف در موجودیت ها مشخصات بیماری و زمان ورود را ذخیره میکنیم و فرد انتقال دهنده بیماری را به وسیله ی یک یال جهت دار مشخص می کنیم.این مدل در مقایسه با مدل رابطه ای کارایی بهتری در مورد روابط بین افراد و پرس و جوها دارد.
شکل (۳-۳) :پیاده سازی بیماری همه گیری با پایگاه داده گرافی
فصل چهارم: روش پیشنهادی
۴-۱-مقدمه
بدن انسانها از تریلیون سلول تشکیل شده و هر سلول دارای یک هسته میباشد.هسته سلولها از تعداد ۴۶ کروموزوم یا۲۳جفت کروموزوم تشکیل شده است.کروموزومها دارای رشته های در هم پیچیدهای به نامDNA هستند که اینDNA ها شامل ژنها هستند.هر سلول بدن انسانها شامل۲۵۰۰۰تا۳۵۰۰۰ژن است.ژنها دارای اطلاعاتی هستند که این اطلاعات ویژگیهای انسان را می سازد.
توالی ژنهای مربوط به بیماریها در بدن انسانهای نرمال به یک شکل است و بیماری زمانی اتفاق می افتد که در این توالی تغییری ایجاد شود. بیماری های ژنتیکی به ۳دسته تقسیم می شوند: بیماریهای تک ژنی، بیماری های چند ژنی یا چند عاملی، بیماریهای میتوکندریایی.
بیماریهای تک ژنی بیماریهایی هستند که از والدین بیمار یا ناقل به فرزندان انتقال مییابند و فرزندان از بدو تولد دچار این بیماری هستند فقط سن بروز آنها در بدن متفاوت میباشد.مانند تالاسمی
بیماری های چند ژنی بیماریهایی هستند که ژن در اثر تغییرات محیطی دچار مشکل می شود و بیماری در بدن فرد بروز می کند. مانند سرطانها که در ابتلا به آنها عادات غذایی و عادات زندگی مانند سیگار کشیدن نقش مهمی دارند.بیماریهای میتوکندریایی بیماریهایی هستند که تنها از مادر به فرزند انتقال میابد و پدر نقش انتقال دهنده را نخواهد داشت.
به عنوان مثالهایی از بیماریهای ژنتیکی می توان از زالی،سرطان های پوست،سیستیکفیبروز،
عقب افتادگیذهنی، کم خونی داسی شکل، فنیل کتونوری، تالاسمی و … نام برد.
برخی از مواردی که بررسیهای ژنتیکی انجام میپذیرد به شرح ذیل است:
-
- زوجی که قصد تشکیل خانواده دارند و یکی از آنها یا یکی از خویشان نزدیک او دچار بیماری ارثی است.
-
- فردی که فرزندی با یک نقص مادرزادی حاد دارد.
-
- کودکی با یک مشکل جسمی که میتواند ژنتیکی باشد.
برای انجام این تستهای ژنتیکی در وهله اول نیاز به داشتن شجرهنامه زوجین در هنگام تشکیل خوانواده، والدین در هنگام تستهای بارداری و بیمار در هنگام بررسی یک بیمار ژنتیکی داریم. پس از دانستن شجرهنامه در هنگام برخورد با بیماریها نیاز به ذخیره اطلاعاتی درباره بیمار داریم. فرمت داده های مورد نیاز برای ذخیره به شرح ذیل می باشد:
خصوصیات عمومی بیمار،وضعیت عمومی بدن بیمار،تاریخچه بیمار مانند علائم بیماری،زمان متوجه شدن اولین علائم بیماری،سابقه ابتلا به بیماری،درمان های گذشته در صورت ابتلای قبلی،مدت ابتلا،گزارش جراحی قبلی،اطرافیان بیمار که مبتلا به این بیماری بوده اند، گزارشات کنونی پزشک، خدمات تصویر برداری، گزارش آزمایشگاه، خدمات بافتشناسی، گزارشات کاردرمانی، توالی نوکلئوتید (ژن) مربوط به بیماری و یک نسخه ژن متعادل.
حال برای ذخیره داده های مربوط به بیماریهای ژنتیکی نیاز به پایگاه دادهای داریم که با توجه به تنوع دادههایی که باید ذخیره شوند، علاوه بر ذخیره این داده ها به بررسی و تجزیه تحلیل این داده ها بپردازد. یکی از مسایل مهم برای انتخاب پایگاه داده این است که در مورد داده های پزشکی برای هر بیمار داده های متفاوت از دیگر بیماران ذخیره کنیم، به این دلیل بهتر است از ابتدا یک طرح کلی برای پایگاه داده طراحی نشود. با توجه به این موضوع به این نتیجه میرسیم که از پایگاه داده های SQLنمیتوانیم استفاده کنیم و پایگاه داده های NOSQLبرای این امر مناسب تر هستند.
با توجه به نیاز به ژنتیک اعضای خانواده و نسلهای قبل بیمار باید توانایی افزودن موجودیتها(نسل های قبل و بعد)ی جدید را در حین انجام تحقیقات به این پایگاه داده داشته باشیم. در مورد انتقال بیماریها تشخیص مسیر انتقال بیماری اهمیت ویژهای دارد. به این دلیل باید پایگاه دادهای طراحی کنیم که قابلیت استخراج روابط بین موجودیتها را دارا باشد. البته روابط بین موجودیت ها در پایگاه داده های رابطهای نیز قابل استخراج است اما اولا به دلیل نیاز به نوشتن رویههای تو در تو امر بسیار پیچیده و زمان بر است ثانیا در مدل داده گراف میتوانیم بر روی یالها نیز خصوصیاتی را برای ارتباط موجودیتها تعریف کنیم. با توجه به این سه مسئله به این نتیجه میرسیم پایگاه داده گرافی بهترین انتخاب برای این نوع بیماری ها است.
در این پایان نامه با بهره گرفتن از مدل داده گراف پایگاه داده ای را طراحی خواهیم کرد که توانایی ذخیره انواع و حجمهای مختلف داده را داشته باشد زیرا در مورد داده های پزشکی مجبور به ذخیره تصویر،صوت، کاراکتر و … میباشیم.پایگاه داده طراحی شده باید بتواند به سوالات مطرح شده در زمینه انتقال بیماری های ژنتیکی پاسخ دهد.
در این پایگاه داده موجودیت ها که همان افراد هستند درون گرهها ذخیره میشوند،در گره ها علاوه بر مشخصات عمومی بیماران تمام اطلاعات مربوط به بیماری افراد،شرایط و علائم بیماران نیز ذخیره میشوند. در سطوح بعدی گراف نسلهای بالاتر بیماران،همراه با اطلاعات مربوط به بیماری مخصوصی که در حال تحقیق در مورد آن هستند ذخیره خواهد شد.برای نمایش روابط بین افراد در این مدل داده از یالها استفاده خواهیم کرد.به این صورت که اگر بیماری از شخصی به شخص دیگری انتقال یافت از یال از جهت منتقل کننده به منتقل شونده برای نمایش این انتقال استفاده خواهیم کرد. علاوه بر اینها میتوانیم بر روی یال ها توضیحاتی را نیز اضافه نمائیم.توضیحاتی مانند درصد احتمال انتقال یک بیماری خاص از یک فرد به فرد دیگر.
به دلیل اینکه در مورد بیماریهای ژنتیکی در یک خانواده،علاوه بر افراد بیمار افراد سالم نیز باید ذخیره شوند،در این نمودار موجودیت انسان را به چهار حالت در نظر میگیریم:حالتی که انسان بیمار باشد،سالم باشد،سالم باشد اما ناقل بیماری باشد که در خصوص بیماری های ژنتیکی بعضی از انسان ها بیمار نیستند بلکه حامل ژن بیمار هستند و این افراد در صورتی بیماری را انتقال می دهند که با فرد حامل دیگری ارتباط داشته باشند،یا انسانی باشد که این بیماری را در بدن وی کنترل کرده باشند.
در ادامه موجودیت ها و صفات مربوط به هر موجودیت به طور جداگانه مطرح می شود.
۴-۲-موجودیت ها
۱-انسان
۲-پزشک
۳-بیماری
۴-علایم
۵- درمان
۶-دارو
۴-۳-صفات مربوط به هر یک از موجودیت ها
در بررسی انسان به ۴ وضعیت میرسیم:انسان سالم،انسانی که تحت درمان قرار گرفته،انسان بیمار انسان سالم اما ناقل، که برای هر یک از این حالات صفات زیر ذخیره می شود:
۴-۳-۱-انسان سالم
مشخصات عمومی انسان مانند
نام نام خانوادگی
تاریخ تولد
محل تولد
کد ملی
شماره شناسنامه
شماره بیمه
جنسیت
۴-۳-۲-انسان ناقل
مشخصات عمومی فرد