الگوریتم UPDATE با ورودیهای (C,W)
-
- به ازای انجام بده
-
- پایان حلقه اول
-
- تا زمانیکه ادامه بده
-
- اگر آنگاه
-
- حالا از میان جفتهای باقیمانده، جفت بعدی که دارای بیشترین امتیاز است را انتخاب کن
-
- پایان شرط اول
-
- اگر آنگاه
-
- بازگرداندن W در خروجی
-
- پایان شرط دوم
-
- در ، را با جایگزین کن
-
- پایان حلقه دوم
-
- بازگرداندن Wدر خروجی
شکل۳-۸: الگوریتم بروز رسانی
۳-۳.جمعبندی
در این فصل الگوریتمهای یادگیری مناسب برای ارزیابی تشخیص مرجع مشترک در این پایان نامه مورد بررسی قرار گرفت، این روشها شامل روشهای ردهبندی پرسپترون، ماشین بردار پشتیبان، درخت تصمیم C5 و خوشهبندی سلسله مراتبی میباشند.
(( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. ))
فصل چهارم
سیستم ارزیابی
« شناسایی اشاره و تشخیص اشارههای هممرجع »
۴-۱.مقدمه
امروزه اغلب پژوهشگران، فرایند تشخیص مرجع مشترک را به دو مرحله تقسیم میکنند؛ (۱) کشف اشاره؛ برای شناسایی عبارتهای اسمی که به موجودیتها در دنیای واقعی اشاره دارند، (۲) شناسایی اشارههای که به یک مرجع واحد اشاره دارند. از آنجائیکه ما نیز از این رویکرد پیروی میکنیم، در این فصل، این دو فرایند را در قالب چارچوبی شامل سیستم ارزیابی معرفی مینمائیم. در بخش اول، برای فرایند مهم کشف اشاره سیستمی معرفی میکنیم که میتواند اشارههای موجود در پیکره لوتوس را شناسایی کرده و علاوه بر نمایش ویژگیهای مهم هر اشاره، محدوده و هسته هر اشاره را نیز شناسایی و ذخیره نماید. در بخش دوم نیز با به کارگیری الگوریتمهای گفته شده در فصل سوم، به تحلیل جفت اشارههای هممرجع در پیکره میپردازیم.
۴-۲. سیستم شناسایی اشاره لوتوس
این سیستم، سه رکن اساسی دارد؛ پیکره ورودی، بانک اطلاعاتی و برنامه کاربردی. ورودی این سیستم پیکرهی نشانهگذاری شده لوتوس میباشد که ویژگیهای آن در فصل دوم معرفی شدند. در ادامه به معرفی مختصری از بانک اطلاعاتی لوتوس و سیستم شناسایی اشارهها میپردازیم.
۴-۲-۱. بانک اطلاعاتی
با پیروی از سیستم ارائه شده توسط [۴۰]، ما نیز رویکرد تبدیل پیکره، به اطلاعات ساختار یافته بانک اطلاعاتی را دنبال میکنیم، با این تفاوت که مبنای کار ما استخراج اطلاعاتِ مربوط به اشارههای موجود در پیکره میباشد. به همین منظور بانک اطلاعاتی سیستم پایه لوتوس را طراحی نمودیم، این بانک اطلاعاتی شامل جداولی است که تمام چهار گروه موجودیتهای گفته شده در فصل قبل را پوشش میدهد و به گونهای طراحی شده است تا بتواند نقش فرهنگ جغرافیایی[۲۱۳] را نیز ایفا نموده و به شبکه واژگان نیز مرتبط گردد. در جدول ۴-۱، یک شمای کلی از جداول این بانک اطلاعاتی نمایش داده شده است.
همانطور که گفته شد، در سیستم شناسایی اشاره با در نظر گرفتن یک سری قوانین و اولویتها، اشارهها و اطلاعات مربوط به آنها را از پیکره استخراج شده و در بانک اطلاعاتی ذخیره میشوند. سیستم شناسایی اشاره ارائه شده دراین پایان نامه، به موازات ذخیره اطلاعات اشارهها در جدول مربوط به اشارهها، تمامی واژههای موجود در متن را نیز به جدول واژگان منتقل مینماید. ویژگیهای جدول واژگان در جدول ۴-۱ مشاهده میشود.
شکل۴-۱: شمای کلی از جداول این بانک اطلاعاتی لوتوس
جدول ۴-۱: بانک اطلاعاتی سیستم کشف اشاره؛ جدول واژگان
Word_Table