dn=sqrt(sum((V-repmat(AN,r,1)).^2,2));
cl=(dp+dn);
cl=dn./cl;
rawRank=cl;
=sort(cl);
end
۴-۳ نمونه شبیهسازی مدل پیشنهادی
در زیر یک مثال از اجرای برنامه آورده شده که به ازای یک پرسوجوی مشخص بازخوردهای ذکر شده در بالا را برای ۱۰ سایت اول از ۱۰۰۰ کاربر گرفته و سایتها را رتبهبندی کرده و در یک فاصله زمانی مشخص و با بهره گرفتن از بازخوردهای بعدی این رتبهبندیها را به روز میکند.
(( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. ))
شکل ۴-۱۱۴: نمونهای از شبیهسازی مدل پیشنهادی
فصل پنجم
نتیجه گیری
۵-۱ بحث و نتیجه گیری
امروزه رشد روز افزون وب موجب بروز چالشهای جدی برای سیستمهای بازیابی اطلاعات در محیط وب گردیده است. از این رو، ارائه روشهایی به منظور تسریع و هدفمند کردن جستجوی اطلاعات در این محیط، مورد توجه محققان مختلف، قرار گرفته است. از طرفی، ناهمگون بودن اطلاعات در این محیط، موجب هر چه پیچیدهتر شدن بازیابی اطلاعات در وب شده است.
مهمترین ابزار برای جستجو در این اقیانوس بی کران اطلاعات، موتورهای جستجو میباشند که یکی از اصلیترین بخشهای آن رتبهبندی نتایج در پاسخ به پرسوجوی کاربر است. رتبهبندی فرآیندی است که کیفیت یک صفحه توسط موتور جستجو تخمین زده میشود. هدف از این تحقیق بررسی روشها و الگوریتمهای موجود در بحث رتبهبندی صفحات وب در موتورهای جستجو و تشریح نقاط قوت و ضعف یا به عبارتی چالشهای موجود در هر یک از روشها و الگوریتمها بوده است. هم چنین، برخی از راه حلهای ممکن برای مشکلات عنوان شده، که توسط محققین این حوزه به شکل مقاله و ژورنال در مراجع معتبر و بینالمللی در دسترس هستند، معرفی شدند.
موتورهای جستجو نتایج جستجو را بدون توجه به علایق یا زمینه کاری کاربر ارائه میدهند. بر همین اساس کاربران هنگام استفاده از موتورهای جستجو اغلب با نتایجی مواجه میشوند که ممکن است مورد علاقه آنها نباشند و مسئله مهم دیگر اینکه اکثر موتورهای جستجو از الگوریتمهایی به منظور جستجو استفاده میکنند که فقط به تعداد لینکهای ورودی و خروجی یک وب سایت نگاه میکنند مانند پیجرنک، بنابراین الگوی رفتاری کاربر در رتبهبندی نقش مهمی را ایفا میکند.
در این کار روشی برای رتبهبندی اسناد وب با استفاده همزمان از پنج مورد از بازخوردهای مثبت و منفی کاربران شامل (open click, dwelltime, download, plus click, negative click) بر روی لیست نتایج وب ارائه دادیم که در این مدل پیشنهادی از یکی از مدلهای تصمیمگیری چند شاخصه به نام TOPSIS برای رتبهبندی استفاده میکنیم. فرض این روش بر این است که مطلوبیت برای هر یک از شاخصها به طور یکنواخت افزایشی یا (کاهشی) است. بعلاوه این روش به دلیل ماهیت توأم دو فاصله از گزینه ایدهآل مثبت و ایدهآل منفی روش مناسبی برای اولویت بندی صفحات محسوب میشود. یکی از مهمترین مزایت های روش پیشنهادی در مقایسه با روشهای مشابه تصمیمگیری چند شاخصه این است که در صورتی که بعضی از معیارهای تصمیمگیری مثبت و هدف افزایش آنها باشد و بعضی از معیارها منفی و هدف کاهش آنها باشد، این روش به آسانی جواب ایدهآل را که ترکیبی از بهترین مقادیر دستیابی همه معیارها است پیدا میکند، و در نهایت یک رتبهبندی بر روی اسناد انجام میدهد. در واقع نوآوری این مدل در این است که به طور همزمان از تعداد زیادی از بازخوردهای کاربران برای رتبهبندی استفاده میکند. که در میان این بازخوردها زمان که یکی از روشهای جدید شناخته شده از انواع فیدبک های ضمنی کاربران میباشد و محققان معتقد هستند که برای تعداد ثابتی از کاربران در یک جلسه پرس وجو مشخص، زمان توجه کاملاً نشانگر علاقه کاربر میباشد. و هر چه قدر کاربر زمان بیشتری را صرف مطالعه یک سند میکند، آن سند برای وی با اهمیتتر خواهد بود، نیز در نظر گرفته شده است.
۵-۲ مزایای روش پیشنهادی
یکی از مهمترین مزیتهای این روش این است که معیارها یا شاخصهای به کار رفته برای مقایسه میتوانند دارای واحدهای سنجش متفاوتی بوده و طبیعت منفی یا مثبت داشته باشند. به عبارتی میتوان از شاخصهای منفی و مثبت به شکل ترکیبی در این تکنیک استفاده نمود. بر اساس این روش بهترین گزینه یا راه حل نزدیکترین گزینه به راه حل یا گزینه ایدهآل است. به طور خلاصه راه حل ایدهآل از مجموعه مقادیر حداکثر هر یک از معیارها به دست میآید، در حالی که راه حل غیر ایدهآل از مجموعه پایینترین مقادیر هر یک از معیارها حاصل میگردد.
این روش به سادگی و با سرعت مناسب اعمال میگردد، و به دلیل کاهش حجم محاسبات در ارزیابی تعداد زیادی گزینه بهره گرفته میشود.
تعداد قابل توجهی معیار را میتوان در نظر گرفت.
از آنجایی که روش TOPSIS جزء روشهای جبرانی است اجازه مبادله در بین شاخصها در آنها مجاز است، یعنی مثلاً تغییری در یک شاخص میتواند توسط تغییری مخالف در شاخص یا شاخصهای دیگر جبران شود.
اطلاعات ورودی را میتوان تغییر داد و نحوه پاسخگویی را بر اساس این تغییرات بررسی کرد.
۵-۳ کارهای آینده
با توجه به مطالعه و تحقیق انجام شده به این نتیجه رسیدیم که علیرغم اینکه استفاده از رفتار کاربر در رتبهبندی در سالهای اخیر مورد توجه واقع شده است و روشهایی نیز برای آن ارائه گردیده است، اما همچنان فضا برای پژوهش جدید خصوصاً با بهره گرفتن از روشهای رفتاری وجود دارد. همچنین شخصی سازی با توجه به رفتار گذشتهی کاربران از مواردی است که هنوز به طور کامل حل نشده است و به تأمل و بررسی بیشتری نیاز دارد. از کارهای آینده تهیه و استفاده از دادههای واقعی در این روش و همینطور بررسی روشهای ترکیبی دیگر است. همینطور برای رتبهبندی بهتر صفحات وب میتوانیم در این روش پیشنهادی میتوانیم الگوریتم TOPSIS فازی را نیز استفاده کنیم.
فهرست منابع
[۱] Baeza-Yates R, and Ribeiro-Neto B. Modern Information Retrieval. ACM Press / Addison-Wesley, 2005.
[۲] Bharat K, Henzinger MR. Improved algorithms for topic distillation in a hyperlinked environment. In Proceedings of the 21st Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, Melbourne, Australia, August 2006. pp:104-111.
[۳] Kleinberg M. Authoritative sources in a hyperlinked environment. Journal of the ACM, Vol. 46 No. 5, September 1999. pp:604–۶۳۲٫
[۴] Kent P. Search Engine Optimization for dummies. John Wiley & Sons Inc. 2008.
[۵] Keyhanipour AH, Moshiri B, Piroozmand M, Lucas C. Aggregation of Multiple Search Engines Based on Users’ Preferences in WebFusion. Elsevier Journal of Knowledge-Based Systems, Vol. 20, No. 4, May 2007. pp:321–۳۲۸٫
[۶] Liu TY, Qin T, Xu J, Xiong W, Li H. LETOR: Benchmark dataset for research on learning to rank for information retrieval. In SIGIR Workshop on Learning to Rank for Information Retrieval, 2007.
[۷] Castillo C. Effective Web Crawling, Ph.D. Thesis, University of Chile, Nov2004.
[۸] Baeza-Yates R. Challenges in the interaction of information retrieval and natural language processing. In Proceedings of 5th international conference on Computational Linguistics and Intelligent Text Processing (CICLing), Lecture Notes in Computer Science Springer, Vol. 2945, February 2004. pp:445–۴۵۶٫
[۹] Tomasic A, Garcia-Molina H. Performance of inverted indices in sharednothing distributed text document informatioon retrieval systems. In Proceedings of the second international conference on Parallel and distributed information systems,IEEE Computer Society Press,1993. pp: 8–۱۷٫
[۱۰] Moussea V. Figueria J. Gomes silv C. Resolving Inconsistencies Among Constraints on the parameters of MCDA model” , European jornal of operational research. Volume 147, 2006. pp: 72-93.
[۱۱] Zhang Y, Chen W, Wang D, Yang Q. User-click modeling for understanding and predicting search-behavior. In Proceedings of the 17th ACM SIGKDD international conference on Knowledge discovery and data mining (KDD’11). ACM, New York, NY, USA, August 2011. pp: 1388-1396.
[۱۲] Zhao D, Zhang M, Zhang D. A Search Ranking Algorithm Based on UserPreferences. Journal of Computational Information Systems, November 2012. pp: 8969-8976.
[۱۳] Attenberg J, Pandey S, Suel T. Modeling and predicting user behavior in sponsored search. In Proceedings of the 15th ACM SIGKDD international conference on Knowledge discovery and data mining (KDD ‘09). ACM, New York, NY, USA,2009. pp:1067-1076.
[۱۴] Yu J, Lu Y, Sun S, Zhang F. Search Results Evaluation Based on User Behavior. Springer-
analysis of dwell time. In Proceedings of the 33rd international ACM SIGIR conference on Research and development in information retrieval (SIGIR ‘10). ACM, New York, NY, USA,2010. pp: 386-379.
[۱۷] Yang C, Liu C, Shao-chieh H, A Hybrid Item-Based Recommendation Ranking Algorithm Based on User Access Patterns. Springer-Verlag Berlin Heidelberg, vol. 163,2013. pp: 233-225.
[۱۸] Guo F, Liu C, Wang Y. Efficient Multiple-Click Models in Web Search. The definitive version will appear in WSDM ’۰۹: Proceedings of the second ACM international conference on web search and data mining. 2008 ACM.
[۱۹] Salton G, Buckley C. Term-weighting approaches in automatic text retrieval. Information Processing and Management: an International Journal, Vol. 24 No.5,1988. pp:513–۵۲۳٫
[۲۰] Salton G. The SMART retrieval system - experiments in automatic document processing. Prentice-Hall, 1971.