۱
x2
۱
۱
۱
۲
x3
۲
۱
۲
۲
x4
۳
۳
۳
۳
x5
۳
۳
۴
۳
x6
خوشهبندی نهایی نیز به عنوان نتیجه در سمت راست ترین ستون جدول ۱-۱ آورده شده است. همانطور که در جدول نیز مشخص است شماره خوشهای که هر داده در خوشهبندی نهایی در آن قرار میگیرد مطابق با شماره خوشه اکثریت در خوشهبندیهای اولیه میباشد. در این مثال، خوشهبندی توافقی با بهره گرفتن از رأی گیری بدست میآید.
خوشهبندی توافقی نیز مانند دیگر روشهای خوشهبندی، یک مسئله بهینه سازی محسوب میشود به طوری که میخواهیم تعداد عدم توافقها کمینه شود. همچنین لازم به ذکر است که مسائل خوشهبندی از نوع مسائل NP-کامل[۳۷] هستند.
یکی از کاربردهای خوشهبندی توافقی زمانی است که دادههای اصلی جهت انجام خوشهبندی در دسترس نمیباشند، اما خوشهبندی های مجزایی از دادههای اصلی وجود دارد. این شرایط زمانی رخ میدهد که [۲]:
دادهها در منابعی اختصاصی قرار دارند و صاحبان داده نتایج خوشهبندی را ارائه داده اند اما دادههای اصلی در اختیار خودشان است.
دادههای اصلی مفقود و یا دور انداخته شده اند، اما خوشههای دادهای وجود دارند.
تمام دادههای اصلی در دسترس هستند، اما ممکن است برای ذخیره شدن در یک سایت محاسباتی، بسیار بزرگ باشند. در این حالت ساختن خوشهبندیهای مجزا از قسمتهای مختلف داده و سپس ترکیب آنها میتواند روش مناسبی باشد.
(( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. ))
چنانچه بخواهیم دانشی جدیدی را به سیستم یادگیری وارد کنیم و یا از اطلاعات قبلی استفاده مجدد نماییم، میتوانیم خوشهبندیهای جدید را بدون نیاز به دانستن اطلاعاتی که برای خوشهبندیهای قبلی استفاده شده است و یا چگونگی ایجاد آنها، با خوشهبندیهای قبلی ترکیب کنیم.
الگوریتمهای خوشهبندی توافقی دارای مزایایی بیش از دیگر الگوریتمهای خوشهبندی میباشند. این الگوریتمها اغلب : خوشه بندی بهتری تولید میکنند؛ خوشه بندی ترکیب شدهای را مییابند که به تنهایی توسط هر الگوریتم خوشه بندی دیگری قابل تولید نمیباشد؛ حساسیت کمتری نسبت به نویز دارند؛ و قادر به یکپارچه سازی نتایج از منابع توزیع شده میباشند [۵۷]. همچنین روشهای خوشهبندی توافقی کاربردهای مختلفی در مسائل گوناگون مرتبط با خوشهبندی دارند: ۱) خوشهبندی دادههای اسمی[۳۸] و مدیریت مقادیر ناقص[۳۹] در خوشهبندی، ۲) خوشهبندی دادههای ناهمگن[۴۰]، در حالتی که چندتاییها دارای صفات خاصهای هستند که قابل مقایسه نمیباشند، ۳) تشخیص تعداد مناسب خوشهها و همچنین تشخیص دادههای دور افتاده، ۴) فراهم نمودن روشی جهت افزایش کیفیت خوشهبندی با بهره گرفتن از ترکیب نتایج چند الگوریتم خوشهبندی و ۵) خوشهبندی دادههایی که به صورت توزیع شده اند[۲۳].
چگونگی تولید خوشهبندیهای اولیه و همچنین روشهای ترکیب آنها در شکل ۳-۱ نشان داده شده است. جهت تولید خوشهبندیهای اولیه از یک مجموعه دادهای مشخص میتوان: الگوریتمهای خوشهبندی مختلفی را بر روی دادهها اعمال نمود؛ یک الگوریتم را چندین بار با پارامترهای اولیه متفاوت بکار برد؛ و یا دادهها را به صورت افقی (سطرها) و یا عمودی (ستونها) به قسمتهای مختلف تقسیم کرده و سپس هر قسمت را خوشهبندی نمود. برخی از روشهای ترکیب خوشهبندیهای اولیه نیز عبارتند از: روشهای همبستگی[۴۱]، روش رأی گیری، روشهای تئوری اطلاعات و مدل ترکیبی [۵۳].
شکل ۱-۳ رویکردهای مختلف ترکیب خوشهبندیها؛ سمت چپ: روشهای تولید خوشهبندیهای اولیه؛ سمت راست: روشهای ترکیب خوشهبندیهای اولیه و یافتن یک خوشهبندی نهایی [۱۵].
الگوریتمهای مختلف
مقداردهیهای اولیه متفاوت برای یک الگوریتم
زیر مجموعههای مختلف از اشیاء دادهای
زیر مجموعههای مختلف از صفات خاصه
همبستگی
رأی گیری
تئوری اطلاعات