توضیحات
- خوشه بندی مقید
مقدمه ای بر خوشه بندی
ارزیابی خوشه بندی
خوشه بندی مقید
چالشها و راهکارها
پژوهش های انجام شده
- خوشه بندی مقید
- Rag bag
- در برخی مسایل دسته ای به نام «متفرقه» داریم که شامل داده هایی است که نمی توانند با داده های دیگر کلاسها هم خوشه شوند.
- جریمه انتساب این نوع داده ها به یک خوشه خالص بیشتر از انتساب آنها به خوشه متفرقه است .
- یادگیری معیار فاصله به عنوان محبوبترین روش خوشهبندی مقید
- معیار فاصله اقلیدسی به عنوان معیار فاصله متداول در فرایند خوشهبندی
- ناکارامدی معیار فاصله اقلیدسی در توصیف صحیح فاصله در یک مجموعه داده نوعی
- معیار فاصله ماهالانوبیس بسیار مورد توجه قرار گرفته است
چالشهای موجود در خوشهبندی مقید
- مجموعه قیدهای متفاوت سودمندی متفاوتی برای الگوریتمهای خوشهبندی دارند
- قیدهایی که الگوریتم خوشهبندی به خودی خود قادر به استخراج آن از دادهها باشد، تاثیر چندانی بر بهبود دقت خوشهبندی نخواهد داشت
- تعیین سودمندی یک مجموعه قید قبل از خوشهبندی
- به الگوریتم خوشهبندی این قابلیت را میدهد که تصمیم بگیرد که آیا از یک مجموعه قید در راستای خوشهبندی استفاده نماید یا خیر.
- انتخاب بهترین مجموعه قید ممکن.
- از ۱۰۰۰ بار انتخاب تصادفی مجموعه قیدهای ۲۵ تایی، درصد مواردی که سبب کاهش دقت خوشهبندی در چند الگوریتم شده است. (جدول از [Davidson06])
- وشه بندیخوشه بندیگروه بندی داده ها به گونه ای که خصوصیات مشترک بین داده های هر گروه زیاد و خصوصیات مشترک بین گروه های متفاوت کم باشد.سوال ۱: خصوصیات مشترک؟ چگونگی تشخیص خصوصیات؟طیف وسیع کاربرد
یادگیری ماشین، هوش مصنوعی، الگوشناسی، وب کاوی، تحلیل پایگاه داده، پردازش متون و تصاویر، علوم پزشکی، علوم اجتماعی، اقتصاد و تجارت، علوم کامپیوتر، پزشکی
خوشه بندی به عنوان یک مساله مشکل
مهم ترین دلایل مشکل بودن مساله:
ذات بدون ناظر بودن الگوریتم های خوشه بندی
ابهام در تعریف خوشه مناسب
مشکل بودن تعریف معیار فاصله مناسب
تعریف تابع هدف مناسب به منظور خوشه بندی
عدم وجود الگوریتم جامع برای حل همه مسائل خوشه بندی
۴
روشهای خوشه بندی (دسته بندی)
سلسله مراتبی
(BRICH)
و……..