Support
Confidence
مورد استفاده=بارکش، سیستم = نیسان
خسارتی
۶%
۳۸%
تخفیف عدم خسارت کمتر از ۱. ۵میلیون ریال، نوع وسیله نقلیه=سواری، سال ساخت بیشتر از ۱۳۸۶
خسارتی
۴۷%
۴۰%
۳-۱۱-معیارهای ارزیابی الگوریتمهای خوشه بندی
ارزیابهای الگوریتمهای خوشه بندی به دو دسته تقسیم می شوند. یک دسته شاخص های بدون ناظر یا داخلی هستند که کیفیت عملیات خوشه بندی را با توجه به اطلاعات موجود در مجموعه داده تعیین می نماید. دسته دیگر که با ناظر یا خارجی نامیده می شود، با توجه به اطلاعاتی خارج از مجموعه داده های مورد بررسی، عملکرد الگوریتم خوشه بندی را موردبررسی قرار می دهد. در این پژوهش از یک معیار بدون ناظر استفاده شده است. این معیار Average Silhouette Coefficient که به اختصار ASC نام دارد.
همانطور که میدانیم وظیفه یک الگوریتم خوشه بندی کمینه کردن فاصله درون خوشه ای یا تراکم (coh)[34] و بیشینه کردن فاصله میان خوشه ای یا جدایی(Sep)[35] است. چون معیارهای بدون ناظر زیادی وجود دارد، هر معیار دو عامل فوق را به شکلی خاص تعریف می نماید. معیار ASC این دو عامل را به شرح زیر تعریف می کند:
Coh=
Sep=
بنابر این ASC یا Silhouette Measure به شکل زیر تعریف میگردد:
ASC=
حداکثر مقدار برای این معیار عدد ۱ و حداقل آن ۱- می باشد.
در فرمول فوق dist(x, y) نشان دهنده ی فاصله نقاط(رکوردهای) x, y از یکدیگر است که برای محاسبه آن از فاصله اقلیدسی که توضیح داده خواهد شد استفاده می شود. همچنین nc, mi, ci به ترتیب بیان کننده مرکز خوشه i ام، تعداد اعضای خوشه i ام و تعداد کل خوشه های تشکیل شده برای نقاط مورد بررسی می باشد.
فاصله اقلیدسی به شکل زیر است:
در رابطه فوق، n بیانگر تعداد ویژگی ها(ابعاد مساله)، به ترتیب مبین k امین ویژگی های دو رکورد x و y هستند.
۳-۱۲-الگوریتم های خوشه بندی
در این بخش هدف استفاده از الگوریتم های خوشه بندی K-Means, Kohonen و دوگامی روی داده می باشد و بررسی این موضوع که آیا این الگوریتم ها بر روی این داده خروجی مطلوبی را خواهد داشت یه خیر؟ پس از اجرای الگوریتم، خروجی با معیار ASC ارزیابی خواهد شد.
۳-۱۲-۱- الگوریتم K-Means
بهترین کارایی بدست آمده برای این الگوریتم با تنظیمات پارامترهای زیر بوده است:
جدول ۳-۱۲: تنظیمات پارامترهای الگوریتم K-Means
Partitioning
% Test Partition
%train Partition
k
Iteration
YES
۹۰
۱۰
۹
۸
طبق شکل ۳-۲۳، پس از ۸مرتبه اجرای الگوریتم به درصد خطای صفر دست یافته ایم.