×
نام و نام خانوادگی
بازخوانی ...
اطلاعات کتابشناختی
عنوان :

روش جديد خوشه بندي مستندات متني الكترونيكي فارسي به كمك واژ-هستان شناسي فارس نت

پدیدآورندگان :

محمد زنجاني (پديدآور)
احمد براآني دستجردي (پديدآور)

نوع : متن
جنس : مقاله
الكترونيكي
زبان : فارسي
صاحب محتوا :

انتشارات بوم سازه (پایگاه سیویلیکا)

توصیفگر :
رده بندی : -
وضعیت نشر : اولين كنفرانس ملي دانش پژوهان كامپيوتر و فناوري اطلاعات
ویرایش : -
مشخصات فیزیکی : -
خلاصه : خوشه بندي يا دسته بندي بدون نظارت با انجام سازماندهي بر روي پيكره هاي بزرگ متني، نقش كليدي در پيمايش و مرور آسان انبوهي از اسناد به خصوص در موتور هاي جستجو دارد. معمولا استفاده از روش هاي متعارف افزاري و سلسله مراتبي منجر به خوشه بندي با كيفيت پايين مي شود.علت اين موضوع آن است كه مقايسه اسناد تنها به لحاظ شباهت ظاهري كلمات داخل انها صورت مي پذيرد، به طوري كه به روابط كلمات توجهي نشده و تلاشي براي رفع ابهام از معاني كلمه صورت نمي گيرد.در اين مقاله، زبان فارسي با توجه به رشد روز افزون مستندات الكترونيكيبه اين زبان، مورد توجه قرار گرفته است. ايده اصلي يافتن توضيحات مناسب براي دانش پس زمينه و غني سازي متن فارسي با استفاده از آن است. براي نيل به اين مقصود از منبع دانش خارجي به نام واژ-هستان شناسي فارس نت استفاده شده است. همچنين براي خوشه بندي بر رهيافت فاكتورگيري نا منفي ماتريس (NMF) تاكيد شده است. نتايج ارزيابي ها بر روي پيكره ي متني همشهري، نشان از بهبود كيفيت خوشه بندي متن فارسي غني شده (به خصوص با رابطه شمول) در مقايسه با خوشه بني خام دارد. همچنين تاثير اين روابط در كيفيت خوشه بندي بر پايه NMF بيشتر از خوشه بندي متعارف Bisecting Kmeans بوده است.
فهرست مطالب : -
مخاطب :
یادداشت : -
شناسه : oai:civilica.com/Paper-CSCCIT01-CSCCIT01_146.html
مکان : -
شرایط دسترسی : -
تاریخ ایجاد رکورد : 1390/11/8
تاریخ تغییر رکورد : 1394/8/26
ملحقات : -
تاریخ ثبت : 1391/4/17
قیمت شيء دیجیتال : فاقد شيء دیجیتالی

دیدگاه شما
حسن
محمد

تست