بهبود نتايج و عملکرد سيستم توصيه گر پالايش مشارکتي با استفاده از الگوريتم ژنتيک
چكيده
اين مقاله يک متريک براي اندازه گيري شباهت بين کاربران ارائه ميکند که قابل استفاده در فرآيندهاي پالايش مشارکتي انجام شده در سيستمهاي توصيهگراست. متريک پيشنهادي از طريق يک ترکيب خطي ساده از مقادير و وزنها فرموله شده است. مقادير براي هر جفت از کاربران که بين آنها شباهت به دست آمده، محاسبه شده است در حالي که وزنها فقط يک بار محاسبه مي شوند، با استفاده از يک مرحله مقدمه که در آن يک الگوريتم ژنتيک وزنها را از سيستم توصيهگر استخراج ميکند و به طبيعت خاص داده در هر سيستم توصيهگربستگي دارد. نتايج به دست آمده بهبود قابل توجهي در کيفيت پيش بيني، کيفيت پيشنهاد و عملکرد نشان ميدهد.
كلمات كليدي
پالايش مشارکتي، سيستمهاي توصيهگر، مقياسهاي شباهت، متريکها، الگوريتمهاي ژنتيک، عملکرد.
1- مقدمه
اصل اساسي سيستمهاي توصيهگر(RS) اين است که گروهي از کاربران مشابه به يک کاربر داده شده، (يعني کساني که تعداد زيادي از عناصر را در يک روش مشابه امتياز دادهاند) بتوانند براي پيشبيني رتبه هاي فردي روي محصولاتي که اين کاربر دانشي از آنها ندارد مورد استفاده قرار گيرند. به اين ترتيب، سفر به سنگال مي تواند به فردي که مقصدهاي مختلف در کارائيب را بسيار بالا رتبه داده است، بر اساس رأي مثبت در مورد مقصد تعطيلات ” سنگال” تعداد زيادي از افراد که آنها نيز رتبه مقصد در کارائيب را بسيار بالا داده اند، پيشنهاد شود. اين پيشنهاد (توصيه) اغلب خدماتي با اطلاعات الهام بخش از دانش جمعي تمام کاربران ديگر از خدمات فراهم مي کند.
در سال هاي اخير، RS نقش مهمي در کاهش تاثير منفي سربار اطلاعات در آن دسته از وب سايتها که در آن کاربران امکان راي دادن براي اولويتهاي خود به يک سري از مقالات يا خدمات را دارند، ايفا کرده است. وب سايتهاي پيشنهاد فيلم احتمالا شناخته شده ترين موارد براي کاربران هستند و بدون شک اغلب به خوبي توسط محققان مورد مطالعه بوده اند [4,19,2]23]هر چند، بسياري از زمينه هاي ديگر وجود دارد که در آن RS اهميت دارد، مانند تجارت الکترونيکي[15] آموزش الکترونيکي [5,9] و کتابخانه هاي ديجيتال [26,27].
در حال حاضر، افزايش سريع وب 2.0 [18,23] منجر به گسترش وب سايتهاي مشترک شده است که در آن تعدادي از عناصر ميتوانند توصيه شوند (به عنوان مثال وبلاگ ها) و ميتواند به طور قابل توجهي افزايش يابد هنگامي که توسط کاربران (و نه تنها راي دادن) معرفي شده است، که چالش هاي جديدي را براي محققان در زمينه RS، در همان زمان به عنوان افزايش احتمالات و اهميت تکنيک هاي بازيابي اطلاعات ايجاد کرده است.
هسته يک RS الگوريتم هاي فيلترينگ (پالايش) آن است: فيلترينگ جمعيت شناختي [20] و فيلترينگ مبتني بر محتوا[21] اساسي ترين تکنيکها هستند؛ اولي بر اساس اين فرضيه که افراد با برخي از ويژگي هاي شخصي مشترک (جنس، سن، کشور، و غيره) همچنين ترجيحات مشترک خواهند داشت، برقرار شده است، در حالي که فيلترينگ مبتني بر محتوا آيتمهاي مشابه به آنهايي که کاربر در گذشته ترجيح داده است را پيشنهاد ميکند. در حال حاضر، پالايش مشارکتي (CF) شايع ترين تکنيک استفاده شده و مورد مطالعه بوده است [12,24]، اين تکنيک در اصل بر اساس مجموعه اي از اصول در پاراگراف اول اين بخش است، که در آن به منظور ساخت يک توصيه به کاربر داده شده، ابتدا کاربراني از سيستم را که در روشي مشابه به اين کاربر راي داده اند جستجو ميکند، بعد توصيه ها با در نظر گرفتن آيتمهاي ( مقصد تعطيلات در مثال ما ) بسيار ارزشمندتر توسط اکثرکاربران مشابه آنها ساخته ميشود.
بخش قابل توجهي از الگوريتم هاي CF اشاره به گروه معيارهاي مورد استفاده براي تعيين شباهت بين هر جفت از کاربران دارند [14,1,7]، که در ميان آن متريک همبستگي پيرسون به عنوان يک مرجع است.
الگوريتم هاي ژنتيک (GA) عمدتا در دو جنبه در RS مورد استفاده قرار گرفته است: خوشه بندي [16,17,28] و مدلهاي هيبريدي کاربر [2,13,10]. يک تکنيک معمول براي بهبود ويژگيهاي RS شامل ابتدا انجام يک خوشه بندي بر روي همه کاربران است، در چنين روشي که يک گروه از کلاس ها از کاربران مشابه به دست آمده است، بعد از اين، تکنيک هاي CF مورد نظر را مي توان به هر يک از خوشه ها اعمال کرد، به دست آوردن نتايج مشابه اما در زمان محاسبه بسيار کوتاه تر؛ اين موارد از الگوريتم هاي خوشه بندي ژنتيکي معمول مانند GA مبتني بر K-means استفاده ميکنند[17].
مدلهاي کاربر هيبريديRS معمولا از يک ترکيب از CF با فيلترينگ جمعيت شناختي و ياCF با فيلترينگ مبتني بر محتوا براي بهره برداري از محاسن هر يک از اين تکنيکها، استفاده ميکند. در اين موارد، ساختار کروموزوم به راحتي ميتواند شامل مشخصات جمعيتي و/ يا مربوط به فيلترينگ مبتني برمحتوا باشد.
روش ارائه شده در اين مقاله از GA استفاده ميکند، اما با اين مزيت که به اطلاعات اضافي ارائه شده توسط مدل هيبريدي کاربر نياز ندارد، و به همين دليل، آن را مي توان در همهيRS هاي فعلي به سادگي بر روي تکنيکهايCF مورد استفاده قرار داد. اين به علت اين واقعيت است که روش ما تنها از امتيازدهي کاربران استفاده ميکند (که حداقل اطلاعات ممکن در هر RS است).
بخش زير روش پيشنهادي (روشGA-) و پردازش مقدماتي مورد نياز با استفاده ازGA را تعريف ميکند، پس از اين، بخش هايي را ارائه ميکنيم که طراحي آزمايش انجام شده و نتايج به دست آمده را مشخص ميکنند، در نهايت نتايج مربوطه از اين مطالعه را ليست ميکنيم.
فایل ترجمه مقاله Improving collaborative filtering recommender system results and performance using genetic algorithms
بهبود نتايج و عملکرد سيستم توصيه گر پالايش مشارکتي با استفاده از الگوريتم ژنتيک
فایل ترجمه – Wordدر قالب مقاله دو ستونه – 8 صفحه
اصل مقاله انگلیسی
abstract
This paper presents a metric to measure similarity between users, which is applicable in collaborative filtering processes carried out in recommender systems. The proposed metric is formulated via a simple linear combination of values and weights. Values are calculated for each pair of users between which the similarity is obtained, whilst weights are only calculated once, making use of a prior stage in which a genetic algorithm extracts weightings from the recommender system which depend on the specific nature of the data from each recommender system. The results obtained present significant improvements in
prediction quality, recommendation quality and performance.
دریافت فایل اصل مقاله – فایل PDF شامل 7 صفحه