مقاله اول:
خلاصه سازي متون فارسي با استفاده از هستي شناسي و خوشه بندي
خلاصه مقاله:
يكي از مشكلات اصلي در تحقيق روي خلاصه سازي خودكار، تفسير معنايي نادرست از سند است. استفاده از دامنه دانش منحصر بفرد مي تواند اين مشكل را به طور قابل توجهي كم كند. در اين مقاله ما يك روش استخراجي مبتني بر هستي شناسي براي خلاصه سازي متون فارسي معرفي مي كنيم. اين روش بر پايه نگاشت متن به مفاهيم و نمايش سند و جملات آن به صورت گراف است. ما روش خودمان را براي خلاصه سازي يك مجموعه از مطبوعات مربوط به فوتبال داخلي به كار مي گيريم و از مزيتهاي منابع دانش خارجي مانند هستي شناسي نيز استفاده مي كنيم. مقايسه اين روش با روشهاي ديگر خلاصه سازي با معيار سودمندي نشان مي دهد كيفيت خلاصه سازي در اين روش بهبهود يافته است.
كلمات كليدي:
خلاصه سازي، هستي شناسي، خوشه بندي، گراف
—————————————————————-
مقاله دوم:
سيستم خلاصه ساز خودكار متن هاي فارسي
خلاصه مقاله:
امروزه با رشد سريع اطلاعات و داده ها، يافتن اطلاعات مناسب و كارا از اهميت خاصي برخوردار است. هدف خلاصه سازي خودكار متن، فراهم كردن خلاصه اي از محتويات مطابق با اطلاعات مورد نياز كاربر است. در اين مقاله، نگارندگان ابتدا مفاهيم خلاصه سازي و انواع آن، سپس سيستم هاي خلاصه ساز موجود، و در نهايت روش خلاصه سازي خودكار متنهاي فارسي پيشنهادي را بررسي نموده اند. روش پيشنهادي، تركيبي از روشهاي مبتني بر گراف ،TF-IDF و الگوريتم ژنتيك (Genetic Algorithm) است. در اين روش كلمات قبل از امتيازدهي جملات، ريشه يابي مي شوند. پس از امتيازدهي، جملات خلاصه با استفاده از الگوريتم ژنتيك (GA )انتخاب مي شوند. تابع برازندگي الگوريتم ژنتيك مبتني بر سه فاكتور شباهت با عنوان، قابليت خوانايي و پيوستگي است. ارزيابي خلاصه هاي حاصل از پياده سازي سيستم پيشنهادي در انتهاي مقاله آورده شده است.
كلمات كليدي:
الگوريتم ژنتيك، تابع برازندگي، خلاصه سازي، TF-IDF ،Genetic Algorithm
—————————————————————-
مقاله سوم:
سيستم خلاصه ساز خودكار متن فارسي با استفاده از الگوريتم تركيبي SA-GA
خلاصه مقاله:
خلاصه سازي خودكار متن، فرآيندي براي كاهش حجم متن سند، با استفاده از يك برنامه ي كامپيوتري به منظور ايجاد خلاص هاي از متن با حفظنكات كليدي و مهم سنداست. از آنجايي كه رشد اطلاعات بسيار فزآينده است و داده ها افزايش يافته اند، خلاصه سازي خودكار متن، يك روش كاربردي است. اين روش به كوتاه كردن محتواي اطلاعاتي يك فايل متني با حفظ محتواي اصلي در معناي كلي اشاره ميكند. در اين مقاله سيستم خلاصه ساز متن فارسي پيشنهادي پس از ريشه يابي كلمات با استفاده ازتركيب روشهاي مبتني بر گراف و TF-IDF جملات را وزندهي مي- نمايد. سپس جملات خلاصه با استفاده از الگوريتم تركيبي SA-GA كه تركيبي از الگوريتم ژنتيك (GA) و الگوريتم شبيه سازي حرارت (SA) است، انتخاب ميشوند. تابع برازندگي الگوريتم ژنتيك مبتني بر سه فاكتور شباهت با عنوان، قابليت خوانايي و پيوستگي است. ارزيابي خلاصه هاي حاصل از اجراي اين سيستم كارايي آن را ثابت نموده است.
كلمات كليدي:
خلاصه سازي خودكار متن، ريشه يابي، TF-IDF ، الگوريتم ژنتيك، شبيه سازي حرارت
—————————————————————-
مقاله چهارم:
خلاصه سازي زباني و طبقه بندي بر اساس استخراج گراف فازي احتمالي از داده اي خام
خلاصه مقاله:
خلاصه سازي داده ها به شكلي كه براي انسان ها قابل فهم باشد، يكي از مسائلي است كه با تكنيك هاي داده كاوي زيادي به آن پرداخته شده است. نويسندگان زيادي از تكنيك هاي مختلف براي ايجاد خلاصه هاي زباني استفاده كرده اند. يكي از كاربردهاي خلاصه سازي تصميم گيري مي باشد و آنچه بديهي به نظر مي رسد اين است كه براي اين كار خلاصه اي كه ايجاد مي شود بايد بتواند اساس مناسبي براي تشكيل يك سيستم تصميم گير شود. در اينجا روشي براي ايجاد گراف فازي احتمالي كه پايه ي محاسبات با كلمات مي باشد، معرفي مي شود. اين روش رويكرد خوشه بندي Gustafson–Kessel و استخراج قوانين فازي براي توليد گراف فازي احتمالي استفاده مي كند. در پايان نشان مي دهيم كه اين روش در عين دقت بالا، در برابر نويز مقاوم تر از ساير روش هاي استخراج قانون مي باشد
كلمات كليدي:
استخراج قوانين فازي، خلاصه سازي داده، خوشه بندي Gustafson–Kessel ، گراف فازي احتمالي، محاسبات با كلمات
—————————————————————-
مقاله پنجم:
يك مدل گرافيكي معنايي براي استخراج كلمات كليدي از عنوان و چكيده مقاله
خلاصه مقاله:
استخراج بهينه كلمات كليدي كه در برگيرنده مفهوم اصلي متون هستند مي تواند در بسياري از حوزه هاي پردازش طبيعي مانند خلاصه سازي و دسته بندي متون مفيد باشد. اهميت استخراج كلمات كليدي از متون فارسي با توجه به پيچيدگي بيشتر دستوري و نگارشي اين زبان و از طرفي تحقيقات كمتر انجام شده در اين زمينه نمود بيشتري پيدا مي كند. در اين مقاله ضمن معرفي يك مدل گرافيكي بهبود يافته براي تحليل معنايي، تركيبي جديد از روش هاي آماري و معنايي را براي استخراج كلمات و عبارات كليدي از عنوان و چكيده مقالات فارسي و انگليسي ارائه مي كنيم . بهبود معرفي شده و روش پيشنهادي برروي دو مجموعه داده فارسي و انگليسي شامل مجموعه چكيده مقالات چهاردهمين كنفرانس انجمن كامپيوتر ايران و مجموعه داده معروف Inspec و با استفاده از سه معيار استاندارد ارزيابي موجود در اين حوزه شامل دقت، فراخواني و مقياس F آزمايش شد و نتايج نشان دادند بهبود معرفي شده مي تواند تا 7.5 درصد دقت سيستم در استخراج صحيح كلمات كليدي را افزايش دهد. ضمن اينكه روش پيشنهادي نيز در هر سه معيار نتايج بهتري نسبت به ساير الگوريتم هاي موجود در اين حوزه كسب مي كند.
كلمات كليدي:
استخراج كلمات كليدي، مدلهاي گرافيكي، تحليل آماري، تحليل معنايي ، متون فارسي
—————————————————————-
مقاله ششم:
خلاصهسازي ويدئويي و استخراج فريمهاي كليدي با استفاده از گراف رابطهاي صفدار و تجزيه مقادير منفرد
خلاصه مقاله:
در اين مقاله يك سيستم خلاصه سازي ويدئويي جهت حذف افزونگي هاي بصري و فريم هاي تكراري ارائه شده است . ابتدا مرز شات هاي ويدئويي با استفاده از يك الگوريتم مبتني بر تجزيه مقادير منفرد تشخيص داده مي شود . هر شات بصورت مرز شات هاي ويدئويي با استفاده از يك الگوريتم مبتني بر تجزيه مقادير منفرد تشخيص داده مي شود. هر شات بصورت يك گراف رابطه اي صفت دار مدل مي شود . سپس به منظور حذف افزونگي ها و فريم هاي تكراري اين گراف ها با استفاده از الگوريتم برش نرمال گراف و زير گراف هاي متمايز افراز مي شود. در هر يك از افزارها يكي از فريم ها بصورت تصادفي به عنوان فريم كليدي در نظر گرفته مي شود و سپس با تركيب اين فريم هاي كليدي خلاصه ويدئويي ايجاد مي شود .نتايج آزمايشات روي يك مجموعه از تصاوير ويدئويي با موضوعات متنوع كارايي رهيافت پيشنهادي را تاييد مي كنند.
كلمات كليدي:
خلاصهسازي ويدئويي، تشخيص شات هاي ويدئويي، فريم كليدي، تجزيه مقادير منفرد، گراف رابطهاي صفتدار