سيستم بازيابي اطلاعات[1] در مجموعه سند[2]هايي که به فرمتهاي گوناگون در پايگاه داده وجود دارد (حال اين پايگاه داده ممکن است پايگاه دادة رابطه اي مستقل[3] يا پايگاه دادة شبکهاي ابر متن[4] مثل اينترنت باشد)، به دنبال اطلاعات مطلوب کاربر ميگردد. جستجوي اطلاعات به دو صورت امکان پذير است:
نگاه کردن کلي[5] : در مواردي است که خواستة کاربر دقيق نباشد يا اينکه علايق کاربر گسترده باشد.
جست و جو کردن[6] : در مواردي است که خواستة کاربر دقيق باشد.
1-1- مراحل بازيابي اطلاعات
در بازيابي اطلاعات چندين مرحلة مهم وجود دارد :
1- ايندکسبندي[1]
2- خطي سازي سند[2]
- حذف نشانهها و فرمت[3]
- نشان گذاري[4]
3- فيلتر کردن[5]
4- ريشهيابي[6]
5- وزن دادن[7]
6- رتبه بندي[8]
[1]- Indexing [2]- Document Linearization [3]- Markup and Format Removal [4]- Tokenization [5]- Filtration [6]- Stemming [7]- Weighting [8]- Ranking [1]-Information Retrieval(IR) System [2]-Document [3]-Relational Stand-Alone Database [4]-Hypertext Networked Database [5]- Browsing [6]- Quering
فهرست مطالب
فهرست مطالب
فصل 1: بازيابي اطلاعات 5
1-1- سيستم بازيابي اطلاعات 6
1-2- مراحل بازيابي اطلاعات 7
1-2-1- شاخصگذاری (ايندکسبندي) 7
1-2-2- خطيسازي سندها 8
1-2-3- فيلتر کردن 10
1-2-4- ريشهيابي کلمات 12
1-2-5- وزندهي 14
1-3- معيارهاي صحت و کيفيت در بازيابي 16
1-4- الگوهاي وزندهي 17
1-4-1- وزندهي با فرکانس کلمات 17
1-4-2- مدل فضاي برداري سالتون 22
1-4-3- وزنهاي محلي 23
1-4-4- وزنهاي سراسري 24
1-4-5- چگالي کلمات کليدي 25
1-4-6- نارساييهاي چگالي کلمه 26
1-5- ساير روشهای پيش پردازش زباني 26
1-5-1- تشخيص زنجيرههاي مرجعيتي 27
1-5-2- برچسب زني معنايي نقش کلمات 28
1-5-3- برچسب زني نحوي لغات 28
فصل 2: معرفي ابزار بازيابي اطلاعات Matlab 30
2-1- مقدمه 31
2-2- نحوه نصب ابزار TMG 33
2-3- ابزار شاخصگذاري (ايندکسگذاري) 35
2-4- ابزار کاهش ابعاد 39
2-5- ابزار فاکتورگيري نامنفي ماتريس 42
2-6- ابزار بازيابي اطلاعات 45
2-7- ابزار خوشهبندي 48
2-8- ابزار دستهبندي 50
فصل 3: ضمائم 53
3-1- تبديل دادهاي 54
3-1-1- تجزيه ويژهمقدار 54
3-1-2- شاخصگذاري معنايي پنهان (LSI) 55
3-1-3- فاکتورگيري نامنفي ماتريس (NMF) 61
3-1-4- مقايسه NMF با LSI 62
3-2- خوشهبندي 70
3-2-2- رويه خوشهبندي 71
3-2-3- اندازهگيري شباهت 72
3-2-4- ساختارهاي داده 73
3-2-5- ارزيابي 74
3-3- خوشهبندي متني 74
3-3-2- الگوريتم خوشهبندي k-Means 75
3-3-3- الگوريتم خوشهبندي Bisecting Kmeans 77
3-3-4- معيارهاي خارجي کيفيت خوشهبندي 80
مراجع 83