استنتاج و پایگاههای RDFS/OWL
چکیده
در طی سالیان اخیر حجم زیادی از سه گانههای RDF (در حدود چند ده میلیارد) در وب منتشر گردیده است. برای استفاده از این دادههای منتشر شده باید الگوریتم استنتاجی داشته باشیم که بتواند روی این حجم عظیم از دادهها استنتاج انجام دهد و همچنین بتواند خود را با این نرخ بالای رشد ، تطبیق دهد. تاکنون راهکارهای مختلفی برای حل این مشکل ارائه گردیده است که برخی از آنها توانسته اند ، مقیاسپذیری خوبی را از خود نشان دهند. متاسفانه اکثر این روشها برای حل مشکل مقیاسپذیری فرض کرده اند که دادهها ایستا میباشد و از روش استنتاج رو به جلو برای محاسبه بستار استفاده کرده اند. بنابراین تاکنون توجه کمی به مساله پویایی دادهها در وب معنایی شده است.
کلمات کلیدی: استنتاج در وب معنایی ، استنتاج مقیاسپذیر ، استنتاج استقرایی ، استنتاج RDFS/OWL ، کدگذاری دادهها ، Latent Dirichlet Allocation.
اساسا مساله ای که ما به آن میپردازیم ، پردازش دادههای موجود در ورودی و استخراج اطلاعات جدید از روی آنها در خروجی میباشد. ما این فرآیند را استنتاج بر روی دادهها مینامیم. دادههای موجود در ورودی میتواند به فرمت RDF یا OWL کدگذاری گردد. بنابراین عملیات استنتاج وابسته به زبانی میباشد که دادهها براساس آن کدگذاری شده اند.
در بخش 2-1 در مورد وب معنایی و مفهوم آنتولوژی توضیحاتی را ارائه میکنیم. در بخش 2-2 به طور دقیقتر عملیات استنتاج را تعریف کرده و تکنیکهای مختلف استنتاج را بررسی میکنیم. در بخش 2-3 ، توضیحات پایه ای در مورد وب معنایی ارائه کرده و پشته وب معنایی و زبان XML را بررسی میکنیم. بخش 2-4 شامل شرح مختصری برRDF بوده و بخش 2-5 مربوط به RDFS میباشد. بخش 2-6 توضیحاتی را در مورد زبان OWL ارائه میکند. در بخش 2-7 با زبان پرسوجوی SPARQL آشنا میشویم و در نهایت ، در بخش 2-8 توضیحاتی در مورد روش یادگیری LDA ارائه میگردد.
2-1 وب معنایی
امروزه کامپیوترها از ابزاری مستقل و منزوی به نقطه ورودی برای دسترسی به شبکه گسترده ای از اطلاعات و تراکنشها تبدیل شده اند [19]. پشتیبانی از تبادل دادهها ، اطلاعات و دانش مبحثی کلیدی در تکنولوژی جاری کامپیوتر میباشد. آنتولوژی ها نقش مهمی را در پشتیبانی فرآیند تبادل اطلاعات بین حوزههای مختلف ایفا میکنند. مفهوم آنتولوژی در حوزههایی همچون تجمیع اطلاعات هوشمند ، سیستمهای هوشمند اشتراکی ، بازیابی اطلاعات ، تجارت الکترونیک و مدیریت دانش فراگیر شده است. علت اصلی رایج شدن آنتولوژیها ، به خاطر قابلیتهایی است که آنها فراهم میکنند: فراهم سازی یک درک یکسان و مشترک از دانش موجود در یک دامنه که میتواند برای برقراری ارتباط بین انسان و ماشین مورد استفاده قرار گیرد. چون که آنتولوژیها معمولا در حوزههای دارای دانش رضایی بکار میآیند ، بنابراین توسعه آنها اغلب یک فرآیند اشتراکی است که عده زیادی فرد خبره در آن شرکت دارند.
در یک ده اخیر تعاریف زیادی برای آنتولوژی ارائه شده است. با این حال ، به عقیده ما بهترین تعریفی که به خوبی مفهوم آنتولوژی را بیان میکند ، تعریف ارائه شده در [22] میباشد: یک آنتولوژی یک درک صریح و فرمال از برخی مفهومی سازی های مشترک میباشد. مفهومی سازی به یک مدل انتزاعی از برخی پدیدههای دنیا گفته میشود که در آن مفاهیم مرتبط با آن پدیده شناسایی میگردند. صریح به این معنا است که نوع مفاهیم و قیدهای استفاده شده در آنتولوژی به طور صریح تعریف گردیده است. فرمال به این حقیقت اشاره میکند که آنتولوژی باید قابل پردازش توسط ماشین باشد. برای مثال ماشین باید قادر باشد اطلاعاتی که بدون ابهام بیان شده اند را ، تفسیر کند. اشتراکی به این ایده اشاره میکند که آنتولوژی دانش رضایی را بازنمایی میکند که محدود و خاص یک فرد نبوده و بوسیله یک گروه از افراد خبره پذیرفته شده میباشد.
فایل Microsoft Word
تعداد صفحات : 45 صفحه
فصل 2: پیش زمینه 10
2-1 وب معنایی 11
2-2 استنتاج 13
2-2-1 استنتاج استنباطی 13
2-2-2 استنتاج استقرایی 15
2-3 XML 17
2-4 RDF 19
2-5 RDF Schema 21
2-5-1 استنتاج RDFS 22
2-6 OWL 23
2-6-1 استنتاج OWL 25
2-7 SPARQL 26
2-8 LDA 27
2-8-1 مدل گرافیکی LDA 30
2-8-2 ارتباط با سایر مدلهای متغیر پنهان 31
2-8-2-1 مدل یونیگرم 31
2-8-2-2 ترکیب یونیگرمها 32
2-8-2-3 شاخص گذاری معنایی پنهان احتمالاتی 32
2-8-2-4 تفسیر هندسی 34
فصل 3: کارهای مرتبط 37
3-1 استنتاج کلاسیک 37
3-2 استنتاج مقیاس وسیع 39
3-2-1 روشهای استنباطی 39
3-2-2 روشهای استقرایی 41
3-3 کدگذاری دادهها 42
منابع 75
واژهنامه 80