سناريوهاي ذكر شده در بخش 1.2 علمي تخيلي نيستند. براي دستيابي به آنها نيازي به پيشرفت علمي انقلابي نيست. ميتوان به صورت منطقي ادعا نمود كه چالش در پذيرش فناوري و مهندسي است و نه از لحاظ علمي: راهحلهاي جزئي براي همه بخشهاي مهم مساله وجود دارد. در حال حاضر بيشترين احتياجات در زمينههاي مجتمعسازي، استاندارد كردن، توسعه ابزار و تطبيق كاربران است. اما البته پيشرفت بيشتر فناوري، به وب معنايي پيشرفتهتري به نسبت آنچه امروزه قابل دستيابي است، منجر ميشود.
در بخشهاي آتي به چند فناوري ضروري براي دستيابي به عملكردهاي ذكر شده اشاره مينماييم.
1.3.1ابر داده صريح
در حال حاضر محتواي وب براي خوانندگان انسان شكل گرفته است تا براي برنامه ها. HTML زبان غالبي است كه صفحات وب با آن (به طور مستقيم يا با استفاده از ابزار) نوشته ميشوند. بخشي از يك صفحه وب معمول متعلق به يك درمانگر ممكن است به صورت زير باشد:
<h1>Agilitas Physiotherapy Centre</h1>
Welcome to the Agilitas Physiotherapy Centre home page.
Do you feel pain? Have you had an injury? Let our staff
Lisa Davenport, Kelly Townsend (our lovely secretary)
and Steve Matthews take care of your body and soul.
<h2>Consultation hours</h2>
Mon 11am – 7pm<br>
Tue 11am – 7pm<br>
Wed 3pm – 7pm<br>
Thu 11am – 7pm<br>
Fri 11am – 3pm<p>
But note that we do not offer consultation
during the weeks of the
<a href=”. . .”>State Of Origin</a> games.
براي انسانها اطلاعات به صورت رضايتبخشي ارائه شده است، اما ماشينها مشكلات خود را خواهند داشت. جستجوهاي مبتني بر كلمه كليدي، كلمات physiotherapy و consultation hours را تشخيص ميدهند. و حتي يك عامل هوشمند ممكن است قادر به تشخيص پرسنل مركز باشد. اما در تشخيص درمانگرها از منشي دچار مشكل خواهد شد و حتي در يافتن ساعات واقعي مشاوره مشكلش حادتر ميگردد. (براي اين كار نياز است تا پيوند State Of Origin games را دنبال كند تا زمان برگزاري آنها را بيابد.)
رويكرد وب معنايي براي حل اينگونه مسائل توسعه عاملهاي ابرهوشمند نيست. در عوض پيشنهاد ميكند از سمت صفحه وب به مشكل حمله شود. اگر HTML با زبان مناسبتري جايگزين گردد، صفحات وب ميتوانند محتواي خود را با خود حمل كنند. آنها علاوه بر شمول اطلاعات فرمت كه به ايجاد يك سند براي مخاطبان انسان كمك ميكند، داراي اطلاعاتي در مورد محتوايشان نيز ميباشند. در مثال ما ممكن است اطلاعاتي همانند آنچه در ادامه آمده وجود داشته باشد:
<company>
<treatmentOffered>Physiotherapy</treatmentOffered>
<companyName>Agilitas Physiotherapy Centre</companyName>
<staff>
<therapist>Lisa Davenport</therapist>
<therapist>Steve Matthews</therapist>
<secretary>Kelly Townsend</secretary>
</staff>
</company>
اين ارائه به مراتب آسانتر توسط ماشينها قابل پردازش است. لغت ابرداده به چنين اطلاعاتي ارجاع داده ميشود: دادههايي درباره دادهها. ابرداده بخش معناي دادهها را در خود دارد، كلمه معنا در وب معنايي از اينجا ناشي شده است.
در سناريوهاي نمونه ما در بخش 1.2 به نظر ميرسيد موانعي در برابر دسترسي به اطلاعات صفحات وب از قبيل جزئيات درمان، برنامههاي زماني و قرار ملاقاتها، قيمتها و توصيف محصولات، وجود ندارد. به نظر ميرسد تمام اطلاعات ميتوانند بطور مستقيم از محتواي وب موجود بازيابي شود. اما همانطور كه شرح داده ميشود، اين اتفاق با استفاده از دستكاري داده مبتني بر متن رخ نميدهد بلكه با سودبري از ابرداده قابل پردازش براي ماشين صورت ميگيرد.
با توجه به توسعه كنوني در صفحات وب، كاربران نيازي به مهارت در زمينه علوم كامپيوتر براي ايجاد صفحات وب ندارند و ميتواننداز طريق ابزاري بدين هدف نايل آيند. هنوز اين سوال مطرح است كه چرا كاربران بايد به اينگونه مسائل اهميت دهند و چرا بايد به خاطر زبانهاي وب معنايي HTML را رها كنند. شايد اگر موقعيت امروزي را با دوران آغازي وب مقايسه كنيم، بتوانيم پاسخي خوشبينانه به اين سوال دهيم. كاربران ابتدايي HTML را برگزيدند زيرا به صورت يك استاندارد درآمده بود و فوايدي از آن انتظار ميرفت كه متناسب با پذيرندگان ابتدايي بود. ديگران با توجه به ظهور ابزارهاي بهتر و بيشتر به سمت آن رفتند و به زودي HTML تبديل به استاندارد پذيرفته شده جهاني شد.
به طور مشابه، در حال حاضر پذيرش سريع XML را مشاهده ميكنيم. XML اولين قدم مهم است، هرچند براي درك ديد وب معنايي كافي نيست. كاربران ابتدايي، احتمالا برخي سازمانهاي بزرگي كه به مديريت دانش و تجارت الكترونيك B2B علاقمندند، XML و RDF را به عنوان استانداردهاي W3C مرتبط با وب معنايي كنوني ميپذيرند. و اين شتاب به فروشندگان ابزار و كاربران برگزيننده فناوري بيشتر و بيشتر منجر ميگردد.
اين يك گام قطعي در سرگذشت وب معنايي خواهد بود، اما همچنان يك چالش است. همانطور كه اشاره شد بزرگترين چالش كنوني يك چالش علمي نيست بلكه پذيرش فناوري است.
1.3.2هستان شناسی
واژه هستان شناسی از فلسفه سرچشمه گرفته است. در این زمینه، از آن به عنوان نام یک زیر رشته استفاده میگردد، به عبارت دیگر، مطالعه ماهیت وجود (ترجمه تحت اللفظی از Oντoλoγiα کلمه یونانی) ، شاخه ای از متافیزیک است که در رابطه با شناسایی انواع چیزهایی که در واقع وجود داشته و چگونگی توضیح آنها ، می باشد. به عنوان مثال مشاهده آنکه جهان از اشیاء خاصی ساخته شده است که می تواند به کلاس های انتزاعی، بر اساس خواص مشترک تعهد هستیشناسی معمولی، دسته بندی شود.
با این حال ، در سال های اخیر ، هستیشناسی یکی از کلماتی است که بوسیله علوم کامپیوتر ربوده شده است و یک معنای ویژه فنی پیدا کرده است که بسیار متفاوت با معنای اصلی آن است. در حال حاضر ما برای اهداف خود از واژه “يك هستیشناسی ” بجای هستیشناسی صحبت میکنیم، ما از تعریف T. R. Gruber’s که بعدها توسط R. Studer دوباره تعریف شده است استفاده میکنیم:هستیشناسی بیانی صریح و رسمی از ویژگی های مفاهیم است.
به طور کلی، هستیشناسی یک حوزه از سخن را بطور رسمی توصیف میکند. . به طور معمول ، هستی شناسی شامل یک لیست محدود از اصطلاحات و روابط بین آنهاست. این اصطلاحات، مفاهیم مهم(کلاسهایی از اشیا)را در یک دامنه، مشخص میکند. به عنوان مثال ، در محیط دانشگاه ، کارکنان ، دانش آموزان ، دوره ها ، سالن سخنرانی ، و رشته های برخی از مفاهیم مهم است.
روابط به طور معمول شامل سلسله مراتب کلاس ها است. یک سلسله مراتب مشخص میکند کلاسc زیر کلاسی از کلاس *c است اگر هر جسم در c در *c نیز گنجانده شده باشد. به عنوان مثال ، تمام اعضای هیات علمی عضو كاركنان هستند. شکل 1.1 سلسسله مراتب حوزه دانشگاه را نشان میدهد.
به غیر از روابط زیر کلاسی، هستیشناسی ممکن است شامل اطلاعات زیر باشد:
•خصوصیات(x میآموزد به y )،
•محدودیت های مقدار( تنها اعضای هیات علمی میتوانند تدریس کنند)،
•عدم ارتباط وضعيتها (هيات علمي و كاركنان عمومي غير مرتبط هستند)
•خصوصيات روابط منطقي بین اشيا(هر دانشكده حداقل بايد ده عضو هيات علمي داشته باشد)
هستي شناسي در زمينه وب، فهم مشتركي از يك زمينه ارائه ميدهد. چنین درک مشترکي برای غلبه بر تفاوت در اصطلاحات لازم است. كاربرد كد زيپ ممكن است مشابه ديگر كاربرد كد در ناحيه باشد. مشكل ديگر اين است كه دو كاربرد ممكن است از يك اصطلاح مشترك با معاني متفاوت استفاده كنند. در دانشگاه الف ممكن است درس به يك رتبه(مانند علوم كامپيوتر) اشاره كند در حالي كه در دانشگاه ب به يك شئ واحد(cs 101) اشاره ميكند. چنين مشكلاتي ميتواند با نگاشت اصطلاحات خاص به يك هستيشناسي مشترك و يا تعريف يك نگاشت مشترك بين هستيشناسيها مرتفع گردد. در هر حال ميتوان به راحتي مشاهده نمود كه هستيشناسي از معاني به صورت قابل تفسيري حمايت ميكند.
هستيشناسي براي سازماندهي و مسيريابي وب سايتها مفيد است. امروزه بسياري از وب سايتها در سمت چپ صفحات خود سلسله مراتب مفاهيم سطح بالاي اصطلاحات خود را به نمايش ميگذارند. كاربر ممكن است يكي از آنها را كليك كند تا بتواند زير دستههاي آن را گسترش دهد.
همچنین ، هستی شناسی برای بهبود دقت جستجوهای وب مفيد است. موتورهای جستجو می توانند به دنبال صفحهاي بگردند كه در هستيشناسي خود به طور دقيق به مفاهيم اشاره ميكنند يه جاي اينكه در تمام صفحات، كه لغات به صورت كلي مبهم اتفاق مي افتند، بگردند. بدين ترتيب ميتوان بر تفاوت اصطلاحات بين وب سايتها و جستجوها غلبه كرد.
علاوه بر اين، جستجوهاي وب ميتوانند از قابلیت تعميم دادن/خصوصي ساختن اطلاعات استفاده كنند. اگر يك جستجو در يافتن هر گونه صفحات مرتبط شكست بخورد، موتور جستجو ممكن است يك جستجوي عموميتر را به كاربر پيشنهاد دهد. حتي ممكن است موتورهاي جستجو، چنين جستجوهايي را به طور پيش گستر، به منظور كاهش زمان واكنش در مورد قبول پيشنهاد، توسط كاربر اجرا كند. يا اگر پاسخهاي زيادي يافت شد، موتور جستجو ممكن است موارد خاصي را به كاربر پيشنهاد دهد.
در هوش مصنوعي سابقه طولاني از گسترش و استفاده از زبان هستيشناسي وجود دارد. اين اساس پژوهشهاي وب معنايي است. در حال حاضر مهمترين زبانهاي هستيشناسي در وب به شرح زير ميباشند:
•RDF يك مدل دادهاي براي اشيا (منابع) و روابط بين آنهاست؛ كه مفاهيم سادهاي براي اين مدل دادهاي فراهم ميكند؛ اين مدل دادهاي ميتواند به وسيله XML syntax نمايش داده شود.
•RDF Shema يك زبان توصيف لغوي براي تشريح ويژگيها و كلاسهاي منابع RDF، همراه با مفاهيمي براي عموميسازي سلسله مراتب آن ويژگيها و كلاسها است.
•Owl يك زبان توصيف لغوي قويتر براي تشريح ويژگيها و كلاسها است، از قبيل روابط بين كلاسها (مانند” “disjointnes )، cardinality (مثلا “دقيقا يك”، برابري، انواع غنيتري از ويژگيها، خصوصيات ويژگيها(به عنوان مثال “تقارن” و كلاسهاي شمارش شده.