تکمیل RDF های سوره ها و آیات قرآن کریم
طراحي و پيادهسازي پيكره متني قرآن كريم در قالب RDF و به شكل محتواي الكترونيكي در بر گیرنده¬ی هر گونه اطلاعات مفید و سودمند برای انجام عملیات متن کاوی، اصلی ترین بخش پروژه ی ما را به خود اختصاص داده است.
ما در فاز اولیه ی پروژه که با وجود وقفه در انجام آن مجددا از سر گرفته شد، آنتولوژی ها و پیکره های قرآنی موجود را جمع آوری کرده و به طور دقیق مورد بررسی قرار دادیم و با توجه به نیازهای فعلی و اطلاعات لازم برای گام های بعدی پروژه و انجام عملیات متن کاوی بر روی قرآن تصمیم گرفتیم که در نهایت، یک قالب ثابت برای سوره و آیه های قرآن کریم در نظر گرفته و با گردآوری پیکره های مناسب و موجود، محتوی این RDF ها را با برنامه نویسی تکمیل نماییم.
قالب RDF های در نظر گرفته شده برای پروژه به صورت زیر می باشد:
قالب RDF در نظر گرفته شده برای سوره:
– نام سوره
– شماره ی سوره
– جزء های در بر گیرنده ی سوره
– حزب های در بر گیرنده ی سوره
– اسامی دیگر سوره
– معنی نام سوره
– نام سوره به زبان عربی
– مکی یا مدنی بودن سوره
– مفهوم کلی مطرح شده در سوره
– کلیه ی مفاهیم ذکر شده در آیات سوره
– صفحه ی آغازین سوره در قرآن عثمان طه
– صفحه ی پایانی سوره در قرآن عثمان طه
– تعداد آیه های سوره
– تعداد سجده های سوره
– تعداد سجده های واجب سوره
– سوره ی قبلی
– سوره ی بعدی
قالب RDF در نظر گرفته شده برای آیه:
– فیلد مشخص کننده ی چندمین آیه از چندمین سوره
– جزء در بر گیرنده ی آیه
– حزب در بر گیرنده ی آیه
– متن آیه به زبان عربی
– ترجمه ی آیه به زبان فارسی
– ترجمه ی آیه به زبان انگلیسی
– ترجمه ی آیه به سایر زبان های موجود
– تفسیر آیه به زبان های موجود
– مفاهیم ذکر شده در آیه
– شماره سوره ی در بر گیرنده ی آیه
– نام سوره ی در بر گیرنده ی آیه
– مکی یا مدنی بودن سوره ی در بر گیرنده ی آیه
– شامل سجده بودن آیه
– شامل سجده ی واجب بودن آیه
– تعداد تکرار هر کدام از حروف الفبا در آیه
– تعداد نقاط به کار رفته در حروف بکار رفته در آیه
– تعداد تکرار هر کدام از حرکات، تنوین ها، سکون و تشدید به کار رفته در آیه
با قالب های در نظر گرفته شده برای سوره و آیه و تکمیل اطلاعات فوق، دامنه ی وسیعی از اطلاعات مفید و سودمند را برای انجام عملیات متن کاوی برای پژوهشگران و محققان قرآنی فراهم خواهیم آورد. در حال حاضر بخش اعظم RDF های در نظر گرفته تکمیل گردیده و یکی از مهم ترین بخش هایی که در حین کار خودمان به پروژه اضافه کردیم، مفاهیم مطرح شده در هر آیه و هر سوره است که به عنوان مثال می¬توان به روش های الگوریتمیک و البته با دقت نه چندان بالا مفهوم کلی هر آیه و سوره را استخراج کرد.
همانطور که ذکر گردید مفاهیم مطرح شده در هر آیه و هر سوره یکی از مهم ترین داده های موجود در RDF آیه و سوره است که می تواند به شدت مورد استفاده¬ی پژوهشگران و محققان قرآنی قرار گیرد. واحد پژوهش بیت القرآن امام علی (ع) شهرستان قم، اقدام به انتشار قرآنی نموده است که در هر آیه ی قرآن مضامین و مفاهیم مطرح شده در آن آیه ذکر گردیده است و با توجه به مکتوب بودن سند فوق، ما همینک در حال تلاش برای تماس با مجری طرح جهت دستیابی به فایل متنی فوق می باشیم.
در صورت دستیابی به این فایل، با تکمیل RDF های موجود، با فراهم آوردن اطلاعات بسیار مفید و سودمندی برای سوره ها و آیات قرآن کریم، بخش اعظمی از پروژه به اتمام خواهد رسید و گام بعدی پروژه، انتشار داده ها بر روی سایت WTLab می باشد.
انتشار داده های قرآنی به صورت RDFبر روی سایت WTLab
در حال حاضر برای هر کدام از سوره ها و آیه ها یک URL تخصیص داده ایم و اطلاعات موجود پس از تکمیل، آماده ی انتشار به صورت RDFبر روی سایت WTLabمی باشند.
– به عنوان مثال تخصیص URL برای سوره ی حمد و همچنین اولین آیه از سوره ی حمد به صورت زیر صورت خواهد بود:
http://wtlab.um.ac.ir/LinkData/Quran/1
http://wtlab.um.ac.ir/LinkData/Quran/1/1