امام علی (ع) میفرماید: “قرآن را زمانه تفسیر می کند.”
در برداشت از چنین روایاتی است که علامه طباطبایی هر دهه را نیازمند تفسیری جدید از قرآن دانسته اند و بدیهی است این مهم مستلزم بهره مندی از فناوری های معاصر است. با این نگرش و در پیروی از امر امام راحل (ره) به تلاش در تنقیب قرآن، “شبکه پژوهشی قرآن کاوی”
(Quran Mining Research Network) در دهه اخیر شکل یافته است تا با بهره گیری از فناوری های متن کاوی (Text Mining) ابزار پیشرفته هوش مصنوعی رایانه را در خدمت اکتشاف اطلاعات پنهان متن قرآن قرار دهد. محققین این شبکه تلاش دارند نه تنها بحث های حل نشده و شبهه های ایجاد شده برای قرآن را مرتفع سازند بلکه جنبه هایی ناشناخته از این اصلی ترین منبع هدایت به بشریت عرضه کنند.
در همین راستا طراحي و پيادهسازي پيكره متني قرآن كريم در قالب RDF و به شكل محتواي الكترونيكي، حاوي اطلاعات صرفي و نحوي، امكان استفاده و كاوش را براي هر گونه پژوهش و پردازش هوشمند ايجاد خواهد کرد.
تبيين اعجاز زباني قرآن كريم در دستيابي به لايه هاي نامشهود زباني اين متن الهي می باشد.
بدین ترتیب پس از فراهم شدن بستر مناسب جهت متن کاوی روی قرآن کریم می توان با طراحی و بهره گیری از ابزارهای متن کاوی به اکتشاف کلامی و معنایی متن قرآن کریم پرداخت.
دانش هوشمند متن كاوي (text mining) به عنوان جديد ترين وجه همكاري بين دانش هاي فناوري اطلاعات، زبانشناسي و ادبيات در كاوش رايانه اي متون بشري قصد حصول اين امر را دارد و چنين كاوشي مستلزم ايجاد پيكره هاي متني برچسب گذاري شده از آن متون است كه به شكل محتوايي الكترونيكي حاوي اطلاعات صرفي و نحوي متون مورد نظرند.
اهداف کلی پروژه:
1. ساخت و تهیه ی بستری مناسب در قالب RDF برای قرآن کریم جهت متن کاوی و اکتشاف اعجاز کلامی و نحوی قرآن کریم
2. Text Mining بر روی محتوای الکترونیکی قرآن کریم جهت تعیین ارتباط بین بخش های مختلف قرآن کریم و ارتباط پنهان سوره ها، آیه ها، کلمات، حروف، مفاهیم و …
مراحل انجام پروژه:
1. تهیه ی یک آنتولوژی مناسب با توجه با اهداف پروژه:
الف. پیدا کردن یک آنتولوژی مناسب قرآنی، پیدا کردن نواقص و کمبودهای آن و تکمیل آنتولوژی مورد نظر جهت بهبود و استخراج مناسب اطلاعات مورد نظر.
ب. ساخت آنتولوژی مورد نظر از ابتدا توسط خودمان. (توسط نرم افزار Protege)
2. تهیه ی یک متن تگ گذاری شده از قرآن کریم شامل سوره ها، مکی و مدنی بودن سوره، تعدا سوره ها، آیه ها، کلمات و …
3. تهیه و گردآوری ترجمه های مختلف قرآن کریم به زبان فارسی.(یک XML قرآنی داریم که کامل نیست که بایستی در ابتدا آن را با توجه به نیاز خودمان تکمیل نموده و سپس آن را به RDF تبدیل نماییم.)
4. تهیه و گردآوری ترجمه های مختلف قرآن کریم به زبان های مختلف.
5. تهیه و گردآوری تفاسیر قرآن کریم مفسران مختلف به زبان های گوناگون برای برداشت و استنباط مفاهیم آیات و سوره ها و بیان ارتباط آن ها.
6. تعیین و تخصیص URL برای هر کدام از سوره ها و آیه ها و انتشار داده ها به صورت Link Data بر روی سایت WTLab .
7. ایجاد ارتباط بین سوره ها، آیه ها و ترجمه های مختلف آن ها.
8. تعیین مفاهیم برای هر سوره و هر آیه به صورت دستی و یا با Text Mining و به دنبال آن، تعیین ارتباط بین لغات، آیه ها، سوره ها، جزء ها و …. با اطلاعات موجود در وب.
به عنوان مثال:
لغات کلیدی ==>> دیکشنری های مختلف آنلاین بر روی وب به زبان های مختلف.
مفاهیم پایه ==>> اطلاعات موجود و مرتبط در Wikipedia .
اسامی جغرافیایی ==>> Wikipedia و Geonames .
اسامی تاریخی ==>> ….
اسامی خاص ==>> ….
9. با بهره گیری از دانش هوشمند متن كاوي (Text mining) بر روی پيكره هاي متني برچسب گذاري شده قرآن کریم، سعی در تبيين اعجاز زباني قرآن كريم با دستيابي به لايه هاي نامشهود زباني اين متن الهي خواهیم داشت.
جزئیات پیاده سازی:
ما در این پروژه نیازمند تعریف و طراحی دو آنتولوژی هستیم:
1. یک آنتولوژی برای سوره
در این آنتولوژی، بیشتر متا داده ها و اطلاعات کلی را می آوریم:
از جمله مکی و مدنی بودن سوره، تعداد آیات، تعداد آیات سجده، شروع و پایان صفحات برای هر سوره مطابق با قرآن عثمان طه، …
2. یک آنتولوژی برای آیات
در این آنتولوژی، متن آیه را به همراه ترجمه ی آن خواهیم داشت. به علاوه ی شمارنده برای هر کدام از آیات که مثلا تعداد تکرار کلمات، حروف، اعراب، نقاط و … را در خود نگه دارد. (tf-idf)
کارهای فعلی:
یک XML قرآنی داریم که کامل نیست که بایستی در ابتدا آن را با توجه به نیاز خودمان تکمیل نماییم و متن موجود در آن را به صورت جزء به جزء، سوره به سوره و آیه به آیه تفکیک نماییم.
تبدیل XML قرآنی به قالب RDF (نوشتن برنامه توسط Jena ، پارس کردن سند XML و تبدیل آن به RDF)
– تخصیص URL برای هر سوره.
http://wtlab.um.ac.ir/LinkData/Quran/1
– تخصیص URL برای هر آیه.
http://wtlab.um.ac.ir/LinkData/Quran/1/1
– انتشار داده ها به صورت Link Data بر روی سایت WTLab.
در ادامه جزئیات پیاده سازی:
– مشخص کردن موضوعات مندرج در قرآن کریم
– دسته بندی موضوعات و مشخص کردن رابطه بین آنها
– ساخت آنتولوژی موضوعات و مفاهیم قرآن
– منتسب کردن آیات به مفاهيم
– تعیین مفاهیم برای هر سوره و هر آیه به صورت دستی و یا با Text Mining و به دنبال آن، تعیین ارتباط بین لغات، آیه ها، سوره ها، جزء ها و …. با اطلاعات موجود در وب.
– پرسش و استنتاج