ابزارهای لازم برای پردازش متن در زبان فارسی تشخيص دهنده ي جمله: اين ابزار بايد با توجه به کاراکترهاي جداکننده ي جمله در زبان فارسي، توانايي تشخيص جملات را در متن ورودي داشته باشد. براي ايجاد اين ابزار بايد ابتدا تمامي کاراکترها، نماد ها و احياناً قواعد دستوري که باعث شکسته شدن جملات مي شوند، شناسايي گردند. با توجه به ... ادامه مطلب »
نتیجه جستجو برای : طراحی
ثبت پیکره قرآنی فرقان در مرجع دادگان زبان فارسی
پیکره متنی و زیرساختی که تحت عنوان «پیکره فرقان» برای قرآن کریم تولید گردیده است، حاصل بهرهگیری از سامانهای هوشمند است که در آزمایشگاه فناوری وب دانشگاه فردوسی مشهد، طراحی و پیادهسازی شده است. این پیکره با بیش از 587 مگابایت داده، حاوی کلیه اطلاعات قرآنی، آماری، متن و ترجمه فارسی و انگلیسی آیات و برچسبگذاری صرفی و نحوی متن ... ادامه مطلب »
پیکره قرآنی فرقان
امام علی (ع) میفرماید: “قرآن را زمانه تفسیر می کند.”در برداشت از چنین روایاتی است که علامه طباطبایی هر دهه را نیازمند تفسیری جدید از قرآن دانسته اند و بدیهی است این مهم مستلزم بهره مندی از فناوری های معاصر است. با این نگرش و در پیروی از امر امام راحل (ره) به تلاش در تنقیب قرآن، “شبکه پژوهشی قرآن ... ادامه مطلب »
همترازسازی آنتولوژی ها
تکنیکهای معنایی یکی از مهمترین مسائل در دنیای اینترنت میباشند. مسائلی از قبیل قابلیت استفاده مجدد، مجتمعسازی منابع، توصیف معنایی دادهها یا سرویسها، مستلزم به کار بردن آنتولوژی[1] در قراردادهای دو جانبه میباشند. همترازسازی آنتولوژی ها [2]به کشف تشابه بین مولفهها و روابط بین آنتولوژیهای گوناگون می پردازد. همترازسازی، عناصر کلیدی را با تعمیم معنایی ایجاد می کند. در OA باید توجه ویژهای به ... ادامه مطلب »
برچسب زنی بخش های سخن (POS)
در دستور زبان، بخش های سخن، طبقه بندی هایی زبانی از کلمات هستند که رفتار نحوی یک قسمت از جمله را بیان می دارند. به طور عموم، تمامی زبان ها دو بخش سخن فعل و اسم را دارند. بقیه بخش های سخن در زبان-های مختلف، متفاوت می باشند. از جمله مهم ترین بخش های سخن در زبان فارسی اسم، ضمیر، ... ادامه مطلب »