کد داده: D3911105c | ثبت در مرجع: ۰۷ بهمن ۱۳۹۱ | تعداد بازدید: ۲۰۵۶ این داده نسخه رقومی کتاب «فرهنگ طیفی» با طبقهبندی بر اساس ارتباط معنایی ۴۵ هزار لغت و ۹۲ هزار معنی و تداعی آن لغات است. کتاب فرهنگ طیفی نخستین تزاروس طبقهبندی لغات و اصطلاحات رایج زبان فارسی است که به صورت طبقهبندی شده، ذیل ۹۹۱ مقوله ... ادامه مطلب »
نتیجه جستجو برای : پیکره
پیکره – واژگان زایای زبان فارسی
کد داده: D3911105a | ثبت در مرجع: ۰۷ بهمن ۱۳۹۱ | تعداد بازدید: ۲۵۰۵ واژگان زایای زبان فارسی واژگانی است شامل حدود ۵۵هزار مدخل که هر مدخل دارای اطلاعات مربوط به صورت نوشتاری واژه در خط فارسی، ساخت واجی، مقولهٔ واژگانی، الگوی تکیه، و بسامد واژه میباشد. برای تهیهٔ واژگان زایا، یک پیکره متنی ۱۰میلیون کلمهای ملاک استخراج واژهها قرار ... ادامه مطلب »
پیکره – پیکره وابستگی نحوی زبان فارسی (نسخه ۱.۱.۱)
کد داده: D3911103a | ثبت در مرجع: ۲۷ اسفند ۱۳۹۳ | تعداد بازدید: ۴۰۶۲ پیکره وابستگی نحوی زبان فارسی مجموعهای است شامل حدود ۳۰ هزار جمله برچسبخورده با اطلاعات نحوی و ساختواژی. این پیکره میتواند به عنوان زیرساختی اساسی در پردازش رایانهای زبان فارسی به کار رود. مهمترین دلائل استفاده از دستور وابستگی در این پیکره نحوی عبارتند از: نتایج ... ادامه مطلب »
پیکره ارزیابی سیستم های توصیه گر – مجموعه داده Epinions
ارزيابي سيستم توصيه گر پیکره گرداوری شده حدود ۲ گیگا بایت حجم دارد، و نمونه هایی از پیکره در ادامه قابل دانلود و مشاهده است. در صورت نیاز به ارسال از طریق پست ، لطفا از طریق پیامک یا ایمیل زیر به ما اطلاع دهید تا پس از دریافت آدرس پستی شما، در صورتیکه در تهران هستید با پیک موتوری و ... ادامه مطلب »
پیکره متنی بی جن خان
دکتر محمود بی جن خان پيكره بيجنخان، در آزمايشگاه زبانشناسي دانشگاه تهران نگهداري ميشود. اين پيكره، از برخي اخبار روزنامهها و متون معمولي جمعآوري شده است. يكي از ويژگيهاي اين پيكره اين است كه هر سند در اين مجموعه داراي يك عنوان ميباشد. به عنوان مثال، اسناد تحت عناوين( سياسي، فرهنگي، اقتصادي)دستهبندي شدهاند.در اين پيكره 4300 عنوان مختلف وجود دارد. ... ادامه مطلب »
ثبت پیکره قرآنی فرقان در مرجع دادگان زبان فارسی
پیکره متنی و زیرساختی که تحت عنوان «پیکره فرقان» برای قرآن کریم تولید گردیده است، حاصل بهرهگیری از سامانهای هوشمند است که در آزمایشگاه فناوری وب دانشگاه فردوسی مشهد، طراحی و پیادهسازی شده است. این پیکره با بیش از 587 مگابایت داده، حاوی کلیه اطلاعات قرآنی، آماری، متن و ترجمه فارسی و انگلیسی آیات و برچسبگذاری صرفی و نحوی متن ... ادامه مطلب »
پیکره قرآنی فرقان – تکمیل RDF ها
تکمیل RDF های سوره ها و آیات قرآن کریم طراحي و پيادهسازي پيكره متني قرآن كريم در قالب RDF و به شكل محتواي الكترونيكي در بر گیرنده¬ی هر گونه اطلاعات مفید و سودمند برای انجام عملیات متن کاوی، اصلی ترین بخش پروژه ی ما را به خود اختصاص داده است. ما در فاز اولیه ی پروژه که با وجود وقفه ... ادامه مطلب »
پیکره قرآنی فرقان
امام علی (ع) میفرماید: “قرآن را زمانه تفسیر می کند.”در برداشت از چنین روایاتی است که علامه طباطبایی هر دهه را نیازمند تفسیری جدید از قرآن دانسته اند و بدیهی است این مهم مستلزم بهره مندی از فناوری های معاصر است. با این نگرش و در پیروی از امر امام راحل (ره) به تلاش در تنقیب قرآن، “شبکه پژوهشی قرآن ... ادامه مطلب »
بهترین کتابها در زمینه پردازش زبان طبیعی
1- مفاهیم پایه پردازش زبان طبیعی کتاب Foundations of Statistical Natural Language Processing این کتاب در سال 1999 توسط انتشارات MIT منتشر شده و یکی از منابع اصلی پردازش زبان طبیعی در دانشگاهها است. این کتاب شامل 680 صفحه در قالب 4 بخش و 16 فصل هست. بخش اول، مربوط به بیان مقدمات، مفاهیم و پیشنیازهای پردازش زبان طبیعی است. ... ادامه مطلب »
اولين همايش ملی «هوش مصنوعی و علوم اسلامی»
نظر به پيشرفتهای گستردهی هوش مصنوعی، میتوان از آن در حل برخی از مسائل دشوار یا پرهزینه در علوم اسلامی بهره گرفت و با صرفهجویی در وقت و همچنین افزایش دقت، گام بلندی در جهت پیشرفت این علوم برداشت. به علاوه با بهکارگیری ابزار قدرتمندی همچون هوش مصنوعی توسط محققین، دریچههای تازهای از مسائل جدید علمی گشوده خواهد شد. گستردگی ... ادامه مطلب »
مجموعه داده توییت های فارسی برای تشخیص شایعه
عنوان دیتاست : مجموعه داده توییت های فارسی برای تشخیص شایعه دانشگاه خواجه نصیر PRTD_KNTU ( Persian Rumor Tweets Dataset _ KNTU) گروه : شبکه اجتماعی توضیحات : این مجموعه شامل 3598049 توییت فارسی جمع اوری شده از شبکه اجتماعی توییتر است که در آن 4345 توییت شایعه به وسیله ی کاربر انسانی مشخص شده است. تعداد کاربران ارسال کننده ی توییت ها 111981 ... ادامه مطلب »
مجموعه صفات دارای برچسب قطبیت (لِکسی پرس)
کد داده: D3951016 | ثبت در مرجع: ۱۷ دی ۱۳۹۵ | تعداد بازدید: ۵۶۳ لغتنامه احساس لِکسی پرس (LexiPers)، شامل زیر مجموعهای از واژگان نسخه دوم فارسنت است که با روشی خودکار و با سه برچسب مثبت، منفی و خنثی برچسبگذاری شدهاند. فاز اول این پروژه در حال حاضر به اتمام رسیده و طی فازهای بعدی، کیفیت برچسبهای فعلی بهبود ... ادامه مطلب »
واژگان زایای زبان کردی سورانی [منتشر نشده]
کد داده: D3941111a | ثبت در مرجع: ۱۱ بهمن ۱۳۹۴ | تعداد بازدید: ۱۷۶۱ واژگان زایای زبان کردی سورانی به صورت نیمهخودکار استخراج شده است و شامل حدود ۳۵ هزار مدخل با ۲۸ برچسب مقولهٔ واژگانی است. واژگان به مجموعهٔ واژههای درون ذهن گویشوران اطلاق میگردد که یکی از منابع مهم در تولید و ساخت فناوریهای پردازش زبان طبیعی مانند ... ادامه مطلب »
مجموعه محک وب داتآیآر
کد داده: D3941015a | ثبت در مرجع: ۱۶ دی ۱۳۹۴ | تعداد بازدید: ۲۰۸۵ بازیابی اطلاعات وب (Web Information Retrieval) یک زمینه تحقیقاتی است که در آن از فنون حوزه بازیابی اطلاعات برای برطرفسازی یک نیاز اطلاعاتی در محیط وب استفاده میشود. در این نوع بازیابی علاوه بر متون میتوان از اطلاعات موجود در فراداده (Meta Data) و ساختار پیوندی ... ادامه مطلب »
آزمایشگاههای داخلی حوزه بازیابی اطلاعات
در این بخش آزمایشگاه هایی که در داخل کشور در حوزه آزمون و ارزیابی خدمات وب به ویژه در حوزه بازیابی اطلاعات و جویشگر به ارائه خدمت می پردازند، معرفی می شوند. آزمایشگاه های حوزه پردازش و بازیابی اطلاعات و خدمات وب ردیف عنوان آزمایشگاه مکان نوع خدمات حوزه کاری فعالیتها آدرس سایت ۱ آزمایشگاه تخصصی فناوری وب دانشگاه فردوسی ... ادامه مطلب »
آزمایشگاههای داخلی حوزه پردازش زبان طبیعی
ردیف عنوان آزمایشگاه مکان نوع خدمات حوزه کاری فعالیت آدرس سایت ۱ آزمایشگاه فناوری زبان انسانی و یادگیری ماشین دانشگاه امیرکبیر تحقیقاتی تخصصی توسعه ابزار توسعه دیتا ست ارزیابی پژوهشی مترجم ماشینی فارسی به انگلیسی و برعکس پیش_پردازشگر متون زبان فارسی ابزار شناسایی موجودیت های اسمی در متون فارسی ابزار ریشهیاب زبان فارسی ابزار برچسب زن مقوله نحوی ابزار نویسهگردانی ... ادامه مطلب »