کد داده: D3920121a | ثبت در مرجع: ۲۳ فروردین ۱۳۹۲ | تعداد بازدید: ۲۵۳۰ پیکره متنی زبان فارسی، مجموعهای از متون نوشتاری و گفتاری زبان فارسی به صورت رسمی است که از منابع واقعی همچون روزنامهها، سایتها و مستنداتِ از قبل تایپ شده، جمعآوری شده، تصحیح گردیده و برچسب خورده است. حجم این دادگان حدوداً ۱۰۰ میلیون کلمه است و ... ادامه مطلب »
نتیجه جستجو برای : پردازش زبان های طبیعی
پیکره – دادگان صوتی هجاهای فارسی
کد داده: D3911203a | ثبت در مرجع: ۰۵ اسفند ۱۳۹۱ | تعداد بازدید: ۱۸۹۰ دادگان گفتاری حاضر شامل حدود ۵۸۰۰ فایل صوتی هجاهای زبان فارسی است که توسط پژوهشکده پردازش هوشمند علائم برای یک برنامه بازسازی گفتار فارسی از نوع بازسازی گفتار به شیوه همگذاری طراحی شده است. بخش اعظم هجاها از صورت واجنویسیشده دادگان بزرگ زبان فارسی گفتاری «فارسدات بزرگ» ... ادامه مطلب »
پیکره – واژگان زایای زبان فارسی
کد داده: D3911105a | ثبت در مرجع: ۰۷ بهمن ۱۳۹۱ | تعداد بازدید: ۲۵۰۵ واژگان زایای زبان فارسی واژگانی است شامل حدود ۵۵هزار مدخل که هر مدخل دارای اطلاعات مربوط به صورت نوشتاری واژه در خط فارسی، ساخت واجی، مقولهٔ واژگانی، الگوی تکیه، و بسامد واژه میباشد. برای تهیهٔ واژگان زایا، یک پیکره متنی ۱۰میلیون کلمهای ملاک استخراج واژهها قرار ... ادامه مطلب »
پیکره – پیکره وابستگی نحوی زبان فارسی (نسخه ۱.۱.۱)
کد داده: D3911103a | ثبت در مرجع: ۲۷ اسفند ۱۳۹۳ | تعداد بازدید: ۴۰۶۲ پیکره وابستگی نحوی زبان فارسی مجموعهای است شامل حدود ۳۰ هزار جمله برچسبخورده با اطلاعات نحوی و ساختواژی. این پیکره میتواند به عنوان زیرساختی اساسی در پردازش رایانهای زبان فارسی به کار رود. مهمترین دلائل استفاده از دستور وابستگی در این پیکره نحوی عبارتند از: نتایج ... ادامه مطلب »
فارس نت (وردنت عمومی زبان فارسی)
شبکه واژگان فارسی - فارس نت ادامه مطلب »
کارگاه آشنایی با مبانی و چالش های نظرکاوی
چکیده اعتقادات و درک ما از واقعیات و تصمیمگیریهای ما تا حد قابل توجهی وابسته به طرز تفکر و دیدگاههای سایر افراد است. اغلب افراد در فرایند تصمیمگیری (بخصوص تصمیمگیری درباره پدیدههای ناشناخته و جدید) نیاز به دانستن نظرات دیگر افرادی که با آن پدیده آشنایی دارند یا قبلاً آن پدیده را تجربه کردند، دارند. این موضوع برای مشتریان ساده ... ادامه مطلب »
کارگاه پردازش زبان طبیعی
اولین گام در پردازش هر نوع داده ای شناسایی ماهیت آن است. به همین دلیل در مقدمه زبان طبیعی به مرور نظریه های فلسفه زبان خواهیم پرداخت. این نظریه ها به ما کمک می نمایند تا دریافت مناسبی از مشکلات روش های حل مسئله پیدا نماییم. اما برداشتی که از زبان طبیعی داریم با آنچه در پردازش آن رخ می ... ادامه مطلب »
نوشتن PLUGIN فارسی برای نرم افزار پردازش متن GATE
GATE یک نرم افزار پردازش متن است که توسط تیم طراحی دانشگاه Sheffield ساخته شده است. پردازشی که توسط این نرم افزار صورت می گیرد براساس اجزاء موجود در آن، به صورت ترتیبی، صورت می گیرد. لذا قابلیت این وجود دارد که بخش های مختلف توسط کاربران و برنامه نویسان توسعه یابد و بعنوان یک جزء جدا به آن اضافه ... ادامه مطلب »
کارگاه آشنایی با مبانی و چالش های نظرکاوی
کارگاه آشنایی با مبانی و چالش های نظرکاوی ادامه مطلب »
نوشتن PLUGIN فارسی برای نرم افزار پردازش متن GATE
نوشتن PLUGIN فارسی برای نرم افزار پردازش متن GATE ادامه مطلب »
روشهای سرقت ادبیو الگوریتمهای آن
با توجه به طبقه بندیMaurer و همکارانش ]27[ روش های تشخیص سرقت ادبی به سه دسته تبدیل می شود.در دسته اول تلاش برای بدست آوردن سبک نگارش نویسنده و پیدا کردن هرگونه تغییر ناسازگار در این سبک است.ساختار دسته دوم بر اساس مقایسه چندین سند و شناسایی قطعات مشترک است، دسته سوم یک سند را به عنوان ورودی می گیرد ... ادامه مطلب »
هوش مصنوعی و سيستم های خبره و سيستم هاي فازي
سیستمهای خبره یكی از شاخه های هوش مصنوعی است كه همچون یك فرد خبره با استفاده وسیع از دانش تخصصی به حل مسائل می پردازد. فرد خبره كسی است كه در یك زمینه خاص دارای تجربه و مهارت و در یك كلام خبرگی است. فرد خبره مسائلی را حل می كند كه یا توسط دیگران قابل حل نیست و یا ... ادامه مطلب »
هوش مصنوعی و سيستم های خبره و سيستم هاي فازي
هوش مصنوعی و سيستم های خبره و سيستم هاي فازي ادامه مطلب »
روشهای سرقت ادبیو الگوریتمهای آن
روش, الگوریتم, تشخیص, سرقت, ادبی, تحلیل, سبک, نویسنده, مقایسه, سند, جستجو, وب, معیار, شباهت, دو, متن ادامه مطلب »
مستند توضیحات ابزارهای لازم برای پردازش متن در زبان فارسی
ابزارهای لازم برای پردازش متن در زبان فارسی تشخيص دهنده ي جمله: اين ابزار بايد با توجه به کاراکترهاي جداکننده ي جمله در زبان فارسي، توانايي تشخيص جملات را در متن ورودي داشته باشد. Tokenizer: ابزاري براي شکستن يک متن بر اساس واحدهاي با معني مانند کلمه، پاراگراف، نمادهاي معنادار مانند space و tab و … . ل ... ادامه مطلب »
چگونگی محاسبه میزان تشابه معنایی مقالات برای متون زبان انگلیسی
چگونگی محاسبه میزان تشابه معنایی مقالات برای متون زبان انگلیسی در نخستین گام از طراحی و پیادهسازی ابزار مورد نظر برای محاسبه میزان تشابه متون، بایستی بسیاری از ابزارهای پایهای پردازش زبان انگلیسی از ابتدا و با رویکردی اصولی منطبق بر قواعد گرامری و نگارشی زبان انگلیسی طراحی و پیادهسازی گردد. از جملهی این ابزارها میتوان ابزار نرمالساز یا یکسانساز، ... ادامه مطلب »