1- مفاهیم پایه پردازش زبان طبیعی کتاب Foundations of Statistical Natural Language Processing این کتاب در سال 1999 توسط انتشارات MIT منتشر شده و یکی از منابع اصلی پردازش زبان طبیعی در دانشگاهها است. این کتاب شامل 680 صفحه در قالب 4 بخش و 16 فصل هست. بخش اول، مربوط به بیان مقدمات، مفاهیم و پیشنیازهای پردازش زبان طبیعی است. ... ادامه مطلب »
نتیجه جستجو برای : بهم
پیکره گروههای نحوی استاندارد برای تجزیه سطحی جملات فارسی [منتشر نشده]
کد داده: D3941124a | ثبت در مرجع: ۲۴ بهمن ۱۳۹۴ | تعداد بازدید: ۲۰۳۶ پیکرهٔ حاضر شامل تعداد ۸۴۰۰ جملهٔ برگرفته از پیکرهٔ متنی زبان فارسی است که در قالب استاندارد تجزیه نحوی سطحی یا همان فرمت IOB برچسبگذاری شده است. گروههای برچسبخورده در این پیکره به ترتیب فراوانی عبارتند از گروه اسمی، گروه حرف اضافه، گروه فعلی، گروه حرف ... ادامه مطلب »
پیکره زبانآموز فارسی پی.ال.سی [منتشر نشده]
کد داده: D3941121a | ثبت در مرجع: ۲۲ بهمن ۱۳۹۴ | تعداد بازدید: ۱۸۴۳ پیکرهٔ زبانآموز فارسی با عنوان PLC (برای Persian Learner Corpus) مجموعهای است شامل تعداد ۱۵۰ متن نگارشی که به صورت نمونه و تصادفی از میان بایگانی انشاهای فارسیآموزانی که از کشورهای مختلف با سابقهٔ زبان اول مختلف (ترکی، هندی، انگلیسی، عربی، چینی و …) بودهاند انتخاب ... ادامه مطلب »
پیکره موازی فارسی انگلیسی متون مذهبی [منتشر نشده]
کد داده: D3941119a | ثبت در مرجع: ۱۹ بهمن ۱۳۹۴ | تعداد بازدید: ۱۱۱۱۰ پیکرهٔ حاضر مجموعهای است از متون مذهبی شامل قرآن، انجیل، رسالههای عملیه، سایر کتب مذهبی، وبگاههای مذهبی و … به دو زبان فارسی و انگلیسی که در سطح جمله موازیسازی شدهاند. حجم پیکره حدود ۲۰ میلیون واژه برای هر زبان است. مالکیت معنوی: علی بیکیان، مهران ... ادامه مطلب »
پیکره فارسی روز [منتشر نشده]
کد داده: D3941117a | ثبت در مرجع: ۱۷ بهمن ۱۳۹۴ | تعداد بازدید: ۱۷۹۸ پیکرهٔ فارسی روز پیکرهای خام، یکزبانه و پیوسته، شامل ۱۲۷ متن فارسی است که تمام آنها بین سالهای ۱۳۸۰ تا ۱۳۹۲ نوشته شدهاند و اغلب از میان داستانهای کوتاه و رمانها انتخاب شدهاند. این پیکره برای تألیف اثری با عنوان «فرهنگ فارسی روز» گردآوری شده و ... ادامه مطلب »
واژگان زایای زبان کردی سورانی [منتشر نشده]
کد داده: D3941111a | ثبت در مرجع: ۱۱ بهمن ۱۳۹۴ | تعداد بازدید: ۱۷۶۱ واژگان زایای زبان کردی سورانی به صورت نیمهخودکار استخراج شده است و شامل حدود ۳۵ هزار مدخل با ۲۸ برچسب مقولهٔ واژگانی است. واژگان به مجموعهٔ واژههای درون ذهن گویشوران اطلاق میگردد که یکی از منابع مهم در تولید و ساخت فناوریهای پردازش زبان طبیعی مانند ... ادامه مطلب »
مقاله و ترجمه: الگوریتم های ژنتیکی ترکیبی برای انتخاب ویژگی
چکیده در این مقاله یک ترکیب الگوریتم ژنتیک جدید برای انتخاب ویژگی پیشنهاد شده است. در این نوشتار اقدامات جستجوی محلی ابداع شده و Gaهای ترکیبیبرای یکپارچه شدن تحقیق گنجانده شده اند. اقدامات مذکور از نظر قدرت یکپارچه سازی پارامتری شده و کارایی و الزامات مربوط به زمان بندی تحلیل و مقایسه شده اند. تکنیک ترکیب بندی دو تاثیر مطلوب ... ادامه مطلب »
مقاله و ترجمه: الگوریتم های ژنتیکی ترکیبی برای انتخاب ویژگی
الگوریتم های ژنتیکی ترکیبی برای انتخاب ویژگی ادامه مطلب »
دست به خاک میزنم طلا میشه….
اگه دنیا می خواید احترام به پدر و مادر آخرت می خواید احترام به پدر و مادر کار و پول میخواید احترام به پدر و مادر رضایت خدا و اهل بیتش را می خواید احترام به پدر و مادر اگه همسر می خواید احترام به پدر و مادر احترام به پدر و مادر کلید خوشبختی از حاج آقای دارستانی توضیحات سخنراني ... ادامه مطلب »
مدیریت دانش چیست؟
پکیج فایل های Word مدیریت دانش شامل 9 مقاله فارسی زیر: مقاله اول: مديريت دانش؛ تعاريف و مفاهيم – فایل Word شامل 8 صفحه مدیریت دانش، رویکرد کلیدی در حل مشکلات تجاری نظیر رقابت پذیری، کاهش سهم بازار، پارادکس بهره وری، اطلاعات اضافی و نیاز برای خلاقیت در مواجهه با شرکت های متعدد است. منطق نیاز به مدیریت دانش، بر پایۀ ... ادامه مطلب »
مدیریت دانش چیست؟
مدیریت دانش - فایلهای ورد ادامه مطلب »
کد حذف ایست واژه ها (Stop Words Remover) در زبان فارسی
کد استفاده از کتابخانه های ابزارهای پردازش متن فارسی (نرمال سازی، تشخیص جملات، تشخیص کلمات، حذف ایست واژه ها و ریشه یابی) حذف کننده کلمات ایست (Stopword Remover) در این ابزار، کلمات کم اهمیت تر و یا ایست واژه ها در صورت تایید کاربر از متون مورد پردازش، حذف میگردند. ایست واژه ها لغاتی پرکاربرد و اغلب کم اهمیتی هستند که ... ادامه مطلب »
کد حذف ایست واژه ها (Stop Words Remover) در زبان فارسی
حذف کننده کلمات ایست (Stopword Remover) ادامه مطلب »
عوامل موفقیت و شکست پروژه های IT در سازمانها
امروزه گسترش فعالیتهای بازرگانی، جهانی شدن و تغییرات وسیع تکنولوژیک در محیط سازمانها باعث گردیده که آنها برای حفظ بقاء و مزایای رقابتی خود از انعطاف پذیری لازم برخوردار باشند لازمه انعطاف پذیری تغییرات سریع است و تغییرات سریع بدون داشتن اطلاعات امکان پذیر نیست، در نتیجه اطلاعات که به عنوان یک منبع بسیار پر ارزش در کنار سایر عوامل ... ادامه مطلب »
عوامل موفقیت و شکست پروژه های IT در سازمانها
عوامل موفقیت و شکست پروژه های IT در سازمانها ادامه مطلب »
يادگيري چندبرچسبي و کاربرد در بيوانفورماتيک و دستهبندي متن
مسائل یادگیری چندبرچسبی در دنیای واقعی بسیار پرکاربرد هستند، به عنوان مثال در دستهبندی متن، هر سند ممکن است متعلق به چندین دستهی از قبل تعیین شده مثل سیاسی و سلامت باشد؛ در بیوانفورماتیک، هر ژن میتواند به چندین دستهی کاری مثل متابولیسم و سنتز پروتئین تعلق داشته باشد؛ در دستهبندی تصاویر، نیز هر تصویر ممکن است در چندین گروه ... ادامه مطلب »