در دستور زبان، بخش های سخن، طبقه بندی هایی زبانی از کلمات هستند که رفتار نحوی یک قسمت از جمله را بیان می دارند. به طور عموم، تمامی زبان ها دو بخش سخن فعل و اسم را دارند. بقیه بخش های سخن در زبان-های مختلف، متفاوت می باشند. از جمله مهم ترین بخش های سخن در زبان فارسی اسم، ضمیر، ... ادامه مطلب »
نتیجه جستجو برای : برچسب ها
بهترین کتابها در زمینه پردازش زبان طبیعی
1- مفاهیم پایه پردازش زبان طبیعی کتاب Foundations of Statistical Natural Language Processing این کتاب در سال 1999 توسط انتشارات MIT منتشر شده و یکی از منابع اصلی پردازش زبان طبیعی در دانشگاهها است. این کتاب شامل 680 صفحه در قالب 4 بخش و 16 فصل هست. بخش اول، مربوط به بیان مقدمات، مفاهیم و پیشنیازهای پردازش زبان طبیعی است. ... ادامه مطلب »
فاکتورهای موثر در افزایش رتبه سایت در موتور جستجوی گوگل
در این مقاله قصد داریم آخرین و جدیدترین عوامل موثر در افزایش جایگاه سایت ها در موتور جستجوی گوگل که در واقع به سئوی سایت ها کمک می کند را بررسی نماییم. فاکتورهای موثر در رتبه گوگل بر طبق یک میلیون نتیجۀ جستجو هیچ شکی نیست که تمام کسانی که در فضای آنلاین فعال هستند، میخواهند بدانند که کدام عوامل و فاکتورهای سئو ... ادامه مطلب »
مجموعه صفات دارای برچسب قطبیت (لِکسی پرس)
کد داده: D3951016 | ثبت در مرجع: ۱۷ دی ۱۳۹۵ | تعداد بازدید: ۵۶۳ لغتنامه احساس لِکسی پرس (LexiPers)، شامل زیر مجموعهای از واژگان نسخه دوم فارسنت است که با روشی خودکار و با سه برچسب مثبت، منفی و خنثی برچسبگذاری شدهاند. فاز اول این پروژه در حال حاضر به اتمام رسیده و طی فازهای بعدی، کیفیت برچسبهای فعلی بهبود ... ادامه مطلب »
پیکره واژگان فارسی دارای برچسب قطبیت
کد داده: D3950208 | ثبت در مرجع: ۰۸ اردیبهشت ۱۳۹۵ | تعداد بازدید: ۲۳۵۵ پیکره واژگان فارسی دارای برچسب قطبیت که در آزمایشگاه سیستمهای هوشمند اطلاعات دانشگاه تهران از دو مجموعه داده تشکیل شده است: ۱. مجموعه استخراج شده از صفتهای برچسب خورده فارسی: این مجموعه از روی مجموعه صفتهای زبان فارسی استخراج شده از فارسنت ساخته شده است. هر ... ادامه مطلب »
پیکره گروههای نحوی استاندارد برای تجزیه سطحی جملات فارسی [منتشر نشده]
کد داده: D3941124a | ثبت در مرجع: ۲۴ بهمن ۱۳۹۴ | تعداد بازدید: ۲۰۳۶ پیکرهٔ حاضر شامل تعداد ۸۴۰۰ جملهٔ برگرفته از پیکرهٔ متنی زبان فارسی است که در قالب استاندارد تجزیه نحوی سطحی یا همان فرمت IOB برچسبگذاری شده است. گروههای برچسبخورده در این پیکره به ترتیب فراوانی عبارتند از گروه اسمی، گروه حرف اضافه، گروه فعلی، گروه حرف ... ادامه مطلب »
پیکره واحدهای اسمی آرمان
کد داده: D3940917a | ثبت در مرجع: ۱۸ آذر ۱۳۹۴ | تعداد بازدید: ۱۶۶۵ تشخیص واحدهای اسمی (یا تشخیص موجودیتهای نامدار) یکی از موضوعات پردازش زبان طبیعی است که نیاز به پیکره دارد. پیکرهٔ واحدهای اسمی آرمان که توسط شرکت آرمان رایان شریف تولید شده است شامل ۴۰۰ هزار کلمه (۴۹۱۷ جمله برگرفته از پیکرهٔ بیجنخان) است و سه ردهٔ ... ادامه مطلب »
کد سی شارپ مترادف های کلمات فارسی
کد سی شارپ مترادف های کلمات فارسی با استفاده از فرهنگ لغت بکار رفته در این کد، کلمات مترادف و هم معنی با هر کلمه قابل استخراج می باشد. لذا می توان از این برنامه بمنظور معناگرایی در انواع الگوریتم های پردازش متن استفاده نمود… دو بخش در این برنامه طراحی شده است. حالت اول: کلمات مترادف مستقیم برای هر ... ادامه مطلب »
کنترل های جریان داده
تحقیق به همراه اسلاید پاورپوئینت : کنترل های جریان داده بسیاری از مشکلات امنیتی امروزه ناشی از نشست داده هاست، اما نه به خاطر دسترسی ناقص، بلکه به خاطر نبودن هیچ سیاستی در مورد جریان داده ها، کنترل های جریان با حق انتشار داده ها مربوط می باشند. اگر به دنبال یک تحقیق جامع در مورد نشت داده ها و ... ادامه مطلب »
کنترل های جریان داده
کنترل های جریان داده ادامه مطلب »
آزمایشگاههای داخلی حوزه پردازش زبان طبیعی
ردیف عنوان آزمایشگاه مکان نوع خدمات حوزه کاری فعالیت آدرس سایت ۱ آزمایشگاه فناوری زبان انسانی و یادگیری ماشین دانشگاه امیرکبیر تحقیقاتی تخصصی توسعه ابزار توسعه دیتا ست ارزیابی پژوهشی مترجم ماشینی فارسی به انگلیسی و برعکس پیش_پردازشگر متون زبان فارسی ابزار شناسایی موجودیت های اسمی در متون فارسی ابزار ریشهیاب زبان فارسی ابزار برچسب زن مقوله نحوی ابزار نویسهگردانی ... ادامه مطلب »
کد حذف ایست واژه ها (Stop Words Remover) در زبان فارسی
کد استفاده از کتابخانه های ابزارهای پردازش متن فارسی (نرمال سازی، تشخیص جملات، تشخیص کلمات، حذف ایست واژه ها و ریشه یابی) حذف کننده کلمات ایست (Stopword Remover) در این ابزار، کلمات کم اهمیت تر و یا ایست واژه ها در صورت تایید کاربر از متون مورد پردازش، حذف میگردند. ایست واژه ها لغاتی پرکاربرد و اغلب کم اهمیتی هستند که ... ادامه مطلب »
کد استفاده از کتابخانه های ابزارهای پردازش متن فارسی
کد استفاده از کتابخانه های ابزارهای پردازش متن فارسی در این کد که به زبان سی شارپ نوشته شده است چگونگی استفاده از کتابخانه های ابزارهای پردازش متن فارسی زیر آورده شده است: – نرمالسازی متون فارسی – Normalizer – تشخیص جملات – Sentence Spliter – تشخیص کلمات – Tokenizer – ریشه یابی کلمات – Stemmer – برچسب زنی نحوی کلمات ... ادامه مطلب »
يادگيري چندبرچسبي و کاربرد در بيوانفورماتيک و دستهبندي متن
مسائل یادگیری چندبرچسبی در دنیای واقعی بسیار پرکاربرد هستند، به عنوان مثال در دستهبندی متن، هر سند ممکن است متعلق به چندین دستهی از قبل تعیین شده مثل سیاسی و سلامت باشد؛ در بیوانفورماتیک، هر ژن میتواند به چندین دستهی کاری مثل متابولیسم و سنتز پروتئین تعلق داشته باشد؛ در دستهبندی تصاویر، نیز هر تصویر ممکن است در چندین گروه ... ادامه مطلب »
يادگيري چندبرچسبي و کاربرد در بيوانفورماتيک و دستهبندي متن
یادگیری چندبرچسبی و کاربرد در بیوانفورماتیک و دستهبندی متن ادامه مطلب »
پیکره – پایگاه دادههای زبان فارسی [منتشر نشده]
کد داده: D3921014a | ثبت در مرجع: ۱۴ دی ۱۳۹۲ | تعداد بازدید: ۲۴۹۵ پایگاه دادههای زبان فارسی مجموعهای است از متون مختلف فارسی که بخشی از آن دارای نشانهگذاریهایی از جمله شناسنامه متن، برچسبهای دستوری، آوایی، ریشهای و معنایی است. این دادگان که در پژوهشگاه علوم انسانی و مطالعات فرهنگی تهیه شده است مجهز به نرمافزارهای اختصاصی جستجو، تقطیع ... ادامه مطلب »