کتاب معماری کامپیوتر موریس مانو به همراه حل تمارین بی شک یکی از بهترین و بی نظیر منابع برای درس معماری کامپیوتر که هم اکنون در بسیاری از دانشگاه های معتبر ایران و حتی جهان تدریس می شود کتاب Computer System Archtecture یا همان معماری سیستم های کامپیوتری به نویسندگی موریس مانو است که کم و بیش هر دانشجوی کامپیوتری ... ادامه مطلب »
بایگانی برچسب : فارسی
مجموعه داده توییت های فارسی برای تشخیص شایعه
عنوان دیتاست : مجموعه داده توییت های فارسی برای تشخیص شایعه دانشگاه خواجه نصیر PRTD_KNTU ( Persian Rumor Tweets Dataset _ KNTU) گروه : شبکه اجتماعی توضیحات : این مجموعه شامل 3598049 توییت فارسی جمع اوری شده از شبکه اجتماعی توییتر است که در آن 4345 توییت شایعه به وسیله ی کاربر انسانی مشخص شده است. تعداد کاربران ارسال کننده ی توییت ها 111981 ... ادامه مطلب »
پیکره زبانآموز فارسی پی.ال.سی [منتشر نشده]
کد داده: D3941121a | ثبت در مرجع: ۲۲ بهمن ۱۳۹۴ | تعداد بازدید: ۱۸۴۳ پیکرهٔ زبانآموز فارسی با عنوان PLC (برای Persian Learner Corpus) مجموعهای است شامل تعداد ۱۵۰ متن نگارشی که به صورت نمونه و تصادفی از میان بایگانی انشاهای فارسیآموزانی که از کشورهای مختلف با سابقهٔ زبان اول مختلف (ترکی، هندی، انگلیسی، عربی، چینی و …) بودهاند انتخاب ... ادامه مطلب »
پیکره موازی فارسی انگلیسی متون مذهبی [منتشر نشده]
کد داده: D3941119a | ثبت در مرجع: ۱۹ بهمن ۱۳۹۴ | تعداد بازدید: ۱۱۱۱۰ پیکرهٔ حاضر مجموعهای است از متون مذهبی شامل قرآن، انجیل، رسالههای عملیه، سایر کتب مذهبی، وبگاههای مذهبی و … به دو زبان فارسی و انگلیسی که در سطح جمله موازیسازی شدهاند. حجم پیکره حدود ۲۰ میلیون واژه برای هر زبان است. مالکیت معنوی: علی بیکیان، مهران ... ادامه مطلب »
کد سی شارپ مترادف های کلمات فارسی
کد سی شارپ مترادف های کلمات فارسی با استفاده از فرهنگ لغت بکار رفته در این کد، کلمات مترادف و هم معنی با هر کلمه قابل استخراج می باشد. لذا می توان از این برنامه بمنظور معناگرایی در انواع الگوریتم های پردازش متن استفاده نمود… دو بخش در این برنامه طراحی شده است. حالت اول: کلمات مترادف مستقیم برای هر ... ادامه مطلب »
آزمایشگاههای داخلی حوزه بازیابی اطلاعات
در این بخش آزمایشگاه هایی که در داخل کشور در حوزه آزمون و ارزیابی خدمات وب به ویژه در حوزه بازیابی اطلاعات و جویشگر به ارائه خدمت می پردازند، معرفی می شوند. آزمایشگاه های حوزه پردازش و بازیابی اطلاعات و خدمات وب ردیف عنوان آزمایشگاه مکان نوع خدمات حوزه کاری فعالیتها آدرس سایت ۱ آزمایشگاه تخصصی فناوری وب دانشگاه فردوسی ... ادامه مطلب »
آزمایشگاههای داخلی حوزه پردازش زبان طبیعی
ردیف عنوان آزمایشگاه مکان نوع خدمات حوزه کاری فعالیت آدرس سایت ۱ آزمایشگاه فناوری زبان انسانی و یادگیری ماشین دانشگاه امیرکبیر تحقیقاتی تخصصی توسعه ابزار توسعه دیتا ست ارزیابی پژوهشی مترجم ماشینی فارسی به انگلیسی و برعکس پیش_پردازشگر متون زبان فارسی ابزار شناسایی موجودیت های اسمی در متون فارسی ابزار ریشهیاب زبان فارسی ابزار برچسب زن مقوله نحوی ابزار نویسهگردانی ... ادامه مطلب »
اولین دوره مسابقات پردازش متون فارسی (پارسی پرداز95)
اولین دوره مسابقات پردازش متون فارسی (پارسی پرداز95) [با محوریت خلاصه سازی متون خبری] آزمایشگاه فناوری وب دانشگاه فردوسی مشهد اولین دوره مسابقات سیستمهای خلاصهسازی اسناد فارسی را همزمان با کنفرانس ICCKE2016 برگزار میکند. مسابقات در دوبخش خلاصه سازی تک سندی و خلاصه سازی چندسندی برگزار خواهد شد و به تیمهای برتر جوایز ارزندهای اهدا میشود. همچنین نفرات برگزیده، امکان ثبت ... ادامه مطلب »
فیلم آموزشی برنامه نویسی وب معنایی با استفاده از Jena
آنتولوژی در حقیقت آنتولوژی یکی از پایه های اصلی وب معنایی هست. همونطور که وب سنتی بر مبنای صفحات html بنا شده. وب معنایی نیز بر مبنای فایلهای متنی به نام انتولوژی است(فایلهایی با پسوند OWL).در این فایل متنی یک سری روابط خاص وجود داره. هر شی باید داخل یک کلاس جای بگیره.کلاس ها و زیر کلاسها به روش خاصی ... ادامه مطلب »
فیلم آموزشی ایجاد و ویرایش آنتولوژی با نرم افزار پروتج
آنتولوژی در حقیقت آنتولوژی یکی از پایه های اصلی وب معنایی هست. همونطور که وب سنتی بر مبنای صفحات html بنا شده. وب معنایی نیز بر مبنای فایلهای متنی به نام انتولوژی است(فایلهایی با پسوند OWL).در این فایل متنی یک سری روابط خاص وجود داره. هر شی باید داخل یک کلاس جای بگیره.کلاس ها و زیر کلاسها به روش خاصی ... ادامه مطلب »
پیکره فارسی ارزیابی سامانههای تقلبیاب
کد داده: D3940531a | ثبت در مرجع: ۳۱ مرداد ۱۳۹۴ | تعداد بازدید: ۲۹۵ پیکره حاضر که با هدف ارزیابی سامانههای تقلبیاب تهیه شده است مشتمل بر بیش از ۱۵۰۰ سند فارسی از ویکیپدیا است که ۴۱۱ نمونه تقلب در آنها گنجانده شده است. در قسمتهای حاوی تقلب فرایندهایی چون جابجایی کلمات، حذف و اضافه نمودن کلمات و جایگزین نمودن ... ادامه مطلب »
پیکره فارسی تحلیل احساس سِنتیپِرس
کد داده: D3940423a | ثبت در مرجع: ۲۴ تیر ۱۳۹۴ | تعداد بازدید: ۶۰۲ پیکره سِنتیپِرس شامل مجموعهای از جملات فارسی با برچسبهای حاوی بار معنایی است که در پردازش زبان طبیعی و به طور مشخص در زمینه تحلیل احساس یا عقیدهکاوی کاربرد دارد. با توجه به ویژگیهای این پیکره، میتوان آن را در نوع خود اولین پیکره تحلیل احساس ... ادامه مطلب »
پیکره – پی.سی.ای.سی ۲۰۰۸ (پیکره مرجع ضمیر)
کد داده: D3940406a | ثبت در مرجع: ۰۶ تیر ۱۳۹۴ | تعداد بازدید: ۶۲۹ پیکره پی.سی.ای.سی ۲۰۰۸ (PCAC-2008 Persian Coreferentially Annotated Corpus) مجموعهای است شامل ۳۱ متن برگرفته از پیکره بیجنخان که در آن نزدیکترین مرجع اسمی ۲۰۷۹ ضمیر مشخص شده است. دسترسی به اطلاعات مربوط به مرجع ضمیر در بسیاری از کاربردهای پردازش زبان طبیعی چون ترجمه ماشینی، پرسش ... ادامه مطلب »
پیکره – لوتوس (پیکره کلمات هممرجع) [منتشر نشده]
کد داده: D3940330b | ثبت در مرجع: ۰۱ تیر ۱۳۹۴ | تعداد بازدید: ۶۰۰ پیکره لوتوس مجموعهای از ۵۰ متن نسبتاً بلند برگفته از پیکره بیجنخان است که عبارات اسمی هممرجع در آن مشخص شده است. برای مثال در جملهٔ «[پروفسور عسکرزاده] [بنیانگذار منطق فازی] است و از [او] آثار بسیاری در این زمینه منتشر شده است.» مواردی که با ... ادامه مطلب »
پیکره – وردنت فارسی حوزه فاوا [منتشر نشده]
کد داده: D3940317a | ثبت در مرجع: ۱۷ خرداد ۱۳۹۴ | تعداد بازدید: ۷۵۹ وردنت فارسی حوزه فاوا مجموعهای است شامل بیش از ۳۰.۰۰۰ مدخل واژگانی در حوزه تخصصی فاوا از مقولههای اسم، فعل، صفت و قید. در این وردنت علاوه بر روابط درون-مقولهای، روابط میان-مقولهای نیز مفاهیم را بهم پیوند میدهد و علاوه بر ویژگیهای در نظر گرفته شده ... ادامه مطلب »
پیکره – پاسخ (پیکره استاندارد سامانههای خلاصهساز)
کد داده: D3930615a | ثبت در مرجع: ۱۵ شهریور ۱۳۹۳ | تعداد بازدید: ۲۱۵۹ پیکره «پاسخ» اولین پیکره متنی برای ارزیابی خلاصهسازی تکسندی و خلاصهسازی چندسندی است که توسط آزمایشگاه فناوری وب دانشگاه فردوسی مشهد و با همکاری سازمان فناوری اطلاعات ایران تولید گردیده. این پیکره مشتمل بر دو مجموعه تکسندی و چندسندی است. در تولید این مجموعه سعی شده ... ادامه مطلب »