کد داده: D3941119a | ثبت در مرجع: ۱۹ بهمن ۱۳۹۴ | تعداد بازدید: ۱۱۱۱۰ پیکرهٔ حاضر مجموعهای است از متون مذهبی شامل قرآن، انجیل، رسالههای عملیه، سایر کتب مذهبی، وبگاههای مذهبی و … به دو زبان فارسی و انگلیسی که در سطح جمله موازیسازی شدهاند. حجم پیکره حدود ۲۰ میلیون واژه برای هر زبان است. مالکیت معنوی: علی بیکیان، مهران ... ادامه مطلب »
پیکره فارسی روز [منتشر نشده]
کد داده: D3941117a | ثبت در مرجع: ۱۷ بهمن ۱۳۹۴ | تعداد بازدید: ۱۷۹۸ پیکرهٔ فارسی روز پیکرهای خام، یکزبانه و پیوسته، شامل ۱۲۷ متن فارسی است که تمام آنها بین سالهای ۱۳۸۰ تا ۱۳۹۲ نوشته شدهاند و اغلب از میان داستانهای کوتاه و رمانها انتخاب شدهاند. این پیکره برای تألیف اثری با عنوان «فرهنگ فارسی روز» گردآوری شده و ... ادامه مطلب »
واژگان زایای زبان کردی سورانی [منتشر نشده]
کد داده: D3941111a | ثبت در مرجع: ۱۱ بهمن ۱۳۹۴ | تعداد بازدید: ۱۷۶۱ واژگان زایای زبان کردی سورانی به صورت نیمهخودکار استخراج شده است و شامل حدود ۳۵ هزار مدخل با ۲۸ برچسب مقولهٔ واژگانی است. واژگان به مجموعهٔ واژههای درون ذهن گویشوران اطلاق میگردد که یکی از منابع مهم در تولید و ساخت فناوریهای پردازش زبان طبیعی مانند ... ادامه مطلب »
مجموعه محک وب داتآیآر
کد داده: D3941015a | ثبت در مرجع: ۱۶ دی ۱۳۹۴ | تعداد بازدید: ۲۰۸۵ بازیابی اطلاعات وب (Web Information Retrieval) یک زمینه تحقیقاتی است که در آن از فنون حوزه بازیابی اطلاعات برای برطرفسازی یک نیاز اطلاعاتی در محیط وب استفاده میشود. در این نوع بازیابی علاوه بر متون میتوان از اطلاعات موجود در فراداده (Meta Data) و ساختار پیوندی ... ادامه مطلب »
مجموعه داده استاندارد وبلاگهای ایران
کد داده: D3941014a | ثبت در مرجع: ۱۵ دی ۱۳۹۴ | تعداد بازدید: ۲۱۷۵ مجموعه داده استاندارد وبلاگهای ایران (irBlogs) جهت ایجاد بستری مناسب برای تحقیق و ارائهٔ الگوریتم در زمینهٔ شبکههای اجتماعی ایرانی تولید شده است. این مجموعه شامل متون برگرفته از بیش از ۶۰۰ هزار وبلاگ (نزدیک به ۵ میلیون پست) است و گراف روابط افراد نیز برای ... ادامه مطلب »
پیکره واحدهای اسمی آرمان
کد داده: D3940917a | ثبت در مرجع: ۱۸ آذر ۱۳۹۴ | تعداد بازدید: ۱۶۶۵ تشخیص واحدهای اسمی (یا تشخیص موجودیتهای نامدار) یکی از موضوعات پردازش زبان طبیعی است که نیاز به پیکره دارد. پیکرهٔ واحدهای اسمی آرمان که توسط شرکت آرمان رایان شریف تولید شده است شامل ۴۰۰ هزار کلمه (۴۹۱۷ جمله برگرفته از پیکرهٔ بیجنخان) است و سه ردهٔ ... ادامه مطلب »
کلاس خصوصی – آموزش برنامه نویسی پردازش متن NLP
مشاوره پایان نامه کارشناسی ارشد با سلام خدمت کلیه دوستان عزیز با توجه به درخواست کمک و راهنمایی جمع زیادی از دوستان پیرامون برنامه نویسی و آموزش پردازش متن و اصرار بسیاری از دوستان مبنی بر امکان دریافت مشاوره تلفنی ، ایمیلی یا حضوری پیرامون مفاهیم این حوزه ها، چالش ها ، ایده ها و پیاده سازی مکانیزم ها و چارچوب های این ... ادامه مطلب »
ما فعالان فضای مجازی بیکار نیستیم !
💠ما فعالان فضای مجازی بیکار نیستیم ! گاهی از ما پرسیده می شود که: چرا اینقدر برای فضای مجازی وقت میگذارید، مگر بیکارید؟ ▫ما در فضای مجازی به دنبال تفریح و سرگرمی نیستیم. ▫به دنبال پر کردن اوقات فراغت هم نیستیم . ▫به دنبال اسم و رسم نیستیم. ▫به دنبال التماس دعا از مسؤلین نیستیم. ▫به دنبال ریا و خود ... ادامه مطلب »
کد سی شارپ محاسبه نرخ فشرده سازی خلاصه سازی
کد سی شارپ محاسبه نرخ فشرده سازی خلاصه سازی فرمول محاسبه نرخ فشرده سازی خلاصه سازی: ادامه مطلب »
کد سی شارپ تولید کپچا
تا کنون احتمالاً با تصویری از حروف و اعداد که عمداً کج و ناواضح رسم شدهاند در وبگاههای مختلف برخورد کردهاید و از شما خواسته شده تا آنرا به شکل صحیح خوانده و بادقت در یک جعبهٔ متن وارد کنید. اگر چنین است شما با یک کپچا سر و کار داشتهاید. کد تصویری یا کپچا برای جلوگیری از ورود روبوت ... ادامه مطلب »
دانلود گزارش کارآموزی رشته کامپیوتر و فناوری اطلاعات
در فایل پیوست گزارش مربوط به کارآموزی رشته کامپیوتر و فناوری اطلاعات آورده شده است. مشخصات فایل: تعداد صفحات: 93 صفحه فرمت فایل: doc زبان: فارسی ادامه مطلب »
مدلهاي كنترل دسترسي و کاربرد آن در XML
امروزه اطلاعات مستقر بر روي وب به سرعت در حال افزايش است و حجم بسيار زيادي از اين اطلاعات در قالب XML ظاهر شده است. يكي از مزاياي اصلي استفاده از XML ، نمايش دادههاي غير ساخت يافته است كه قابليتهاي بسياري را در اختيار كاربران ميگذارد. ويژگي غير ساختيافته بودن اطلاعات و انعطافپذيري XML باعث همهگير شدن استفاده از ... ادامه مطلب »
سیستمهای تشخیص نفوذ در شبکههای حسگر بیسیم
شبکه های حسگر بی سیم از سنسورهایی تشکیل شده است که وظیفه جمع آوری اطلاعات از محیط اطراف را بر عهده دارند. این شبکه ها به دلیل بی سیم بودن، محدودیت منابع، تحرک و پویایی و وظایف مهم و بحرانی که دارند نسبت به شبکه های دیگر دارای آسیب پذیری نسبتاً بالایی هستند. راه های مختلفی برای ایجاد امنیت در ... ادامه مطلب »
داده های عظیم (BIG-DATA)
Big Data چیست؟ داده های بزرگ یا عظیم داده ترجمه اصطلاح Big Data می باشد که معمولا به مجموعه از داده ها اطلاق می شود که اندازه آنها فراتر از حدی است که با نرم افزارهای معمول بتوان آنها را در یک زمان معقول اخذ، دقیق سازی، مدیریت و پردازش کرد. مفهوم «اندازه» در داده های بزرگ بطور مستمر در ... ادامه مطلب »
پیاده سازی مقاله تشخیص چهره برای درس یادگیری ماشین
یکی از مباحث پر کاربرد در هوش مصنوعی مباحث پردازش تصویر است مخصوصا مباحثی که در موارد تشخیص هویت وتصدیق سروکار دارند مثل تشخیص اثر انگشت , تشخیص امضا وتشخیص چهره که از جایگاهی مهمی در این مباحث برخورداراست. در قدیم برای تشخیص چهره از مدلهای هندسی ساده استفاده می شد ولی امروزه این فرایند وارد تعابیر ریاضی پیچیده شده ... ادامه مطلب »
پیاده سازی سه مقاله خوشه بندی – یادگیری ماشین
عملیات داده کاوی مفید نیاز به داده های خوب و مناسب دارد. داده های مناسب جهت عملیات داده کاوی می تواند حاصل پیش پردازش درست و صحیح داده ها باشد. در واقع برای کشف دانش به کمک داده کاوی باید مقدماتی صورت گیرد که مجموعه این مقدمات را آماده سازی داده ها می گویند. از اصلی ترین عملیات آماده سازی ... ادامه مطلب »