جمع آوری داده از وب علوم متن کاوی اهمیت ویژه ای دارد. به همین دلیل فیلدی با نام وب اسکرپینگ در علوم متن کاوی وجود دارد. کتاب زیر به موضوع وب اسکرپینگ توسط پایتون پرداخته است . این کتاب جدید در سال 2015 و در 250 صفحه چاپ شده است. Title: Web Scraping with Python: Collecting Data from the Modern ... ادامه مطلب »
نتیجه جستجو برای : استخراج
کتاب بسیار مفید درباره استخراج داده از وب
کتاب بسیار مفید درباره استخراج داده از وب ادامه مطلب »
استخراج کتاب از پایان نامه
دست نوشته ها,اشعار, داستان ها,نظریه ها ومطالب علمی خود را به کتاب تبدیل کنید با کمترین قیمت ممکن , و در حداکثر یکماه با600 هزار تومان کتاب چاپ کنید کاملا غیرحضوری انعقاد قرارداد و ارسال با ایمیل دریافت فایل با ایمیل ارسال رایگان کتاب به تمام نقاط کشور 1.اختصاص شابک (شماره استاندارد بین المللی کتاب) توسط انتشارات 2.اخذ فیپا(فهرست نویسی ... ادامه مطلب »
استخراج آنتولوژی به روش داده کاوی و کاربرد آن در تشخیص نفوذ
امروزه با گسترش شبكههاي كامپيوتري، بحث امنيت شبكه بيش از گذشته مورد توجه پژوهشگران قرار گرفته است. در اين راستا تشخيص نفوذ بهعنوان يكي از اجزاي اصلي برقراري امنيت در شبكههاي كامپيوتري شناخته ميشود كه هدف اصلي آن كنترل ترافيك شبكه و تحليل رفتارهاي كاربران میباشد. بهطور کلی در اغلب کارهای انجام گرفته در این حوزه از یک تاکسونومی جهت ... ادامه مطلب »
استخراج آنتولوژی به روش داده کاوی و کاربرد آن در تشخیص نفوذ
استخراج آنتولوژی به روش داده کاوی و کاربرد آن در تشخیص نفوذ ادامه مطلب »
خلاصه سازی خودکار چندسندی مبتنی بر استخراج مفاهیم
خلاصه سازی خودکار چندسندی مبتنی بر استخراج مفاهیم چكیده: با گسترش روز افزون حجم داده ها و اطلاعات، خلاصه سازی خودکار متون نیز با استقبال چشم گیر محققین روبرو شده است. در سال های اخیر خلاصه سازی چندسندی با اقبال بیشتری مواجه بوده است. یک سیستم خلاصه سازی چندسندی استخراجی، خلاصه سازی است که چندین سند را به عنوان ورودی ... ادامه مطلب »
خلاصه سازی خودکار چندسندی مبتنی بر استخراج مفاهیم
خلاصه سازی خودکار چندسندی مبتنی بر استخراج مفاهیم ادامه مطلب »
بهترین کتابها در زمینه پردازش زبان طبیعی
1- مفاهیم پایه پردازش زبان طبیعی کتاب Foundations of Statistical Natural Language Processing این کتاب در سال 1999 توسط انتشارات MIT منتشر شده و یکی از منابع اصلی پردازش زبان طبیعی در دانشگاهها است. این کتاب شامل 680 صفحه در قالب 4 بخش و 16 فصل هست. بخش اول، مربوط به بیان مقدمات، مفاهیم و پیشنیازهای پردازش زبان طبیعی است. ... ادامه مطلب »
انواع روشهای تحلیل رمز
تجزیه و تحلیل رمز یا شکستن رمز، به کلیه اقدامات مبتنی بر اصول ریاضی و علمی اطلاق میگردد که هدف آن از بین بردن امنیت رمزنگاری و در نهایت باز کردن رمز و دستیابی به اطلاعات اصلی باشد. در تجزیه و تحلیل رمز، سعی میشود تا با بررسی جزئیات مربوط به الگوریتم رمز و یا پروتکل رمزنگاری مورد استفاده و ... ادامه مطلب »
مقاله و ترجمه: معماری مسیریابی اینترنت اشیاء با سیستم های مستقل از اشیاء
IoT Routing Architecture with Autonomous Systems of Things معماری مسیریابی اینترنت اشیاء با سیستم های مستقل از اشیاء چکیده : این مقاله یک معماری مسیریابی آینده محور برای اینترنت اشیاء )I OT( را ارائه می دهد. این IOT یک مفهوم تازه شامل یک مفهوم جدید در مورد مجموعه ای از اشیاء با مسیریابی مشابه و شیوه های خدمات مشابه می باشد ... ادامه مطلب »
مقاله و ترجمه: معماری مسیریابی اینترنت اشیاء با سیستم های مستقل از اشیاء
IoT Routing Architecture with Autonomous Systems of Things معماری مسیریابی اینترنت اشیاء با سیستم های مستقل از اشیاء چکیده : این مقاله یک معماری مسیریابی آینده محور برای اینترنت اشیاء )I OT( را ارائه می دهد. این IOT یک مفهوم تازه شامل یک مفهوم جدید در مورد مجموعه ای از اشیاء با مسیریابی مشابه و شیوه های خدمات مشابه می باشد ... ادامه مطلب »
پیکره تشخیص خودکار جنسیت
کد داده: D3950319 | ثبت در مرجع: ۱۹ خرداد ۱۳۹۵ | تعداد بازدید: ۱۷۱۲ پیکرهٔ تشخیص خودکار جنسیت شامل دو بخش اصلی است که عبارتند از: ۱- بخش متون رسمی که با مشخص کردن جنسیت نویسندگان متون داستانی موجود در پیکرهٔ بیجنخان و داستانهای دیگر برگرفته از اینترنت به دست آمد. برای حذف تاثیر عامل جنسیت مترجم بر روی متن ... ادامه مطلب »
پیکره واژگان فارسی دارای برچسب قطبیت
کد داده: D3950208 | ثبت در مرجع: ۰۸ اردیبهشت ۱۳۹۵ | تعداد بازدید: ۲۳۵۵ پیکره واژگان فارسی دارای برچسب قطبیت که در آزمایشگاه سیستمهای هوشمند اطلاعات دانشگاه تهران از دو مجموعه داده تشکیل شده است: ۱. مجموعه استخراج شده از صفتهای برچسب خورده فارسی: این مجموعه از روی مجموعه صفتهای زبان فارسی استخراج شده از فارسنت ساخته شده است. هر ... ادامه مطلب »
واژگان زایای زبان کردی سورانی [منتشر نشده]
کد داده: D3941111a | ثبت در مرجع: ۱۱ بهمن ۱۳۹۴ | تعداد بازدید: ۱۷۶۱ واژگان زایای زبان کردی سورانی به صورت نیمهخودکار استخراج شده است و شامل حدود ۳۵ هزار مدخل با ۲۸ برچسب مقولهٔ واژگانی است. واژگان به مجموعهٔ واژههای درون ذهن گویشوران اطلاق میگردد که یکی از منابع مهم در تولید و ساخت فناوریهای پردازش زبان طبیعی مانند ... ادامه مطلب »
مجموعه محک وب داتآیآر
کد داده: D3941015a | ثبت در مرجع: ۱۶ دی ۱۳۹۴ | تعداد بازدید: ۲۰۸۵ بازیابی اطلاعات وب (Web Information Retrieval) یک زمینه تحقیقاتی است که در آن از فنون حوزه بازیابی اطلاعات برای برطرفسازی یک نیاز اطلاعاتی در محیط وب استفاده میشود. در این نوع بازیابی علاوه بر متون میتوان از اطلاعات موجود در فراداده (Meta Data) و ساختار پیوندی ... ادامه مطلب »
داده های عظیم (BIG-DATA)
Big Data چیست؟ داده های بزرگ یا عظیم داده ترجمه اصطلاح Big Data می باشد که معمولا به مجموعه از داده ها اطلاق می شود که اندازه آنها فراتر از حدی است که با نرم افزارهای معمول بتوان آنها را در یک زمان معقول اخذ، دقیق سازی، مدیریت و پردازش کرد. مفهوم «اندازه» در داده های بزرگ بطور مستمر در ... ادامه مطلب »