عملیات داده کاوی مفید نیاز به داده های خوب و مناسب دارد. داده های مناسب جهت عملیات داده کاوی می تواند حاصل پیش پردازش درست و صحیح داده ها باشد. در واقع برای کشف دانش به کمک داده کاوی باید مقدماتی صورت گیرد که مجموعه این مقدمات را آماده سازی داده ها می گویند. از اصلی ترین عملیات آماده سازی ... ادامه مطلب »
بایگانی برچسب : خوشه بندی
داده کاوی با weka
بنابر اعلام دانشگاه MIT دانش نوین داده کاوی (Data mining ) یکی از ده دانش در حال توسعه ای است که دهه آینده را با انقلاب تکنولوژیکی مواجه می سازد. این تکنولوژی امروزه دارای کاربرد بسیار وسیعی در حوزه های مختلف است به گونه ای که امروزه حد و مرزی برای کاربرد این دانش در نظر نگرفته و زمینه ... ادامه مطلب »
کاربردهای داده کاوی
مقاله اول: چارچوب کاربردي تکنيک هاي داده کاوي در مدل سازي جرايم چکیده: داده کاوي به عنوان يکي از کاراترين ابزارهاي تحليل داده و اطلاعات، مورد توجه بسياري از محققان و پژوهشگران قرار گرفته است. کاربرد تکنيک ها و الگوريتم هاي مختلف اين ابزار در حوزه هاي مختلفي از جمله مديريت ارتباط با مشتري، مديريت و کشف فريب و هم چنين ... ادامه مطلب »
داده کاوی در شبکه های اجتماعی
مقاله اول: بررسی رفتار کاربران شبکه های اجتماعی با علم داده کاوی مطالعه موردی شبکه فیس بوک چکیده مقاله: شبکه های اجتماعی مجازی، یکی از اتفاقاتی است که به سرعت در زندگی همه کاربران وب نفوذ پیدا کرده و روز به روز جایگاه خود را بیشتر تثبیت میکند. آنچه باعث توجه و اقبال گسترده به شبکه های اجتماعی در همه ... ادامه مطلب »
مقاله و ترجمه : بررسی الگوریتم های خوشه بندی جریان های داده
ترجمه مقاله بررسی الگوریتم های خوشه بندی جریان های داده چکیده خوشه بندی جریان های داده در چند سال اخیر ، به دلیل حضور رو به رشد خود توجه زیادی به خود جلب کرده است. در خوشه بندی جریان های داده ، چالش های اضافی دیگری مانند زمان محدود ، حافظه محدود و خوشه بندی تک گذر وجود دارد. کشف ... ادامه مطلب »
خوشه بندی اسناد متنی مبتنی بر مفاهیم همسایگی و شباهت معنایی
متن کاوی فناوری ایجاد شده جهت کنترل داده های متنی در حال رشد است که در جهت برچینی اطلاعات معنی دار از متون زبان طبیعی تلاش می کند. متن کاوی یعنی جستجوی الگوها در متن غیرساخت یافته و برای کشف خودکار دانش مورد علاقه یا مفید از متن نیمه ساخت یافته استفاده می-شود [Tan 2005]. متن کاوی تقریبا معادل با ... ادامه مطلب »
كشف سرقت ادبی – تشخیص پلاگاریسم (Plagiarism)
1. كشف سرقت ادبی در متون فارسی با كمك الگوریتم SimHash خلاصه مقاله: دسترسی آسان به وب، پایگاه داده های بزرگ و به طور كلی ارتباطات از راه دور باعث شده كه سرقت ادبی به یك مشكل بزرگ برای ناشران، محققان و موسسات آموزشی تبدیل شود. در زبان انگلیسی این مسئله به طور جدی مورد اهمیت بوده و ابزارهای ... ادامه مطلب »
خلاصه ساز خودكار متون فارسی – روش ها و الگوریتم ها
مقاله اول: خلاصه سازي متون فارسي با استفاده از هستي شناسي و خوشه بندي خلاصه مقاله: يكي از مشكلات اصلي در تحقيق روي خلاصه سازي خودكار، تفسير معنايي نادرست از سند است. استفاده از دامنه دانش منحصر بفرد مي تواند اين مشكل را به طور قابل توجهي كم كند. در اين مقاله ما يك روش استخراجي مبتني بر هستي شناسي ... ادامه مطلب »