کد داده: D3941014a | ثبت در مرجع: ۱۵ دی ۱۳۹۴ | تعداد بازدید: ۲۱۷۵
مجموعه داده استاندارد وبلاگهای ایران (irBlogs) جهت ایجاد بستری مناسب برای تحقیق و ارائهٔ الگوریتم در زمینهٔ شبکههای اجتماعی ایرانی تولید شده است. این مجموعه شامل متون برگرفته از بیش از ۶۰۰ هزار وبلاگ (نزدیک به ۵ میلیون پست) است و گراف روابط افراد نیز برای آن تهیه شده است. علاوه بر کاربردهای ذکر شده، میتوان از این مجموعه داده برای اهداف دیگری در حوزههای بازیابی اطلاعات، پردازش زبان طبیعی و مطالعهٔ زبان فارسی استفاده کرد.
مالکیت معنوی: گروه تحقیقاتی پایگاه داده دانشکده برق و کامپیوتر دانشگاه تهران
شرایط استفاده:
– این داده رایگان بوده و استفاده از آن برای اهداف غیرتجاری آزاد است.
اطلاعات ارجاع:
– AleAhmad, A., Zahedi, M., Rahgozar, M., & Moshiri, B. (2016). irBlogs: A standard collection for studying Persian bloggers. Computers in Human Behavior, 57, 195-207.
سایر مستندات:
– ابوالفضل آل احمد، رضا بدیع، مسعود رهگذر، بهزاد مشیری. مجموعه داده irBlogs جهت تحقیق در شبکه اجتماعی وبلاگهای ایرانی. همایش تخصصی بررسی شبکه اجتماعی، تهران، مهرماه 1392.
Abolfazl AleAhmad, MohammadSadegh Zahedi, Masoud Rahgozar, Behzad Moshiri. irBlogs: a collection for research on Persian weblogs social network, 2013.