نخستین شبكه ی واژگان زبان فارسی تحت عنوان فارسنت (وردنت عمومی زبان فارسی) با حمایت مرکز تحقیقات مخابرات ایران در پژوهشكدهی IT پژوهشگاه فضای مجازی و با همكاری متخصصان از هر دو حوزهی رایانه و زبان شناسی دانشگاه شهید بهشتی تهیه گردیده است. در واقع هدف ایجاد فارسنت، ايجاد يک شاخهی فارسي براي Word Net است که در تحقيقات و پژوهشهاي زبان فارسي قابل استفاده باشد ... ادامه مطلب »
بایگانی برچسب : فارسی
کارگاه برنامه نویسی چند عامله مبتنی بر مدل BDI توسط Jadex
در سالهای اخیر استفاده از مدلهای شناختی در طراحی و پیاده سازی عاملها جهت شبیه سازی محیطهای واقعی مورد توجه بسیاری از محققان و برنامه نویسان کامپیوتر قرار گرفته است. مزیت اساسی این مدلها ناشی از نزدیکی منطق آن با شیو های حل مساله توسط انسان می باشد. از جمله مدلهای شناختی پیشنهاد شده مدل مبتنی بر باور ،قصد و ... ادامه مطلب »
کارگاه فرآیند کاوی( Process Mining )
امروزه تکنیکهای فرآیند کاوی، که قادر به استخراج دانش از ثبت وقایع فرآیندها هستند، در بیشتر سیستمهای اطلاعاتی مورد استفاده قرار میگیرند. این تکنیکها شامل روشهای جدیدی برای کشف، نظارت و بهبود فرآیندها در کاربردهای مختلف هستند. دو عامل مهم برای گسترش روزافزون گرایش به سمت فرآیند کاوی وجود دارد: از طرفی حجم وقایع ثبت شده روز به روز در ... ادامه مطلب »
کارگاه آشنایی با مبانی و چالش های نظرکاوی
چکیده اعتقادات و درک ما از واقعیات و تصمیمگیریهای ما تا حد قابل توجهی وابسته به طرز تفکر و دیدگاههای سایر افراد است. اغلب افراد در فرایند تصمیمگیری (بخصوص تصمیمگیری درباره پدیدههای ناشناخته و جدید) نیاز به دانستن نظرات دیگر افرادی که با آن پدیده آشنایی دارند یا قبلاً آن پدیده را تجربه کردند، دارند. این موضوع برای مشتریان ساده ... ادامه مطلب »
کارگاه HBase و Hadoop
HBase چیست؟HBase یک پیاده سازی متن باز از ابزار Google Big Table می باشد و مانند دیتابیس های رابطه ای، داده ها در جداول ذخیره می شوند اما فرآیندهایی مانند Join و Query نویسی در آن بخوبی پشتیبانی نشده اند. البته باید به این نکته اشاره کرد که با وجود ابزار قدرتمند MapReduce ایجاد اعمالی مانند Join و پرس و ... ادامه مطلب »
کارگاه معماری موتورهای جستجو
موتور جستجو یا پیمایشگر به طور عمومی به برنامه ای گفته می شود که کلمات کلیدی را در یک سند یا بانک اطلاعاتی جستجو می کند. در اینترنت به برنامه ای گفته می شود که کلمات کلیدی موجود در فایل ها و سندهای وب جهانی ، گروه های خبری، منوهای گوفر و آرشیوهای FTP را جستجو می کند و به ... ادامه مطلب »
کارگاه پردازش زبان طبیعی
اولین گام در پردازش هر نوع داده ای شناسایی ماهیت آن است. به همین دلیل در مقدمه زبان طبیعی به مرور نظریه های فلسفه زبان خواهیم پرداخت. این نظریه ها به ما کمک می نمایند تا دریافت مناسبی از مشکلات روش های حل مسئله پیدا نماییم. اما برداشتی که از زبان طبیعی داریم با آنچه در پردازش آن رخ می ... ادامه مطلب »
کارگاه وب معنایی
با توجه به اهمیت حوزه وب معنایی به عنوان یکی از فعال ترین حوزه های تحقیقاتی، آشنایی با سبک برنامه نویسی وب معنایی و ویژگی های آن از اهمیت خاصی برخوردار است. در این کارگاه آموزشی، ابتدا وب معنایی به طور اجمالی معرفی شده و سپس چارچوب برنامه نویسی وب معنایی به همراه مولفه ها، مزایا، چالش ها و ابزار ... ادامه مطلب »
نوشتن PLUGIN فارسی برای نرم افزار پردازش متن GATE
GATE یک نرم افزار پردازش متن است که توسط تیم طراحی دانشگاه Sheffield ساخته شده است. پردازشی که توسط این نرم افزار صورت می گیرد براساس اجزاء موجود در آن، به صورت ترتیبی، صورت می گیرد. لذا قابلیت این وجود دارد که بخش های مختلف توسط کاربران و برنامه نویسان توسعه یابد و بعنوان یک جزء جدا به آن اضافه ... ادامه مطلب »
کارگاه آموزشی Gate
gate، یک نرم افزار خیلی خوب تو زمینه پردازش متن است که می توانید از سایت زیر دانلود کنید: http://gate.ac.uk GATE در دانشگاه شفیلد، در یک کتابخانه ی دیجیتال به این قصد جاگذاری شده است. GATE شامل ابزاراتی است برای برچسب زدن بر جملات. برای مثال این سیستم می تواند در داخل یک متن، نام موقعیتهای جغرافیایی، نام اشخاص و چیزهایی شبیه اینرا بیابد. ... ادامه مطلب »
فیلم آموزشی وب معنایی پروتج و جنا (protege and Jena) به زبان فارسی
باسلام یک درخواست راهنمایی از طرف دوستان هست که چندین بار تکرار شده و تصمیم گرفتم اینجا یکمی توضیح راجع به اون بدم. اون مطلب هم این هست که تفاوت بین آنتولوژی ، پروتجه و جنا چی هست. خیلی از افراد اسم این سه رو با هم میشنون و زیاد روشن نیست براشون این سه مفهوم. در ادامه هر کدوم ... ادامه مطلب »
گزارش دوره آموزش سریع میکروکنترلر AVR به زبان فارسی
در پکیج AVR ، پنج فایل زیر وجود دارد… 1. گزارش دوره آموزشی AVR به زبان ساده – زبان فارسی – 53 صفحه دانلود تحقیق آماده، دانلود رایگان، گزارش دوره آموزشی AVR به زبان ساده – زبان فارسی – 53 صفحه ، آموزش رایگان، آموزش به زبان فارسی، آموزش کامل، مرجع کامل، آموزش گام به گام، یادگیری، … ———————————- 2. ... ادامه مطلب »
مستند توضیحات ابزارهای لازم برای پردازش متن در زبان فارسی
ابزارهای لازم برای پردازش متن در زبان فارسی تشخيص دهنده ي جمله: اين ابزار بايد با توجه به کاراکترهاي جداکننده ي جمله در زبان فارسي، توانايي تشخيص جملات را در متن ورودي داشته باشد. Tokenizer: ابزاري براي شکستن يک متن بر اساس واحدهاي با معني مانند کلمه، پاراگراف، نمادهاي معنادار مانند space و tab و … . ل ... ادامه مطلب »
خلاصهسازی گزینشی چندسندی متون فارسی
در این پایاننامه، یک روش مبتنی بر خوشهبندی برای خلاصهسازی چندسندی متون پیشنهاد شده است. یک سامانهی خلاصهسازی گزینشی چندسندی، خلاصهسازی است که چند سند را به عنوان ورودی میگیرد و خلاصهای تولید میکند که گزیدهای از جملههای سندهای اولیه است. اگر چه روش پیشنهادی محدود به حوزه نیست، اما ارزیابی آن روی یک مجموعه از خبرهای ورزشی فارسی صورت ... ادامه مطلب »
ایست واژه ها (Stop words) در زبان فارسی و انگلیسی
ایست واژه ها (Stop words) ایست واژه ها لغاتی هستند که علی رغم تکرار فروان در متن، از لحاظ معنایی دارای اهمیت کمی هستند مثل “اگر”، “و”، “ولی”،”که” و غیره. در نگاه اولیه کلمات ربط و تعریف، ایست واژه به نظر می آیند؛ در عین حال بسیاری از افعال، افعال کمکی، اسم ها، قیدها و صفات نیز ایست واژه شناخته ... ادامه مطلب »
مقالات فارسی پردازش زبان طبیعی NLP – سری دوم
در این قسمت تعدادی مقاله فارسی در مورد پردازش زبان طبیعی زبان فارسی با موضوعات زیر ارائه می گردد: تمام فایل ها به صورت پی دی اف و در قالب مقاله کنفرانسی می باشد. مقالات دارای بخشهای متداول در تمامی مقالات کنفرانسی شامل چکیده، مقدمه، کارهای انجام شده، روش پیشنهادی ، ارزیابی و نتیجه گیری می باشد. (با ذکر تمامی منابع ... ادامه مطلب »