ترجمه ماشینی _ کارهای فعلی در زبان فارسی
در سال 1372، در آزمايشگاه پردازش زبان طبيعي داشنگاه صنعتي شريف، مهرنوش شمس فرد ( 1373 ) سامانه اي به نام دنا طراحي و پياده نمود. در اين سامانه با به كارگيري نظريه وابستگي مفهومي شنك ( 1975 )، جمله هاي فارسي به شبكه اي از مفهوم ها و روابط ميان آنها تبديل مي شوند.
پس از آن پروژه های متعدد دیگری در حیطه¬ی زبان فارسی در موضوعات ذیل به انجام رسیدند:
پردازش نحوی جمله ها از جمله گروه های اسمی و جمله های مرکب، طراحی و پیاده سازي بخش واژگان و نيز اركان ساختواژي، تقویت بخش استنتاج گر پروژه دنا، بررسي شيوه هاي بازنمايي معنا و انتخاب يك شيوه مناسب براي سامانه دنا 2 و پروژه های دیگری که بر روی واكافت واژه اي، واكافت ساختواژي، واكافت نحوي و واكافت معنايي متمرکز شده بودند.
در يك تحقيق ديگر نیز ماشيني كردن عمل ترجمه از يك زبان محاوره اي به زبان محاوره اي ديگر با قابلیت يادگيري ماشين به صورت خودکار مورد بررسی قرار گرفت. از آنجا كه در اين روش ترجمه، براي طراحي الگوريتم هاي ارائه شده جهت ايجاد پايگاه دانش و استنتاج دانش از آن از هيچ گونه اطلاعات پيش فرضي در زمينه چگونگي ساختار جملات زبان هاي مبدا و مقصد و نقش كلمات در جمله استفاده نشده است، مترجم حاضر مستقل از زبان هاي مبدا و مقصد، توانايي انجام عمل ترجمه از هر زبان به زبان ديگر را دارد. [7]
در حال حاضر دكتر عبدالحسن صراف زاده (رئيس دانشكده كامپيوتر و فناوري اطلاعات دانشگاه يونيتك نيوزيلند) با بهره گیری از روشهای آماری، چندین سال است که بحث ترجمه ماشینی را در دانشگاه خود همراه با یک تیم تحقیقاتی دنبال می نمایند و به نتایج تقریبا قابل قبول و رضایت بخشی نیز نائل گردیده اند. موفقیت اصلی گروهی پژوهشی- تحقیقاتی ایشان بیشتر در بخش ترجمه ماشینی انگلیسی به فارسی بوده است چرا که پیکره بسیار عظیمی را مشتمل بر 13 میلیون جمله در بخش پیکره تک زبانه خود به زبان فارسی یعنی در بخش نهایی (Persian monolingual corpuse) دارا می باشند و این امر باعث کسب نتایج بهتر آنان نسبت به ترجمه های گوگل میگردد. این در حالیست که گوگل دقیقا وضعیتی عکس این حالت دارد و متقابلا در ترجمه فارسی به انگلیسی بسیار قوی عمل می نماید. در حال حاضر در بخش (English-Persian parallel corpuse) تنها یک میلیون جمله وجود دارد که توسط نرم افزار Microsoft Aligner جمله به جمله و نظیر به نظیر align میشوند و افزایش هر چه بیشتر این پیکره نیز هر چند کاری دشوار و زمانبر است، باعث افزایش دقت ترجمه ماشینی ما خواهد شد. [8] لذا مجددا روش ترجمه ماشینی با بهره گیری از روشهای آماری به طور کامل تشریح می گردد:
ترجمه ی ماشینی آماری یکی از راههای ترجمه ی ماشینی است که در آن فرآیند ترجمه با مدلهای آماری انجام میشود. این مدلهای آماری با کمک آنالیز عبارات متنی دوزبانه است. روش آماری با روش ترجمه بر پایه دستور و ترجمه بر پایه نمونه در تضاد است. نخستین ایده ی ترجمه ی ماشینی آماری را وارن ویور در سال 1949 ارائه کرد که در آن نظریه اطلاعات کلود شانون را به کار بست. در سال 1991 این ایده توسط پژوهشگران ای بی ام در مرکز پژوهشی جی واتسون بازتعریف شد و سبب محبوبیت ترجمه ماشینی در سالهای اخیر شده است. امروزه این روش بهترین و گستردهترین روش ترجمه ی ماشینی است.
ترجمه ماشینی به روش آماری، سعی در تولید ترجمه هایی دارد که از روشهای آماری مبتنی بر پیکرههای متنی دوزبانی استفاده می کنند. همانند پیکره کانادایی هانسارد (Canadian Hansard corpus)، بایگانی انگلیسی-فرانسوی مجلس کانادا و یوروپارل(EUROPARL) و بایگانی پارلمان اروپا.
درحال حاضر این چنین پیکره هایی موجودند و نتایج ثمربخشی از ترجمه متون از نوع مشابهی، بدست می آید اما این چنین پیکره ای هنوز بسیار کمیاب است. اولین نرمافزار آماری ترجمه ماشینی، کاندید(CANDIDE) تولیدی شرکت آیبیام بود. گوگل نیز سیسترن(SYSTRAN) را برای سالهای متمادی استفاده کرد اما نهایتا در اکتبر 2007 به مترجمی آماری تغییر روش داد. به تازگی، گوگل قابلیتهای ترجمه خود را بوسیله دادن 200 میلیون کلمه از اسناد سازمان ملل بعنوان ورودی سیستم-برای تعلیم سیستم خود- بهبود بخشیده اند. وبدین سان دقت ترجمهها بهبود یافته است.[9]
اصول
ایده ترجمه ماشینی از نظریه اطلاعات سر برآورده است. سند (متن خواهان ترجمه) بر پایه احتمال(p(e|f ترجمه میشود که رشته ی e در زبان بومی (برای نمونه انگلیسی) ترجمه ی رشته ی f در زبان بیگانه (برای نمونه فرانسوی) است. معمولا، این احتمالات با استفاده از تکنیکهای برآورد پارامتر برآورد میشوند.
مزیتها
مهمترین مزیتهای ترجمه ی ماشینی آماری در برابر روشهای سنتی عبارتند از:
بهرهگیری بهتر از منابع
حجم بسیاری از قالب ماشین خوان که در زبان طبیعی گفته میشود وجود دارد.
معمولاً سامانههای ترجمه آماری مختص جفت زبان خاصی نیستند و بر هر جفت زبانی سازگارند.
سامانههای ترجمه بر پایه دستور نیازمند توسعه دستی دستورهای زبانشناسی است که میتواند پرهزینه باشد و اغلب بر دیگر زبانها سازگار نیست.
ترجمه طبیعیتر (روانتر و نزدیکتر به گفتار)
موانع و مشکلات ترجمه ماشيني در زبان فارسي
مشکلات زبان فارسی که باعث ابهام در این زمینه ترجمه ماشینی می شود به ۳ دسته تقسیم می شود. ۱-مشکلات رسم الخط فارسی: چون زبان فارسی از رسم الخط عربی استفاده می کند دارای مشکلاتی فراوان از جمله نداشتن حرکت یا آوای کوتاه(a,e,o) می باشد. همچنین رسم الخط فارسی به دلیل چسبیده بودن حروف به سختی قابل پارس کردن است. ۲- مشکلات نحوی زبان فارسی: نظیر مشکلات افعال و… ۳- استثناها: نظیر اصطلاحات و light verb و ….
در حقیقت در همة ترجمهها ـ چه وقتی که از فارسی به انگلیسی و چه وقتي كه از انگلیسی به فارسی صورت میگیرند ـ مشکلات وجود دارند. مثلاً اغلب میگویند تسلط به زبان مبداء و مقصد و موضوع ترجمه برای ترجمه کفایت میکند. به عبارتی ديگر تسلط زبانی کافی است. در حالي كه اينگونه نيست و شرايط ديگري مورد نياز هستند، شما باید تسلط فرهنگی و اجتماعی هم در كنار آن تسلط زباني داشته باشيد. بنابراين مشکلات زبانی در همه جا خودشان را نشان میدهند. در انتخاب واژگان و معادلسازی نیز ما با مشکلات متعددی روبرو هستیم. اما اینکه این مشکلات و بعضاً ضعفها محسوس یا نامحسوس هستند، یک سخن دیگر است و در این باره هم نگرشهای مختلفی وجود دارند. وقتی که شما از انگلیسی به فارسی ترجمه می کنید یک گرتهبرداری به صورت بسیار رایج و انتقال ساختهای نحوی نارایج به زبان فارسی صورت می گیرد. بنابراین لازم است در ابتدا با اجزای اصلی مورد نیاز در تجزیه و تحلیل جملات برای ترجمه ماشینی آشنا شویم.
همان طور كه در بالا توضيح داده شد، مهمترين بخش يك سامانه مترجم ماشيني، تشخيص نقش كلمات در جمله و تشخيص معناي صحيح آنها با توجه به متني است كه آن كلمه در آن قرار گرفته است. براي تشخيص معنا ي صحيح كلمات از سه روش مي توان استفاده نمود: در روش اول براي آموزش سامانه به يك مجموعه كلمات فارسي ابهام زدايي شده نياز مي باشد تا از روي آن بتوان عمل رفع ابهام براي كلمات جديد را در متن هاي مختلف انجام داد كه متأسفانه هنوز اين مجموعه به صورت يك فرهنگ فارسي قابل خواندن براي ماشين تهيه و تدوين نگرديده است. يعني اين اطلاعات به صورت دستي وجود دارند، اما نسخه رايانه اي از آنها با يك استاندارد معين براي تعريف هر كلمه و معني و نقش هاي مختلف آن وجود ندارد. بديهي است براي اين كار ابتدا با يد با يك مركز زبان شناسي معتبر، استاندارد ذخيره سازي اطلاعات و انواع آن را تدوين نمايد و سپس نسخه اي رايانه اي از اين اطلاعات جهت استفاده هاي بعدي تهيه شود.
در روش دوم نيز سامانه مستقيما از يك فرهنگ لغت استفاده مي كند، باز هم در مورد زبان فارسي اين مشكل وجود دارد كه هنوز فرهنگ هاي لغت فارسي رايانه اي با يك استاندارد مشخص تهيه نشده اند. اين در حالي است كه در زبان انگليسي فرهنگ هاي متعددي مانند net LDOCE, Word يا Roget’s International Thesaurus به صورت MRD يا نسخ قابل خواندن توسط رايانه وجود دارند كه سامانه هاي مختلف مترجم ماشيني از آنها با يكي از روش هاي رفع ابهام مذكور بهره مي جويند.
از روش سوم رفع ابهام نيز همان طور كه ديده شد صرفا براي لغات خاص و محدود فني يا پزشكي استفاده مي شود، نه براي كليه لغات فارسي و چون متأسفانه هنوز استفاده از اصطلاحات فني فارسي متداول و رايج نشده است، اين روش رفع ابهام در زبان فارسي زياد موفق نخواهد بود. از اين رو براي اينكه بتوان از يك مترجم قوي وبدون مشكل فارسي بهره مند شد، ابتدا بايد مقدمات بر شمرده را فراهم نمود و اين خود تلاش گروهي متشكل از زبان شناسان، مترجمان، اديبان و متخصان رايانه را مي طلبد كه سرآغازي خواهد شد براي رسيدن به اين هدف ملي.
آینده ترجمه ماشینی
اکنون بسیاری از صاحب نظران برآ نند که ارائه ترجمه خوب ، تنها با داشتن اشراف کامل به واژگان و قواعد نگارشی زبان های مبدأ و مقصد میسر نمی شود، بلکه نیازمند ادراک انسانی از مفاهیم گوناگونی می باشد که ماشین هرگز قادر به فهم آن نیست و نخواهد بود. از نظر برخی افراد، ماشین های ترجمه شفاهی، نرم افزارهای تبدیل کلام به آدمک های گرافیکی که به زبان اشاره صحبت می کنند و یا موبایل هایی که صحبت های شخص آن طرف خط را به زبان دیگر برمی گردانند شاید فقط در حد سرگرمی جلوه کند؛ لیکن از یاد نبریم که بسیاری از امکانات پیش پا افتاده و کاملا بدیهی زندگی امروزی ما یکصد سال پیش حتی به مخیله دانشمندان نیز راه پیدا نمی کرد.
همان طور که گفته شد منظور از ترجمه متن توسط ماشین ترجمه – به پشتوانه پیشرفت هایی که به ویژه در دهه اخیر در تحقق بخشیدن به این رؤیای پنجاه ساله به دست آمده است- فقط برگردان متن نوشتاری نیست، بلکه ترجمة نوشته به صوت، برگردان نوشته به نمایش گرافیکی زبان اشاره ، ترجمه صوت به صوت و یا ترجمه صوت به متن نیز- چه در داخل یک سیستم زبانی و چه به زبان دیگر- و وظایف دیگری از این دست نیز قرار است به عهده ماشین های مترجم گذاشته شود. به عنوان نمونه می توان به نوعی سیستم تلفن همراه طراحی شده توسط شرکت NEC اشاره کرد که برای ترجمه مکالمات تلفنی ژاپنی به انگلیسی طراحی شده است؛ یا از نرم افزارهایی یاد کرد(digital avatars) که برای کمک به ناشنوایان و یا کم شنوایان طراحی شده و مراحل تکمیلی خود را می گذراند و قرار است بتواند آنچه را که میشنود با استفاده از تصویر آدمکی که با زبان اشاره صحبت می کند، به ناشنواها منتقل نماید.
جمع بندی و نتیجه گیری
فراگيري ترجمه ماشيني عبارت اند از: واكافت واژه اي، واكافت ساختواژي، واكافت نحوي، واكافت معنايي، تشخيص نقش كلمات در جمله، تشخيص معناي صحيح كلمات ( با توجه به جمله حاوي و رفع ابهام از كلمات داراي معني مشابه و يافتن معني معادل كلمه در زبان مقصد و تبديل جمله زبان مبدا به جمله زبان مقصد با توجه به دستور زبان مقصد و در صورت نياز اعمال گشتارهاي مناسب براي تبديل جملات مقصد به شكل روساختي آن ). در اين راستا مهمترين بخش يك مترجم كه دقت در آن باعث بالا رفتن دقت كل عمل ترجمه مي گردد، رفع ابهام معنايي از كلمات جملات زبان مبدا ونيز رفع ابهام از ترجمه آنها به زبان مقصد مي باشد. براي رفع ابهام معنايي كلمات سه روش كلي وجود دارد كه عبارت اند از: ( الف ) رفع ابهام با مربي، (ب ) رفع ابهام بر مبناي فرهنگ لغت، و ( ج ) رفع ابهام بدون مربي.
اما مشكل اصلي بر سر راه رفع ابهام از كلمات فارسي اين است كه اگر از دو روش اول استفاده شود، به يك نسخه رايانه اي از مجموعه لغات همراه بانقش هاي مختلفي كه مي توانند به خود بگيرند و معاني مختلفي كه باتوجه به نقش هاي مختلف و يا همنشيني با كلمات مختلف به خود مي گيرند، نياز مي باشد كه متأسفانه اين نسخه رايانه اي و همچنين استاندارد ذخيره سازي اين دسته اطلاعات وجود ندارد كه بايد با كار گروهي متشكل از زبان شناسان، اديبان و متخصصان رايانه ايجاد و جهت سيستم هاي مترجم زبان فارسي صورت بگيرد. استفاده از روش سوم رفع ابهام نيز خاص لغات فني است كه در زبان فارسي هنوز كاملا جا نيفتاده است . بنابراين با توجه به اين كه دقت در رفع ابهام از معناي كلمات، دقت مترجم را بالا مي برد، هنوز نمي توان سامانه هاي مترجم فارسي مناسب را تهيه و از آنها بهره برداري نمود.
پیشنهادات
اولا که بایستی واژگان معنایی (WordNet) بسیار عظیمی در اختیار داشته باشیم و همچنین با توجه به اضافه شدن لغات جدید در گذر زمان به هر زبان بایستی واژگان معنایی ما بروزرسانی شود و دائما گسترش داده شود.
بایستی توجه داشت که اگر حوزه ی موضوعی متن محدود و کنترل شده باشد، کیفیت ترجمه ماشینی اساساً بهتر خواهد شد.
علاوه بر اين وجود خطاهای تايپی و يا املايی و همچنین خطاهای نحوی و نگارشی در متن میتواند در کار ترجمه ماشينی ايجاد اختلال كند. مترجمين ورزيده در رويارويی با كلمات ناشناخته يا ساختارهای پيچيده جملات، با مراجعه به منابع معتبر و با بکارگيری تجربيات و دانش فردی و يا از طرق ديگر به حل مشكل و مسأله می پردازند. در ترجمه ماشينی نيز بايد در مقابلاين گونه پديدهها ساز و كار مناسبی طراحی نمود تا سيستم به ابزار خاصی مجهز باشد تا اختلالی در امر ترجمه بوجود نيايد. بنابراین بایستی ابزارهای پیش پردازش و پس پردازش بسیار قدرتمندی طراحی گردد که متن را قبل از ورود به فاز ترجمه و همچنین خروجی نهایی را بهینه سازی و استاندارد نماید.
نام مقاله: انسان مترجم و ترجمة ماشيني: بررسي موردي مشكلات ماشين ترجمة انگليسي به فارسي «پديده»
نام نشريه: فصلنامه كتابداري و اطلاع رساني
شماره نشريه: 26 _ شماره دوم، جلد 7
پديدآور: محمدرضا فلاحتي، آزاده نعمتي
چكيده
هدف از نگارش اين مقاله آن بود تا دستكم بخشي از مشكلات ترجمه ماشيني، مشخص و ريشهيابي گردد. يافتهها حاكي از آن بود كه «پديده» در حال حاضر داراي مشكلات فراواني است كه ريشة آنها را در سه چيز ميتوان جستجو كرد: 1) نبود زبانشناسان مجرب در گروه برنامهنويسان؛ 2) نحوـ محوربودن تئوري زباني؛ 3) نبود قدرت تعقل و تفكر در ماشينهاي ترجمه. ضمناً مشخص گرديد كه مشكلات نوع اول را ميتوان با بهكارگيري نيروي متخصص رفع نمود. مشكلات نوع دوم با تجديدنظر در تئوري زباني و توجه به معنا قابل رفع است، اما- دستكم در شرايط كنوني- نميتوان قدرت تعقل و تفكر را به ماشين داد و بنابراين مشكلات مربوط به مورد 3 قابل حل نيستند. با وجود اين، نتيجهگيري شد كه براي ترجمة متون اينترنتي و حجم زيادي از اطلاعات، بويژه وقتي هدف درك كليات متن باشد، استفاده از ماشين به جاي انسان هم راحتتر است و هم سريعتر و معقولتر.
كليدواژهها: ماشين ترجمه، ترجمة ماشيني، ترجمة انساني، شيوة ميان زباني در ترجمة ماشيني، شيوة انتقال در ترجمة ماشيني، ماشين ترجمة «پديده»، ترجمة انگليسيـ فارسي
مقدمه
در آغاز اجازه دهيد ديدگاههاي مختلفي را كه دربارة بخش آغازين عنوان اين مقاله وجود دارد، باهم مرور كنيم. در يك نگاه كلي سه ديدگاه مختلف درخصوص عنوان اين مقاله هست: 1) طرفداران نظرية نبود تفاوت بين انسان مترجم و ماشين ترجمه، 2) طرفداران تفوق انسان مترجم بر ماشين ترجمه، و 3) طرفداران تفوق ماشين ترجمه بر انسان مترجم.
برخي از صاحبنظران بر اين باورند كه در ترجمه، بين انسان و ماشين تفاوت چنداني وجود ندارد. آنان ضمن اقرار به مشكلات موجود در كار ماشين ترجمه و قبول عملكرد ضعيف آن نسبت به عملكرد مترجمان متخصص، اظهار ميدارند كه در آينده ماشين ترجمه از عملكردي بهتر برخوردار خواهد شد و در توجيه ادعاي خود ميگويند كه در شرايط فعلي، رايانهها در انجام امور محاسباتي و رياضيات، نسبت به انسان از سرعت عمل بيشتري برخوردارند و به بيان ديگر انسان ابداً در اين زمينهها قادر نيست با ماشين رقابت كند. مثلاً تصور كنيد كه بخواهيم دو عدد 12394765 و 8945630 را در هم ضرب، حاصل را از 443954 كسر و نتيجه را بر 12459 تقسيم كنيم. مسلماً حتي با استفاده از كاغذ، انجام چنين كاري براي انسان چندين دقيقه بهطول خواهد انجاميد، درحالي كه تمام اين محاسبات را يك ماشين حساب ساده ميتواند با دقت لازم و تنها در چند ثانيه به انجام برساند. اين گروه از محققان، يادگيري رياضيات را دشوارتر از يادگيري زبان ميدانند و بر اين نكته تأكيد ميكنند كه در آيندهاي نزديك، رايانة جديدي را خلق خواهند نمود كه در امر ترجمه، پردازش اطلاعات و زبان از سرعت عمل و دقتي چون انسان برخوردار باشد.
طرفداران تفوق انسان مترجم بر ماشين ترجمه بر اين باورند كه چون عملكرد ذهن انسان با ماشين متفاوت است و ماشين از قدرت تصميمگيري و انتخابي كه انسان دارد، برخوردار نيست، هيچگاه نخواهد توانست بهتر از انسان يا حتي مانند انسان به ترجمه و امور مربوط به آن بپردازد.
طرفداران تفوق ماشين ترجمه بر انسان مترجم نيز بر اين باورند كه مشكلات ماشين ترجمه سالها پيش مرتفعشده و هماكنون اينگونه ماشينها در ترجمة متون مختلف ـ يا دستكم انواعي از آن ـ با مشكلي مواجه نيستند و در آيندهاي نزديك خواهند توانست بهتر از انسان به ترجمة متون مختلف بپردازند.
در اين مقاله و با ارائة مثالها و بحثهاي مختلف نشان خواهيم داد كه با توجه به پيشرفتهاي بهدست آمدة كنوني در علوم، ماشين قادر نيست مانند انسان به ترجمه بپردازد. توجه داشته باشيد كه اين گفته بدان معنان نيست كه ماشين قادر به ترجمه نيست، بلكه بر كيفيت پايينتر ترجمة ماشيني در مقايسه با ترجمة انساني تأكيد دارد.
حال نگاهي گذرا به تاريخچة كارهاي انجامگرفته در خصوص ماشين ترجمه داشته باشيم.
نگاهي كوتاه به تاريخچة ماشين ترجمه
امروزه در كتابها و مجلات معتبر دنيا مطالب فراواني به چاپ ميرسد كه به موضوع ترجمه و ترجمة ماشيني مربوط است. «هاچينز» (Huchins, W.J. 1986) و «مل باي» و «تري» (Melby. Alan & Terry, Varner C., 1995) از جمله افرادياند كه به بررسي تاريخچة ماشين ترجمه پرداختهاند. «نيرنبرگ»(Nirenburg, S. 1986) موضوعات روششناختي و نظري مرتبط با ماشين ترجمه را به تفصيل شرح ميدهد. «كي»(kay, Martin) و «گربر» (Gerber, Laurie)ميكوشند راههايي را ارائه كنند كه باعث بهبود كيفيت ترجمة ماشيني شود. «دور» (Dorr, B.J. 1993) نقش و مشكلات مربوط به واژگان را در ترجمة ماشيني موردبحث و بررسي قرار ميدهد، «دري فاس» (Dreyfus, Hubert, 1992) به ناتوانيهاي رايانه در انجام برخي امور اشاره ميكند، و…
كار بر روي ماشين ترجمه همزمان با اختراع رايانه در دهة 1940 آغاز شد. ماشينهاي ترجمة اوليه بهاينصورت طراحي شده بودند كه براي ترجمة متون مختلف، مستقماً از يك واژهنامة دوزبانه استفاده ميكردند. ترجمه نيز تنها به ترجمة واژگاني محدود ميشد و از ترجمة ساختار نحوي زبان مبدأ يا مقصد نيز خبري نبود. اين نوع روش ترجمه را مستقيم ميناميدند. با اين همه در دهه 1980 چندين سامانة ترجمه به بازار عرضه شد كه در ترجمه از روش غيرمستقيم استفاده ميكردند. علت استفاده از لفظ غيرمستقيم صرفاً بدان علت است كه اينگونه ماشينها متن را مستقيماً از زبان مبدأ به زبان مقصد ترجمه نميكنند، بلكه ابتدا متن از زبان مبدأ به يك «ميانزبان»[3] و سپس به زبان مقصد ترجمه ميشود؛ بنابراين، ترجمه در دو مرحله به انجام ميرسد. در اينگونه سيستمها برنامههايي تعبيه شده تا به شناسايي ساختار واژه و جمله، و واژهها و عبارات مبهم بپردازند.
روش غيرمستقيم داراي انواعي است كه از آن جمله ميتوان به دو شيوة «ميانزباني» و «انتقال»[4] اشاره كرد. در ادامه به صورت اجمالي به معرفي اين دو روش ميپردازيم.
1. روشهاي ترجمة ميانزباني و انتقال
1ـ1. روش انتقال: متن مبدأ ـ ـ تجزيه ـ ـ ساختار بينابيني متن مبدأ ـ ـ انتقال ـ ـ ساختار بينابيني متن مقصد ـ ـ تركيب ـ ـ متن مقصد
1ـ2. روش ميانزباني: متن مبدأ ـ ـ تجزيه ـ ـ ميانزبان ـ ـ تركيب ـ ـ متن مقصد
در روش انتقال، ساختار بينابيني معمولاً كار تجزيه و تحليل دستوري متن را برعهده دارد و هربار ميتواند تنها يك جمله را بررسي كند. از سويي ديگر، روش ميانزباني، متن را بدون توجه به زباني خاص مورد تجزيه و تحليل قرار دهد. مزيت روش ميانزباني اين است كه ميتوان با صرف هزينههاي نسبتاً پايين، زبانهاي جديدي را نيز به ماشين ترجمه اضافه كرد. اين كار صرفاً با استفاده از قوانيني تحقق مييابد كه بين زبان جديد و «ميانزبان» برقرار است.
اما در ديدگاه انتقال، حيطة كار اين قوانين و قواعد، زبان جديد و ديگر زبانهاي موجود در ماشين ترجمه ميباشد. در روش انتقال، تنها بين دو زبان مبدأ و مقصد مقايسه به عمل ميآيد. در اين مقايسه، واحدهاي واژگاني و ساختارهاي نحوي دو زبان با هم مقايسه ميشوند؛ سپس با استفاده از قواعد انطباقي سعي ميشود ساختار بينابيني زبان مبدأ به ساختاري مشابه در زبان مقصد تبديل شود (Tusjii, 1990). اين قواعد همراه با ديگر اطلاعات معنايي و …، در لغتنامهها يا پايگاههاي دانش ذخيره ميشوند. در شيوة انتقال، عمق و ميزان تجزيه و تحليل از پيش مشخص نيست، بلكه به ميزان قرابت و نزديكبودن دو زبان بستگي دارد: هرچه دو زبان به هم نزديكتر باشند، از عمق تجزيه و تحليل نيز به همان ميزان كاسته خواهد شد.
اما براي اين كه بتوانيم به ترجمهاي كيفي دست يابيم، بايد پا را از تجزيه و تحليل نحوي يا تجزيه و تحليل معنايي سطحي فراتر بگذاريم. براي انجام ترجمة كيفي، سيستم بايد بتواند معناي واقعي جمله را نيز درك كند. مثلاً جملات سادهاي چون «دانشآموز امتحان داد» و «معلم امتحان گرفت» را در دو زبان فارسي و انگليسي در نظر بگيريد. معادل اين دو جمله در انگليسي بدين قرارند:
The student took the test. The teacher gave the test
ماشين ترجمه بايد بتواند اينگونه جملات را نيز به خوبي درك كند و براي درك آنها لازم است كه درباة امتحاندادن و امتحانگرفتن در انگليسي و فارسي اطلاعاتي داشته باشد. غالباً چنين اطلاعاتي در بخشي از سيستم به نام قالبهاي حالت[5] ذخيره ميشود. در اين مرحله سيستم ترجمه براي شناسايي عناصر جمله به تجزيه و تحليل معنايي، قواعد انتقال معنايي، و قواعد ديگري نيازمند است. تجزيهگر معنايي با استفاده از نمودار نحوي، قالب حالت را توليد ميكند و مرحلة انتقال نيز «قالب حالت» استخراج شده از جمله در زبان مبدأ را به «قالب حالت» معادل در زبان مقصد تبديل ميكند.
اما در روش «ميانزباني» به تجزيه و تحليل مفصلتري نيازمنديم. نتيجة اين تجزيه و تحليل يك بازنمود انتزاعي است كه مستقل از زبان مبدأ است. مزيت اين استقلال آن است كه تركيب اجزا و شكلگيري جملة معادل در زبان مقصد ميتواند بدون شناخت زبان مبدأ صورت پذيرد. بنابراين در اين روش، اطلاعاتي ممكن است به جمله اضافه شود كه به صورت واضح و آشكار در جملة مبدأ وجود ندارد. البته افزودن اطلاعات بويژه اطلاعات معنايي و فرازباني، كاري بس دشوار و وقتگير است. اطلاعات معنايي غالباً در يك «پايگاه دانش» يا «واژهنامة مفهومي» ذخيره ميشود. «نيرنبرگ» و ديگران (Nirenberg, J., Garbonell, J.c., Tomita, M; &Goodman, K., 1992) بر اين باورند كه از اين نوع اطلاعات معنايي، در سيستم ترجمة «كيبيامتي ـ 89»[6] و براي رسيدن به بازنمودي ميانزباني كه عاري از ابهام نيز باشد استفاده شده است. براي رسيدن به اين بازنمود ميانزباني، بايد از چند مرحله گذشت: «كيبيامتي ـ 89» ابتدا و با استفاده از يك دستور نقشگراي واژگاني، تجزيه و تحليل نحوي را آغاز ميكند، سپس با استفاده از يك لغتنامة مفهومي، مدخلهاي واژگاني را به معادلهاي ميانزبانيشان ترجمه ميكند. در مرحلة بعد، پس از اعمال تغييرات ساختاري، ساختارهاي ميانزباني حاصل ميشوند و در پايان با تركيب اجزا، بازسازي جمله در زبان مقصد محقق ميشود.
همانگونه كه پيشتر ذكر شد در روش ميانزباني، افزودن زبان جديد به ماشين ترجمه بسيار راحتتر از روش انتقال است. با اين همه، تاكنون هيچ سيستم ميانزباني مطلوبي به بازار عرضه نشده و تمامي سيستمهاي ترجمة ماشيني ميانزباني كه تاكنون طراحي شدهاند، مراحل آزمايشي خود را سپري ميكنند و از اين رو حيطة كار آنها از چند صد واژه يا چندهزار پيشنمونه، فراتر نميرود. هرچند تحقيقات انجام گرفته در خصوص ميانزبان اندك نبوده، اما هنوز روش مشخصي ارائه نشده تا با استفاده از آن بتوان به يك بازنمود معنايي مستقل از زبان دست يافت. البته، درخصوص امكان دستيابي به چنين بازنمودي نيز شك و ترديد بسيار وجود دارد (Whorf, B.L., 1956; Nirenbuerg, S.et al., 1992; Hovy, E.H. & Nirenburg, J., 1992).
در سيستمهاي علمي، از روش انتقال بيشتر استفاده ميشود، چون هم سادهتر است و هم نيازي به ميانزبان ندارد. همين امر سبب گرديده تا اين روش در مقايسه با روش ميانزباني از كارآيي بيشتري برخوردار باشد. به تازگي سعي شده با تلفيق روشها و ديدگاههاي مختلف موجود، سيستمي واحد و چندموتوره ارائه گردد. به نظر ميرسد انجام اين كار بسيار ساده باشد: جملات موردنظر براي ترجمه به چندين موتور ترجمة موازي فرستاده ميشوند و در پايان، بروندادهاي موتورهاي مختلف با هم تركيب ميگردند و درنهايت، بهترين و مناسبترين بخشها انتخاب، و سپس در قالب جملات زبان مقصد، بازسازي و بازنويسي ميشوند.
امروزه تقريباً تمام ماشينهاي ترجمه از يكي از سه روش گفته شده ـ مستقيم، غيرمستقيم (ميانزباني) يا انتقال ـ استفاده ميكنند. مثلاً در ماشينهاي ترجمه «آريان»[7] و «يوروترا»[8] كه توسط كميسيون مجامع اروپايي» طراحي شدهاند از روش انتقال استفاده شده است. در اواخر دهه 1980 در ژاپن براي زبانهاي آسيايي ماشين ترجمهاي ساخته شد كه از روش ميانزباني استفاده ميكرد، اما اين پروژه با شكست مواجه شد و شايد دليل عمدة اين شكست را بتوان ساختار خاص و پيچيدگيهاي نوشتاري زبانهايي چون ژاپني، چيني، و… دانست.
تا دهه 1990 چنين تصور ميشد كه ماشينهاي ترجمه بايد در نهايت جايگزين انسان مترجم شوند و ترجمههايي را توليد كنند كه از قابليت چاپ برخوردار باشند، اما چنين تصوري هماكنون دچار تغيير و تحول شده است. امروزه ديگر هدف اصلي از ساخت ماشينهاي ترجمه، جايگزيني آنها بهجاي انسان مترجم نيست، بلكه رسيدن به ترجمههاي ارزانتر و سريعتر (آنهم در حجم بسيار زياد)، هدف نهايي اينگونه ماشينها است.
در بخش بعدي به بررسي يكي از ماشينهاي ترجمة انگليسي به فارسي خواهيم پرداخت كه مدعي است در ترجمه، واحد «جمله» را مدنظر قرار ميدهد و بنابراين از بسياري از مشكلات ترجمة واژهبهواژه بهدور است.
ماشين ترجمه «پديده»
ماشينهاي ترجمهاي كه در بخش پيشين اين مقاله دربارة آنها صحبت كرديم، قادر نبودند متون انگليسي را به فارسي ترجمه كنند، اما ماشين ترجمه «پديده» از چنين قابليتي برخوردار است. اين ماشين ترجمه مدعي است كه قادر است جملات را بهگونهاي مطلوب ترجمه نمايد. علاوه بر تايپ جملات يا متون موردنظر، ميتوان فايلي را كه به فرمت «پيدياف» يا متن[9] باشد به ماشين داد و منتظر پاسخ ماند. اين ماشين ترجمه ضمن بهرهگيري از آخرين دستاوردهاي هوش مصنوعي، قادر است 400 صفحه را تنها در يك دقيقه ترجمه كند.
«پديده» در بانك اطلاعاتي خود براي واژهها و عبارات، 000,500,1 مدخل دارد. هر مدخل معناي فارسي واژه، مفاهيم دستوري و چند عنصر ديگر را شامل ميگردد. براي ترجمة يك جمله، اين ماشين نخست آن را به واژههاي تشكيلدهنده، عبارات و نمادها تقسيم و سپس نتايج بهدست آمده را به واحدهاي دستوري، واژگاني و واژهسازي ارسال ميكند؛ سپس نتايج حاصله به يك موتور برونداد فرستاده ميشوند. اين موتور نهايي، مسئول توليد و ارائة ترجمة فارسي است.
سازندگان اين ماشين ميگويند در آيندهاي نزديك «پديده» خواهد توانست متون مختلف را از فارسي به انگليسي يا از زبانهاي ديگر به فارسي برگرداند.
عملكرد ماشين ترجمه «پديده»
براي پيبردن به چگونگي عملكرد اين ماشين ترجمه، محققان 18 نوع مختلف از جملات انگليسي را به عنوان نمونه وارد ماشين كردند و سپس به بررسي ترجمههاي فارسي توليدشده پرداختند.
در ادامه به بررسي گروههاي هجدهگانة جملات انگليسي و ترجمههاي حاصله ميپردازيم.
گروه 1. جملات ساده: جملات 1 تا 5 همگي جملات سادهاند. اين جملات را ساده ميناميم چون در ساختارشان، اصطلاح ضربالمثل، استعاره، و … وجود ندارد و در ضمن داراي ساختار دستوري پيچيدهاي نيستند، تنها داراي يك فعلاند، و…
من به سينما اين آخر هفته خواهمرفت.
1. I will go to the cinema this weekend.
او چه مژههاي بلندي را دارد!
2. What long eyelashes she has!
من به خدا ايمان دارم.
3. I believe in God.
او روي ميز رفت.
4. He went on the table.
پدرش چه سني است؟
5. How old is his father
با نگاهي به جملات انگليسي 1 تا 5 و ترجمههاي فارسي توليدشده به نتايج زير ميرسيم: ترجمة جمله 1 كاملاً قابلفهم است، با اين همه ترتيب اجزاي جمله درست نيست. معمولاً در زبان فارسي قيد زمان را در آغاز جمله ميآورند و بنابراين بيشتر سخنوران فارسي بهجاي «من به سينما اين آخر هفته خواهم رفت» ميگويند «من اين آخر هفته به سينما خواهم رفت» يا در گونههاي محاورهاي «اين آخر هفته ميرم سينما». ترجمة ارائهشده براي جمله 2 نيز كاملاً قابل درك است. اشكال اين ترجمه وجود حرف «را» پس از واژه «بلندي» است كه بايد آن را حذف نمود (او چه مژههاي بلندي دارد!). جملات 3و4 از نظر معنايي و دستوري كاملاً درستاند و نياز به هيچ تغيير يا اصلاحي نيست. جمله 5 نيز كاملاً قابل درك و دستوري است؛ با اين همه، ساختار بهكار گرفتهشده در ترجمه، ساختاري كاملاً رايج به شمار نميرود. معمولاً بهجاي «پدرش چه سني است؟» ميگوييم «پدرش چند ساله است» يا درگونههاي محاورهاي «پدرش چند سالشه؟».
نگاهي دوباره به ترجمههاي ارائهشده براي جملات 1 تا 5 نشان ميدهد كه اين ماشين قادر است جملات ساده را با موفقيت ترجمه كند و اشكالات موجود، بيشتر اشكالاتي ساختارياند و نه معنايي و بنابراين در امر ارتباط خللي ايجاد نميكنند.
گروه 2. اصطلاحات، ضربالمثلها، و…: هريك از جملات 6 تا 13 در ساختار خود داراي نوعي اصطلاح، ضربالمثل، يا ساختاري مشابهاند. براي رسيدن به معناي درست اينگونه جملات، انسان مترجم بايد از پيش با چگونگي كاربرد آنها آشنايي داشته باشد، چون معناي چنين جملاتي را نميتوان از جمع عددي معاني واژههاي تشكيلدهندة آنها مشخص كرد. مثلاً در جمله 12 منظور نويسنده اين نبوده كه فردي دماغ بزرگ دارد، چرا كه در آن صورت بايست از فعل has استفاده ميكرد، بلكه منظور او اين بوده كه بگويد «او فرد بسيار مهمي است» يا «از آن كلهگندهها است».
من به ستون فقرات را خسته بودم.
6. I was tired to the backbone.
پهناي اجازه دادن به پاهايمان.
7. Let’s stretch our legs.
او يك پتوي خيس است.
8. He is wet blanket.
او اين روزهاي بدهكار است.
9. He is in the red These days.
او به سطل لگد زد.
10. He kicked the bucket.
در حال بازي tennis فنجان چاييام است.
11. Playing tennis is my cup of tea.
او يك دماغ بزرگ است.
12. He is a big nose.
او جيم شد.
13. He took French leave.
در اين گروه، ترجمههاي ارائهشده براي جملات 6، 7 و 11 كاملاً بيمعنا و غيردستورياند. ترجمه درست و البته پيشنهادي اين سه جمله به ترتيب عبارتاند از:
6. كاملا ًخسته بودم.
7. بياييد كمي خستگي در كنيم يا كمي راه برويم.
11. تنيس ورزش مورد علاقهام است.
«پديده» در ترجمهاي كه براي جمله 11 ارائه داده واژه tennis را ترجمه نكرده (كه دليل آن ميتواند نبود معادل فارسي براي اين واژه در واژگان ماشين ترجمه باشد). ضمناً نتوانسته اسم مصدر بودن playing را تشخيص دهد. از اينرو، آن را به اشتباه فعل استمراري درنظر گرفته. علت بروز چنين اشكالي را بايد در نقص برنامههاي دستوري تعريف شده براي ماشين جستجو كرد.
جملات8 ، 10 و 12 همگي دستورياند، اما منظور اصلي گوينده يا نويسنده را نميرسانند. جملات كاملاً تحتاللفظي ترجمه شدهاند. به بيان ديگر، «پديده» به معناي اصطلاحي اينگونه جملات توجهي نكرده است. ترجمة پيشنهادي سه جملة بالا به قرار زير هستند:
8 . هميشه آية يأس ميخواند/ هميشه ضدحال ميزند.
10. او به درك واصل شد/ سقط شده.
12. او فرد مهمي است/ از آن كلهگندهها است.
جملات 9 و 13 به درستي ترجمه شدهاند، هرچند در جملة 9 «ي» بايد از آخر «روزها» حذف گردد (او اين روزها بدهكار است).
بررسي ترجمههاي ارائهشده در گروه 2 نشان ميدهد كه «پديده» در ترجمة تركيبات اصطلاحي داري اشكال است، چرا كه بهجاي معناي اصطلاحي، جز در جملة 13 به معناي تحتاللفظي واژهها توجه ميكند.
گروه 3. one: ميدانيم كه ضمير جانشين اسم ميشود. معمولاً در نوشتار يا گفتار براي جلوگيري از تكرار يك اسم، ميتوان از ضمير مناسب استفاده كرد. در انگليسي، يكي از موارد كاربرد one آن است كه جلوي تكرار اسم را ميگيرد، مانند جملة 14. ضمناً one ميتواند نقش ضمير نامشخص را نيز بازي كند. مثلاً در جملة 15، one را ميتوان «آدم» ترجمه كرد (كه ممكن است به هر فردي اشاره داشته باشد). ترجمههاي ارائهشده توسط ماشين براي اين دو جمله عبارتاند از:
قدم اول مشكلترين يك است.
14. The first step is the most difficult one.
يك با دقت هميشه بايد باشد.
15. One should always be careful
در اين مورد نيز ميبينيم كه «پديده»،one را بهصورت تحتاللفظي ترجمه كرده و نتوانسته كاربرد اين واژه را در دو جمله تميز دهد. براي اين دو جمله ترجمههاي زير پيشنهاد ميشوند:
14. قدم اول مشكلترين قدم است.
15. آدم هميشه بايد مواظب باشد.
One در جملة 14 به «قدم» و در جملة 15 به «تمام انسانها» اشاره دارد.
گروه 4. علائم اختصاري و اختصارات: جملات 16 و17 هر دو داراي علائم اختصارياند (U.S. در جملة 16 و US در جملة 17). «پديده» توانسته جملة 16 را به درستي ترجمه كند، ولي در ترجمة جملة 17 ناموفق بوده.
حكومت آمريكا
16. The U.S. government
محرك غيرشرطي حكومت
17. The US government
در اينجا املاي كلمات نقش مهمي را ايفا ميكند. از نظر «پديده» «.U.S»، وقتي پس از هر حرف بزرگ نقطهاي وجود داشته باشد، به معناي آمريكا است، ولي «US» بدون نقطه به معناي «محرك غيرشرطي» (Unstimulated) است كه به حوزة روانشناسي مربوط ميشود. بنابراين در واردكردن اطلاعات به ماشين و رعايت املاي درست كلمات بايد دقت كنيم، چرا كه برخلاف انسان، ماشين قادر نيست خطاهاي املايي كلمات را تشخيص دهد. ضمناً ماشين به بافت و متن حساس نيست و از اينرو متوجه نميشود كه «محرك غيرشرطي»، آن هم در جملهاي كه به اخبار يا سياست مربوط ميشود، ترجمة درستي براي «US» نيست. ضمناً ماشين بين «US» كه با حروف بزرگ نوشته شده و «us» (ضمير مفعولي «We» تمايز قائلشده، و به همين دليل بهجاي «محرك غيرشرطي» از ضمير «ما» استفاده نكرده است.
گروه 5. اسم مصدر و مصدر با to از فعل: دو جملة 18 و 19 هر دو دستورياند، اما از نظر معنايي تنها جملة 18 درست است.
او به ياد آورد در را قفل كند.
18. He remembered to lock the door.
او در قفلشدني را به ياد آورد.
19. He remembered locking the door
جمله 18 بدين معنا است كه فرد، قبلاً در را قفل نكرده بوده، پس رفت ودر را قفل كرد. اما معناي جملة 19 آن است كه او قبلاً در را قفل كرده بوده و قفلكردن در را بهخاطر آورده است. در جملة 19 ماشين نتوانسته تحليل نحوي درستي از جمله ارائه دهد. ماشين عبارت «locking the door» را با «the locking door» كه يك گروه اسمي است يكي فرض كرده و چون اين گروه اسمي پس از فعل آمده، آن را مفعول مستقيم دانسته. پس، از نظر ماشين «locking» صفت است و نه صورت «ing»دار فعل «lock». ترجمة درست جملة 19 از اين قرار است:
او به ياد آورد كه در را قفل كرده بود.
گروه 6. ضماير: جملات 20 و 21، هر دو دستوري و بامعنايند. اين بدان معنا است كه «پديده» ميتواند بدرستي بين انواع مختلف ضماير، از جمله ضماير مفعولي و انعكاسي تمايز قائل شود.
او او را شست.
20. He washed him.
او خودش را شست.
.21. He washed himself
هرچند ترجمة ارائهشده توسط «پديده» براي جملة 20 درست است، با ترجمة ارائهشده توسط انسان مترجم يكي نيست؛ بهاين معنا كه مترجمان غالباً به جاي آنكه ضمير «او» را دوبار پشت سرهم بياورند، به جاي يكي از ضميرها از طريق جستجوي در متن، اسم مناسب را جايگزين ميكنند ـ مثلاً «علي او را شست» يا «او علي را شست». بنابراين ميتوان گفت كه ماشين ترجمه قادر نيست از امكانات متن استفاده كند، يا به بيان ديگر، از حد جمله فراتر رود.
گروه 7. واژههاي همآوا ـ همنوشت: واژههاي همآوا ـ همنوشت واژههايياند كه داراي تلفظ و صورت نوشتاري يكساني ميباشند، مثل «شانه» كه به وسيلهاي براي مرتبكردن مو، عضوي از بدن، شانة تخممرغ، قسمت خاكي جاده، و… اشاره ميكند. بديهي است بين معاني مختلف واژة همآوا ـ همنوشت ارتباطي وجود ندارد.
بانك يك رودخانه.
22. The Bank of a river.
براي پيبردن به معناي موردنظر از واژة همآوا ـ همنوشت، توجه به متن و بافت ضروري است. ترجمة ارائهشده براي جملة 22 نادرست است، چون «پديده» قادر نيست از حد جمله فراتر رود. همين امر سبب شده تا به جاي «حاشية يك رودخانه»، «بانك يك رودخانه» را به عنوان معادل فارسي جملة 22 ارائه دهد.
گروه 8 . املا و فاصلة بين كلمات: ترجمة جملة 23 و 24 غيردستوري است. ترجمة 24 بيمعنا، و ترجمة جملة 23 معنادار است، هرچند نياز به اصلاحات ساختاري و واژگاني نيز دارد.
آيا رقص فرانسوي نشاطآور ميتوانيد؟
23. Can you cancan?
آيا ميتوانيد كنسرو بكنيد كنسرو بكنيد؟
24. Can you can can?
ماشين ترجمه براي اينكه بتواند براي جملات فوق ترجمة درستي ارائه دهد بايد بتواند بين معاني مختلف «can» تمايز قائل شود. در جملة 23 «can» در آغاز جمله فعل كمكي است، در حالي كه «cancan» در آخر جمله به نوعي رقص اشاره دارد و فعل است. (توجه داشته باشيد كه در اين مورد «cancan» بدون فاصله نوشته ميشود. البته ميتوان به جاي آن از «can the can» نيز استفاده كرد). نكتة جالب آن است كه وقتي «cancan» را با فاصله و به صورت «can can» بنويسيم، ديگر ماشين ترجمه قادر نيست اين عبارت را به صورت «رقص فرانسوي نشاطآور» ترجمه كند، بلكه هر يك از دو can موجود پس از you را جدا فرض مينمايد و به كنسرو ترجمه ميكند. بنابراين نگارش درست جملات در هنگام ورود اطلاعات به ماشين از اهميت بسياري برخوردار است. انسانهاي مترجم ميتوانند از طريق بررسي متن و بافت، اشكالات تايپي و املايي احتمالي را تشخيص دهند، منظور اصلي نويسنده را درك و ترجمه كنند، ولي ماشين از چنين قابليتي برخوردار نيست.
گروه 9. مقولة دستوري: در زبان، واژههاي بسياري وجود دارند كه بسته به بافت و جايگاه، به مقولههاي دستوري مختلفي تعلق دارند.
25. Like you I don’t like him.
به شما علاقه داشته باشيد من تي ـ را ميپوشانم به او علاقه داشته باشد.
در اين جمله «like» قبل از you به معناي «مثل و مانند» است، درحاليكه «like» پيش از him فعل است و بهمعناي «دوستداشتن». مشخص است كه «پديده» در تشخيص مقولة دستوري واژههايي كه به بيش از يك مقوله تعلق دارند، موفق نيست.
گروه 10. اسامي ساده و مركب: در انگليسي به شيوههاي مختلف ميتوان اسم مركب ساخت. يكي از اين شيوهها آن است كه اسم را با فعل تركيب كنيم، يا دو اسم را بههم بپيونديم.
ميوه علاقه داشتن را هلو پرواز ميكند.
26. Fruit flies like peach.
در جملة 26، «fruit flies» اسم مركب است و به «مگس ميوه» يا «حشرات ميوه» اشاره دارد، بنابراين بايد آن را اسم به حساب آوريم. از سويي ديگر، بدون نگاهكردن به بخش دوم يعني «like peach» و محدوديتهاي معنايي در كاربرد يك واژه، ممكن است تصور كنيم كه «fruit» فاعل است و مفرد، و «flies» فعل سومشخص مفرد. اما وقتي بخش دوم جمله را نيز مدنظر قرار دهيم به اين نتيجه ميرسيم كه فعل اصلي جمله «like» است و نه «flies» و درواقع آنچه پيش از «like» آمده اسم مركب است و نه فاعل و فعل. «پديده» به جاي آنكه «fruit flies» را اسم مركب درنظر بگيرد، «fruit» را فاعل و «flies» را فعل اصلي درنظر گرفته است، از اينرو «like» را كه پس از «flies» آمده مفعول مستقيم و «peach» را متمم فرض كرده. بنابراين «پديده» در زمينة اسامي مركب نيز عاري از خطا نيست. ترجمة پيشنهادي جمله 26 از اين قرار است: مگسهاي ميوه هلو را دوست دارند.
گروه 11. جملات سببي: جملههاي 27 و 28 هردو دستورياند، با وجود اين ميتوان معناي جمله و منظور اصلي گوينده را فهميد.
من ماشينم را داشتم شسته شده.
27. I had my car washed.
ديروز من كوتاهكردن مويم را داشتم.
28. I had my hair cut yesterday.
به نظر ميرسد ساختار جملات سببي به خوبي براي «پديده» تعريف نشده و فعل have و نقش آن در جملة سببي به درستي درك نشده است. از اينرو به جاي ترجمههايي چون «ماشينم را دادم بشويند» و «ديروز رفتم سلماني» يا «ديروز مويم را كوتاه كردم»، ترجمههاي فوق توليدشده است.
گروه 12. توالي صفات: در گروههاي اسمي ميتوان چندين صفت را پيش از اسم قرار داد كه البته در مورد ترتيب قرار گرفتن آنها قواعد خاصي وجود دارد. ضمناً در انگليسي، فعل و فاعل از نظر عدد و شخص با هم مطابقت دارند.
دو بطريهاي چوبي قرمز بزرگ
29. Two large red wooden bottles.
ترجمة جملة 29 غيردستوري، اما قابل درك است. به راستي ترتيب واقعي صفات در زبان فارسي چگونه است؟ «پديده» ترتيب صفات را از انگليسي به فارسي كاملاً برعكس كرده، يعني «large red wooden» را به «چوبي قرمز بزرگ» تبديل نموده. نكتة ديگر اينكه «پديده» مطابقت عدد با اسم را بدون تغيير، از انگليسي وارد فارسي كرده است: برخلاف انگليسي كه در آن عدد با اسم مطابقت دارد، در فارسي اسم همواره مفرد است (يك سيب، دو سيب، سه سيب، و …)، و به نظر ميرسد در اين زمينه برنامة دستوري مناسب به ماشين داده نشده.
گروه13. جملات امري: ترجمة جملة 30، دستوري است، اما معناي موردنظر گوينده يا نويسنده را منتقل نميكند.
همانجا به من كتاب را بدهيد.
30. Give me the book over there!
«پديده» در ترجمة عبارت پايان (يعني «over there» دچار اشتباه شده و آن را به جاي «كه آنجاست» به «همانجا» ترجمه كرده. ترجمة پيشنهادي اين جمله از اين قرار است: «كتابي را كه آنجا است به من بدهيد». ضمناً در فارسي معمولاً مفعول مستقيم پيش از متمم يا مفعول غيرمستقيم ميآيد. «پديده» مفعول غيرمستقيم را پيش از مفعول مستقيم آورده است. با اين همه، ماشين در ترجمة جملة امري سادهاي مثل: «Give me the book» با مشكل چنداني مواجه نبوده و آنرا به صورت «به من كتاب را بدهيد» ترجمه ميكند، هرچند در اين مورد هم بايد جاي «كتاب را» و «به من» عوض شود.
گروه 14. Nor در آغاز جملات، علامت تخفيف: احتمالاً به اين برنامه، اطلاعات دستوري مناسب دربارة «nor» داده نشده است. ضمناً بايد كلمات را به صورت كامل تايپ كرد و از تخفيف[10] پرهيز نمود.
31. I don’t like him, nor do I know him.
من تي ـ را ميپوشانم به او علاقه داشته باشد، همچنين من او را حتماً بشناسم.
«پديده» «don’t» را دو واژه به شمار ميآورد؛ «don» را فعل و «t» را مفعول ميداند و از اينرو در ترجمهاش عبارت «تي ـ را» مشاهده ميشود. ضمناً نتوانسته درك كند كه علت وارونهشدن توالي فاعل و فعل كمكي در «do I» تأكيد نيست، بلكه به خاطر وجود «nor» است. براي جملة 31 ترجمة زير پيشنهاد ميشود:
نه از او خوشم ميآيد و نه او را ميشناسم.
گروه 15. حروف تعريف معين و نامعين: يكي از كاربردهاي حرف تعريف نامعين (a يا an) عام[11]بودن آن است، يعني به تمامي اعضاي يك طبقه يا گروه دلالت ميكنند.
يك بچه بايد با ادب باشد.
32. A child should be polite.
مجبوربودن كهنه بزرگ است.
33. The old should be honored.
جملة 32 دستوري است، اما كاربرد «يك» در آغاز جمله، غيرعادي است؛ يعني ماشين ترجمه اين نكته را ناديده گرفته كه «a child» يعني «تمام بچهها» و نه «يك بچه». در جملة 33 نيز ميبينيم كه ترجمه ارائهشده كاملاً اشتباه، غيردستوري و بيمعنا است. شايد عامل اين خطا، نبود اسم پس از صفت «old» باشد. درحقيقت «the old» يعني «the old people»، ولي ماشين نتوانسته اين قسمت حذف شده را ترميم كند.
گروه 16. نقلقول غيرمستقيم: جملة 35 در انگليسي نقلقول غيرمستقيم اخباري ناميده ميشود. ترجمة ارائهشده توسط «پديده» براي اين جمله، غيردستوري و بيمعنا است.
32. He said that he had gone to the cinema the day before.
او گفت او به سينما روز رفته بود قبلاً.
به نظر ميرسد عامل اصلي بروز چنين مشكلي وجود عبارت «the day before» باشد. ميدانيم كه در تبديل جملة خبري از مستقيم به غيرمستقيم واژة «yesterday» به «the day before» تبديل ميشود، ولي «پديده» نتوانسته بين اين دو ساختار متفاوت، رابطهاي برقرار كند و درنتيجه ترجمة نادرستي را توليد كرده است.
گروه 17. جملات شرطي بدون if : ميدانيم كه در جملات شرطي انگليسي ميتوان if را حذف كرد. در اين حالت جاي فعل كمكي و فاعل عوض ميشود. مثلاً
«if I were you» به «were I you» تبديل ميشود و…
من ثروتمند بودم، من يك ماشين ميخرم.
36. Were I rich, I would buy a car.
ترجمة «پديده» براي جملة فوق، غيردستوري و بيمعنا است. به نظر ميرسد عامل بخشي از اين اشكال، حذف if و جابهجايي فاعل (I) و فعل كمكي (were) باشد. ضمناً پديده «would buy» را «ميخرم» ترجمه كرده كه نادرست است. درواقع جملة فوق جملة شرطي نوع دوم است و دربارة چيزي خلاف واقعيت صحبت ميكند. مثلاً در جملة فوق، فرد ثروتمند نيست و بنابراين نميتواند ماشين بخرد. براي جملة 36 ترجمة زير پيشنهاد ميگردد: اگر ثروتمند بودم ماشين ميخريدم.
گروه 18. مالكيت: همانگونه كه در گروه 14 و مثال 31 مشاهده گرديد، «پديده» don’t را دو واژه فرض كرد و بنابراين آن را به صورت فعل «don» و مفعول مستقيم «t» درنظر گرفت. در جملة 37 نيز پديده چنين اشتباهي را تكرار كرده است.
من به علي رفتم؟
37. I went to Ali’s.
مشاهده ميشود كه «پديده» نتوانسته بين «Ali’s» و «Ali’s house» رابطهاي برقرار كند و بنابراين «to Ali» را عبارت «حرف اضافهاي» فرض كرده و نتوانسته هويت «s» را مشخص سازد. براي جملة 37 معادل زير پيشنهاد ميگردد: من به خانة علي رفتم.
مشكلات ماشين ترجمة «پديده»
از جمله مهمترين دلايل بروز مشكلات ذكرشده براي «پديده»، ميتوان به موارد زير اشاره كرد:
1. اين ماشين ترجمه نسبت به مخاطبان حساس نيست. گاهي مخاطبان يك متن را افراد عادي تشكيل ميدهند و گاه افرادي متخصص و حرفهاي. پديده براي هر دو گروه به يك شكل ترجمه ميكند؛
2. «پديده» در ترجمة متون تخصصي و محدود كه موضوع و سبك خاصي را داشته باشند، موفق است، ولي در ترجمة متون عامتر دچار مشكل ميباشد؛
3. با گذشت زمان معناي واژهها تغيير ميكند. به همين خاطر اصلاح مداوم برنامه و واژگان ماشين ترجمه ضروري است كه البته نيازمند صرف هزينههاي بسيار ميباشد؛
4. ماشين ترجمة «پديده»، سخنگوي بومي يك زبان خاص نيست، از اينرو در برخورد با موقعيتهاي جديد موفق نيست؛
5 . تقسيمبندي و تحول واژهها در زبانهاي مختلف يكسان نيست. مثلاً ممكن است دو مفهوم در يك زبان با يك واژه بيان شوند و در زبان ديگر با دو واژه. مثلاً واژة bank در زبان فارسي به معناي «حاشية رودخانه» و «يك مركز مالي» است، ولي در انگليسي هر دو مفهوم توسط bank نشان داده ميشود. يا در فارسي «ماهي» هم به معناي «موجودي زنده در آب» است و هم «نام يك غذا، مثل ماهي با پلو» و… ولي اين دو مفهوم در اسپانيايي با دو واژة pez (ماهي زنده) و pescado (خوراك ماهي) نشان داده ميشود.
ماشين ترجمة «پديده» در تفكيك و تشخيص معاني مختلف يك واژه، بويژه واژههاي همآوا ـ همنگاشت[12] مشكل دارد.
سه اشكال عمده كه اكثر ماشينهاي ترجمه از جمله «پديده» با آن مواجهاند عبارتاند از:
الف) ناتواني اينگونه ماشينها در تميز بين كاربردهاي عام و تخصصي يك واژه. مثلاً bus در متون عام به معناي «اتوبوس» است، ولي در متون تخصصي مربوط به رايانه، به «بخشي از رايانه» اشاره دارد.
ب) ناتواني در تميز بين كاربردها و مفاهيم مختلف واژههاي عام. مثلاً جملة «The pen is in the box» و «The box is in the pen» را درنظر بگيريد. Pen در جملة اول هم به معناي «وسيلهاي براي نوشتن» (قلم داخل جعبه است) و هم به معناي «تخت بازي بچه كه دور آن حصار چوبي يا … نيز كشيده ميشود» (تخت بچه در جعبه است/ داخل بستهبندي ميباشد). اما در جملة دوم يكي از اين دو معنا نامربوط است. يعني نميتوانيم بگوييم «جعبه در خودكار است»، بلكه فقط ميتوانيم بگوييم «جعبه روي تخت بچه است». ماشين ترجمه تنها در صورتي ميتواند چنين جملاتي را درست ترجمه كندكه از اندازة نسبي اشيا نيز باخبر باشد.
ج) حساسنبودن به بافت و مخاطب.
اما ريشة اينگونه مشكلات در چيست؟ آيا به تئوري زباني اشكالي وارد است؟
تئوري زباني
تئوري زباني غالب، بر روابط دستوري در جمله و نحو تأكيد ميكند. حتي در دستور جهاني، «چامسكي» نحو را خودكفا و مستقل از معنا ميداند و بحث دربارة معنا را در حاشيه قرار ميدهد. به نظر ميرسد اين نوع تئوري مبتني بر نحو، عامل بخشي از مشكلات ماشينهاي ترجمه باشد.
تئوري زباني به بافت توجهي نميكند و جملة منفرد را كه توسط گوينده در محيط زبان آرماني توليد ميگردد و توسط شنونده درك ميشود مبناي مطالعه قرار ميدهد. بايد اذعان كرد كه دستور و نحو به تنهايي نميتوانند رايانه را به توليد ترجمهاي چون انسان مترجم وادارند. درواقع، به برنامهاي نياز است كه همزمان به نحو و معنا بپردازد. ماشين ترجمه بايد نسبت به معنا حساس باشد.
اما چگونه ميتوان در ماشين ترجمه، نسبت به معنا حساسيت ايجاد كرد؟ براي انجام اين كار لازم است در تئوريهاي زباني موجود و برنامة تعريفشده براي ماشينهاي ترجمه، قدرت تعقل و تفكر را وارد كنيم. قدرت انتخاب و تعقل همان موهبتي است كه انسان از آن برخوردار است. رايانه در انتخاب كاري كه انجام ميدهد آزاد نيست. اين برنامه است كه به ماشين ميگويد چه كاري را انجام دهد و چه كاري را انجام ندهد. مهمتر از همه آنكه ماشين از درك كاري كه انجام ميدهد عاجز است. ويژگي مهم ديگر تعقل و تفكر آن است كه همزمان ميتواند در بيش از يك حوزه كار كند و فرد داراي قدرت تعقل بر اين نكته واقف است كه در مورد يك پديده يا واقعيت، بيش از يك تفسير ممكن است وجود داشته باشد.
نتيجهگيري
تعقل و تفكر اساس كار زبان انسان را تشكيل ميدهد و ماشين فاقد آن است.
ريشة مشكلات امروزي ماشينهاي ترجمه را بايد در سه چيز جستجو كرد:
1. برنامههاي نادرست كه به ماشين داده ميشود و بيشتر آنها ناشي از كماطلاعي يا بياطلاعي برنامهنويسان ميباشد. ضمناً ضروري است براي داشتن برنامههاي مناسب، در گروه برنامهنويسان، زبانشناسي مجرب نيز گنجانده شود تا با تحليل ساختارهاي مختلف زبان، الگوهاي مناسب را براي تهية برنامه در اختيار برنامهنويسان قرار دهد.
2. با ضعف موجود در تئوري زباني، طبيعي است كه نميتوان زبان را جداي از معنا بررسي كرد. حتي وقتي دربارة آواهاي زباني صحبت ميكنيم، به معنا نيازمنديم (مثلاً جفتهاي كمينه را براي تعيين واجهاي زبان بهكار ميبريم). بنابراين چنانچه تئوري زباني به گونهاي اصلاح گردد كه معنا را نيز لحاظ كند ميتوان بخش ديگري از مشكلات ماشينهاي ترجمه را حل كرد. البته انجام چنين كاري بسيار دشوار، اما شدني است.
3. اگر بتوانيم به شكلي فقدان چنين قدرتي را ـ يعني همان نعمتي را كه خدا به ما عطا كرده ـ در اختيار ماشين قرار دهيم، (كه البته دستيابي به اين هدف بسيار بعيد به نظر ميرسد) مشكلات ماشينهاي ترجمه را ميتوان رفع نمود. بنابراين بايد انتظار داشته باشيم كه با توجه به دانش كنوني بشر، حتي در صورتي كه مشكلات دستة اول و دوم رفع گردند، مشكلات دستة سوم به قوت خود باقي بمانند.
سؤالي كه در اينجا ميتوان مطرح كرد آن است كه اگر به فرض بتوانيم چنين قدرتي را به ماشين بدهيم آيا خواهيم توانست هروقت كه بخواهيم آن را از ماشين بازپس بگيريم؟ يا از ماشين بخواهيم كه برخلاف ميل و ارادة خود (كه به خاطر داشتن قدرت تعقل، پيدا نموده) هر كاري را كه ما بخواهيم، به انجام برساند؟ چنين وضعيتي را «رابينسون» (Robinson, Douglas, 1992) به خوبي به تصوير كشيده است. او مينويسد: اگر ماشين ترجمه بتواند مثل انسان ترجمه كند و از قدرت تعقل و تفكر برخوردار باشد، آيا ترجيح نخواهد داد صبح كه از خواب برميخيزد، به جاي ترجمة متن تجاري يا … پاي تلويزيون بنشيند و فيلم چارلي را تماشا كند؟!».
منابع
Borr, B. J. (1993). Machine Translation: a View from the Lexicon. Cambridge, Mass: MIT Press.
Dorr, B. J. (1994). “Machine Translation Divergences: A Formal Descriptipn and Proposed Solution”. Computational Linguistics 20 (4). PP 597-634.
Dreyfus, Hubert L. (1992). What Computers Still Can’t Do. Cambridge, MA: MIT Press.
Gerber, Laurie. Working toward Success in Machine Translation. http://www.elsnet.org/mt2010/gerber.pdf.
Hovy, E. H. and Nirenburg (1992). “Approximating an Interlingua in a principle Way”. Proceedings of the DARPA Speech and Natural Language Workshop. Arden House , NY.
Huchins, W.J. (1986). Machine Translation: past, Present, Future. Chichester: Ellis Horwood Publishing.
Kay, Martin. Machine Translation
http://www.isadc.org/kay.html.
Melby, Alan and C. Terry warner (1995). The possibility of Language: a discussion of the Nature of Language, with Implications for Human and Machine Translation. (in Press) Ams
[7] امامی م . بررسی مسایل درك متن فارسی و پیاده سازی نمونه هایی از آن. پایان نامه كارشناسی ارشد، دانشكده مهندسی كامپیوتر، دانشگاه صنعتی شریف.،1376.
[8] صراف زاده ع. سمینار علمی ، آمفي تئاتر دانشكده مهندسي، 1389 .
[9] Milestones in machine translation – No.6: Bar-Hillel and the nonfeasibility of FAHQT by John Hutchins