به گزارش خبرگزاری کتاب ایران (ایبنا) سخنرانی علمی ترجمه ماشینی مبتنی بر پیکره از سلسله نشستهای زبانشناسی در مطالعات میانرشتهای روز چهارشنبه (۲۰ آذرماه) در پژوهشگاه علوم و فناوری اطلاعات با حضور هشام فیلی، عضو هیات علمی دانشگاه تهران برگزار شد. لازم به ذکر است الهام علایی ابوذر عضو هیات علمی این پژوهشگاه دبیری این مراسم را برعهده داشت.
فیلی در ابتدای سخنرانیش درباره اهمیت ترجمه ماشینی و کاربردهایش گفت: ترجمه ماشینی یکی از کاربردهای کوپراس(تصمیمگیری چندشاخصه در علم نرمافزار) است. در اصل مجموعهای از اطلاعات است که یا به صورت متن در ترجمه ماشینی نمود دارد یا یه در قالب آوا مورد استفاده قرار میگیرد. چامسکی جزو صاحبنظرانی بوده که معتقد به روشهای مبتنی بر پیکره یا استفاده از هوش مصنوعی نبود. وی میگوید؛ کوپراس به درد نخور است در عوض فردی به نام ویلمو میگوید قطعا هیچ کوپراسی نیست که کل حیطه لغتی یک زبان را پوشش دهد. بنابراین همیشه ناقص است، اما در هر هر کوپراسی که من مشاهده کردم یک سری المانهایی را در بهرهگیری از ترجمه ماشینی فهمیدم که در جای دیگر وجود نداشته است. با توجه به گفته ویلیمو دانشمندان به این روش امیدوار شدند و آن را ادامه دادند.
وی افزود: افرادی که در حوزه ترجمه ماشینی فعالیت میکنند علاقه دارند از روشی استفاده کنند که ماشین طراحی شده در سطح ترجمه جملهها باشد. روش کوپراس علاوه بر کاربردهایش در ترجمه ماشینی از سال ۲۰۰۰ به بعد بسیار فراگیر شد. طبق آمارهای سایت گوگل از کیفیت ترجمه ماشینی در سال ۲۰۱۶، اینگونه برآورد شد که ترجمه ماشینی تا سال مذکور هنوز به کیفیت امروزی نرسیده بود اما در این دو الی سه سال اخیر پیشرفت چشمگیری داشته است. بر اساس این آمار تا سال ۲۰۱۶ بیش از ۱۴۳ میلیارد کلمه در طول روز ترجمه میشد. در همان سال فیسبوک هم طبق آماری که داده بود در طول روز بیش از دو میلیارد درخواست ترجمه داشته است.
فیلی ادامه داد: نزدیک به ۵۰درصد وبسایتهای دنیا انگلیسی و بعد چینی هستند اما ۲۰درصد مردم دنیا زبانشان انگلیسی است. این نشان میدهد که چقدر نیاز به زبان انگلیسی مهم است. اینکه ما از ترجمه چه استفادههایی میکنیم واضح است اما علاوه بر عموم مردم، مترجمان هم میتوانند از موتورهای ماشینهای ترجمه یا ابزارهای آن استفاده کنند. با این حال هنوز اختلاف زیادی میان مترجمان هوشمند و مترجمان انسانی وجود دارد و هنوز ماشینهای ترجمه به پای مترجمان انسانی نرسیدهاند.
این پژوهشگر با اشاره به صرفهجویی در هزینه با بهرهگیری از ترجمه ماشینی گفت: پس از مدتی کارشناسان در حوزه ترجمه آزمایشی را انجام دادند، آنها تصمیم گرفتند متون توسط مترجمان ماشینی ترجمه شوند و در نهایت انسان آن را ادیت کند تا ببیند آیا در صرف هزینه و زمان میتوان صرفهجویی کرد یا نه که تا یک دهه گذشته فرقی با روند قبلی نداشت. یعنی مترجمان انسانی ترجیح میدادند ترجمههای ماشینی را به دور بریزند و دوباره ترجمه کنند. اما در شرایط فعلی با در نظر گرفتن بالاترین کیفیت ترجمه ماشینی میتوان گفت یک مترجم ماشینی در طول روز سه برابر یک مترجم انسانی میتواند ترجمه کند.
فیلی ادامه داد: بخش زیادی از ترجمههای B 2 B هستند یعنی عین یک عبارت را بدون در نظر گرفتن فرهنگ زبانی ترجمه میکند. در واقع امروزه اپلیکیشنها و نرمافزارهای ترجمه تخصصی زیادی وارد بازار شده است که علاوه بر ترجمه مستقیم فرهنگ موضوعی را هم در نظر میگیرد. باید گفت ترجمههای ماشینی در زمینه متون تخصصی کیفیت بالایی دارند اما اگر بخواهیم در یک روش همه حوزهها را به سطح بالایی برسانیم هنوز این آرزو محقق نشده است. ما میتوانیم همه حوزهها را تا سطح متوسط برسانیم تا اینکه در ۱۰ سال گذشته گوگل با استفاده از این روش انقلاب عظیمی را در ترجمه ماشینی به وجود آورد. البته در سال ۲۰۱۴ اسکایپ ترجمه صدا به متن را داشت و ترجمه انگلیسی به اسپانیایی اولین محصول این نرمافزار بوده است. تاکنون گجتهای زیادی آمده است که هرکدام روشهای خاص خود را دارد.
وی با اشاره به تاریخچه ترجمه ماشینی گفت: اغلب افراد تصور میکنند ترجمه ماشینی بعد از هوش مصنوعی به وجود آمد در حالی که اولین سیستمها در زمینه ترجمه ماشینی در سال ۱۹۵۲ بسیار قبلتر از هوش مصنوعی به وجود آمد. در آن زمان همه افراد به مدت ۱۰ سال خوشبین بودند و تصور میکردند دیگر اختلافات و نافهمیهای زبانی از بین خواهد رفت. در این حین روسیه و آمریکا فعالیتهای زیادی انجام دادند و زمان و پول زیادی را هزینه کردند تا اینکه به این نتیجه رسیدند هنوز برای رسیدن به هدفشان راه طولانی در پیش دارند و این نوع ترجمههای ماشینی هم چندان موثر نخواهد بود. تا اینکه در سال ۱۹۷۵ توقع خود را پایین آوردند و پروژههای مختلفی در سراسر جهان پیشرفته از جمله فرانسه و ژاپن شروع شد و برنامههای خود را دوباره بازنویسی کردند. در نهایت در اواسط دهه ۸۰ شرکتهایی سیستمهای پیشرفته ماشینهای ترجمه را تولید کردند.
وی ادامه داد: در اواخر دهه ۸۰ علم زبانشناسی به بلوغ خود رسیده بود و ترجمه حافظهای هم به وجود آمد. تا اینکه اوایل دهه ۹۰ اتفاق بزرگی به وجود آمد و مفهوم استفاده از کوپراس (تصمیمگیری چندشاخصه در علم نرمافزار) در ترجمه وارد شد و اولین محصولش روانه بازار شد. بدین ترتیب تا سال ۱۹۹۹ با روش آماری کوپراس بسیار فراگیر شد و اوایل سال ۲۰۰۰ سیستمهای آنلاین ترجمه ماشینی تولید شد.
وی ادامه داد: در ترجمه آماری متبنی بر کوپراس باید گفت که گرامر را کنار گذاشت چراکه با آمارها سرو کار داشت و چندان به زبانشناسی اهمیت نمیداد. این روش براساس نمادها کار ترجمه را انجام میدهد. اما بعدها اطلاعات زبانشناسی هم به آن اضافه شد. ایده اصلی آن بود که از روی تجملات موازی به ترجمه کلمات برسند و در مراحل بعدی تشخیص دهند که چه عبارتی دارای چه ترجمهای است. این روش زمانی جواب میدهد که ترجمه جملات بسیار زیاد باشد و این روش پیشرفت زیادی کرد به همین دلیل شرکتهای زیادی از جمله گوگل به دنبال آن رفتند. منطق آن این بود که از جفت جملات استفاده میکرد و به ترجمهها میرسید و این اطلاعات در یک بخشی ذخیره میشد.
فیلی با اشاره به اهمیت کتاب در پبشرفت روش کوپراس در ترجمه ماشینی ادامه داد: اتفاقی که در این حین افتاد این بود که کاربران کوپراس نیازمند حجم بسیار زیاد جملات شدند. در اینجا کتابها به کمک این روش آمدند. چراکه دارای حجم بسیار زیادی از جملات بودند. لازم به ذکر است پارلمان کانادا اولین کشوری بود که با استفاده از این روش ترجمه تمام مذاکرات پارلمانی خود را به دو زبان انگلیسی و فرانسوی انجام میدهد و همزمان نوشته میشود. بعد از آن خبرگزاریهای بسیاری از آن استفاده کردند. یکی از اصلیترین نمودهای این روش در زیرنویس فیلمها و ترجمه قرآن و دیگر کتب مقدس است.
به گفته فیلی، وارن ویور ایدهپرداز اصلی کوپراس بود که ۶۰ سال بعد ایده وی جان گرفت. نگاه وی به زبان به شدت کدگذاری شده بود و همین امر باعث شد که این روش را در ترجمه ایجاد کند. همانگونه که پیشتر هم گفته شد از دهه نود روشهای آماری کوپراس که، فراگیر شد. این روش دارای منابع آزاد (open source) بود و سبب شد که جستجو واژه بسیار راحتتر از پیش باشد.
این عضو هیات علمی دانشگاه تهران ادامه داد: از سال ۲۰۱۰ به بعد هوش مصنوعی بسیار تغییر کرد و به شکل عجیبی به سمت یادگیری عمیق با شبکه عصبی رفت که نوعی شبیهسازی از مغز است که هرچیزی را میتواند یاد بگیرد، از جمله ترجمه. بعد از این سال یادگیری عمیق براساس استفاده از شبکه عصبی در سال ۲۰۱۴ بهوجود آمد و یک اتفاق عجیب رخ داد اینکه کیفیت ترجمه ماشینی به یکباره افزایش یافت و روشهای دیگر را از رده خارج کردند. در واقع این روش ترجمه مفهوم به مفهوم را انجام میدهد. واقعیت این است که همیشه توقع ما از ترجمه عقبتر از واقعیت است و الان هم با توجه به ورود هوش مصنوعی در ترجمه ماشینی اشتباه دهه پنجاه را تکرار میکنیم اینکه فکر میکنیم ترجمههای ماشینی میتواند جای ترجمههای انسانی را بگیرد در حالی که اینگونه نیست.
وی در انتها یادآور شد: از سال ۲۰۱۶ به بعد هرکدام از ترجمههای ماشینی به NMT (ترجمه مبتنی بر هوش مصنوعی) تبدیل شدند و در ایران ما در سایت فرازبین از این روش استفاده میکنیم. گفتنی است این روش نیازمند سختافزار بسیار پیچیده و حجم ذخیره اطلاعات زیاد است. نطفه این روش از پردازندههای بازیهای رایانهای شکل گرفت. از همین سال به بعد تمام شرکتها از جمله گوگل، فیسبوک و دیگر شرکتها به NMT روی آوردند. اخیرا با شرکت به نام شبکه مترجمین در حال انجام یک آزمایشی هستیم که آیا مترجم ماشینی میتواند با توجه به این پیشرفتها جایگزین مترجم انسانی شود یا خیر؟ برای پیشرفت این امر کتابهای زیادی را جمعآوری کردیم که بتوانیم در تمام زمینهها کاربردی کنیم. |