Електронні словники та системи перекладу в Інтернеті

Український Інститут лінгвістики та менеджменту

КУРСОВА РОБОТА

«Електронні словники та системи перекладу в Інтернеті»

Виконала

Кулішенко Марта

Київ -2008

Вступ

Інтернет якось поступово й непомітно став невід'ємною частиною нашого життя, і в багатьох користувачів слово «пошта» у наші дні асоціюється саме з e-mail, а для зв'язку сьогодні все частіше відкривають «аську», замість того щоб набрати номер на телефонному апараті. В онлайні тепер можна знайти найрізноманітніші сервіси, починаючи від замовлення квитків у театр і закінчуючи покупкою комп'ютера або іншої побутової техніки. Не дивно, що сервіси перекладу й електронних словників також доступні в онлайні. Перевести Інтернет сторінку або e-mail, що надійшов від західного партнера, або витримку з документації - подібні завдання, обумовлені необхідністю негайно ознайомитися зі змістом тексту іноземною мовою, виникають дуже часто. Однак далеко не всі користувачі можуть похвалитися своїм бездоганним знанням англійської, не говорячи вже про інші іноземні мови. Перебороти мовний бар'єр допомагають онлайнові сервіси перекладу. Однією з найважливіших переваг цих сервісів - є абсолютна безкоштовність більшості з них. Тому високий попит на сервіси перекладу легко пояснити.

В своїй роботі я перевіряла, наскільки добре онлайнові словники та системи перекладу допоможуть нам впоратися із завданням.

Насамперед варто розуміти чітку різницю між функціями «словника» і «перекладача». Перший перекладає лиш окремі слова, іноді стійкі вислови, а Другий являє собою інструмент для повного перекладу тексту.

У цій роботі я розглянула декілька електронних багатомовних перекладних словників. Крім цього частину своєї роботи я приділила тлумачним електронним словникам, порівнюючи змістовність тлумачення заданих слів.

Першим етапом курсової роботи було опис та порівняння онлайнових електронних перекладних словників ABBYY Lingvo та MultiLex. Для тестування я використовувала слово «surveilance», а також звертала увагу на зручність інтерфейсу та кількість додаткових функцій та сервісів сайту.

Другим етапом було описання головних можливостей та порівняння глибини тлумачення електронних онлайнових тлумачних словників Slovnyk.net та Wikipedia (енциклопедія з функцією тлумачного словника). Для тестування використовувались українські слова: «веселка», «зухвалість» та, для ускладнення завдання, діалектичне слово «мешти».

Останнім, третім етапом, написання курсової роботи було описання та тестування систем перекладу в Інтернеті Promt та Systran. Для завдання було взято 2 тексти різних стилів: уривок з оповідання «On not knowing English», художнього стилю, та уривок з Декларації Незалежності США. Особливу авагу я звертала на зручність інтерфейсу сайту, його можливості та на додаткові функції.

1. Електронні словники

1.1 Lingvo

1.1.1 Загальні характеристики та основні можливості словника

Словник Лінгво (www.lingvo.ru) добре знайомий українським користувачам, він представлений на ринку вже 15 років. Автором цього словника є російська компанія ABBYY Софт Хаус. До речі, у перекладі з есперанто «lingvo» означає «мова».

По своїй структурі сервіс Лінгво.ру практично ідентичний паперовим словникам: по кожному слову дається кілька перекладів і контекстні приклади використання слова. Безумовною зручністю є наявність цілого набору словників по різних темах, об'єднаних у рамках одного сервісу.

Інтернет-Версія електронного словника Лінгво здійснює переклад на російську з англійської, німецької, французької, італійської та іспанської мов і назад, а також містить 13 тематичних словників, активувати які можна, натиснувши кнопку «выбрать словари» та поставивши прапорець напроти потрібного словника.

На сайті також представлена послуга «виртуальная клавиатура»,що знаходиться в правому нижньому куті під рядком вводу слова, яка дає можливість працювати використовуючи лише мишу комп’ютера.

1.1.2 Практична частина

Для проведення тесту словника я обрала слово «surveillance». Лінгво видав два переклади із загального словника - надзор, наблюдение. Словник надав транскрипцію, а також запропонував звернутися до чотирьох спеціалізованих словників: економічного, медичного та наукового у яких теж є переклади даного слова. Також наведені декілька прикладів використання цього слова у словосполученнях.

Крім електронного Онлайнового словника на сайті представлений сервіс перекладу текстів та Web- сторінок, а також інформація про компанію, її продуктах та форум для користувачів сервісів ABBYY Лінгво.

Додатково варто відзначити, що копія цього сервісу перебуває на Яндексі (http://lingvo.yandex.ru/)і скористатися нею можна при необхідності перекладу результатів пошуку.

1.2 MultiLex

1.2.1 Загальна характеристика та основні можливості словника

Компанія МедиаЛингва дотримується при створенні словників МультиЛекс досить простої стратегії. В основу електронних словників закладені словникові бази книжкових видань, що вже завоювали популярність і визнання серед перекладачів, викладачів іноземних мов, студентів і школярів.

Онлайн- словник МультиЛекс (www.online.multilex.ru) містить більш ніж 40 загальних, тематичних та тлумачних словників, що заслуговують на довіру професійних лінгвістів та перекладачів. Інтернет версія електронного словника здійснює переклад на російську з англійської, французької, німецької, італійської, португальської, іспанської та узбекської мов і назад.

Виконуючи переклад текстів будь - якої складності, використовуючи докладні та актуальні статті онлайн – словника МультиЛекс, що містять детальні тлумачення слів, транскрипцію та приклади вживання. Для перекладу спеціалізованої лексики до складу МультиЛексу входять тематичні онлайн – словники багатьох галузей, таких як: будівництво, економіка, банківська справа, комп`ютери, право, техніка, медицина та багато інших.

На сторінці МультиЛекс Онлайн Ви також можете завантажити електронні словники для стаціонарного комп`ютера, смартфону, КПК та мобільного телефону.

1.2.2 Практична частина

Для проведення тесту словника, так само як для Лінгво, я обрала слово «surveillance». МультиЛекс видав два варіанти перекладу даного слова – надзор, наблюдение, що співпадає з результатом отриманим зі словником Лінгво. Словник запропонував звернутись до інших словників: «Общая лексика. Мюллер», «Общая лексика. Ахманова» у словникових статтях яких були знайдені переклади цього слова.

Також навів приклад із англійського словника «Webster's New World Dictionary (EN-EN)», в якому пояснювалось виникнення слова, його граматичні характеристики та приклади словосполучень.

Щоб змінити мову, на яку Ви здійснюєте переклад, потрібно лише натиснути на прапорець країни мову якої Ви обрали, що знаходяться над полем вводу слова.

Виконуючи переклад на сайті ви можете скористатись «Виртуальной клавиатурой» за допомогою якої Ви можете друкувати текст користуючись лише мишею комп`ютера. Скориставшись функцією «Активные словари» Ви можете обрати додаткові словники, для перекладу слова, поставивши прапорець навпроти.

2. Електронні тлумачні словники

2.1 Вікіпедія

2.1.1 Загальна характеристика та основні можливості тлумачного словника - енциклопедії Wikipedia

Wikipedia («Вікіпедія») —найповніша енциклопедія у світі. Це унікальний міжнародний інтернет - проект, що складається з 253 мовних проектів Вікіпедії, яким можна скористатись на сайті www.wikipedia.org. Серед них, найбільшу кількість має англійська Вікіпедія - 2,3 млн. статей. «Вікіпедія» стартувала 15 січня 2001 р. Проект створили вчений-філософ з університету штату Огайо Ларри Сэнгер і підприємець Джимми Уэйлс родом із Санкт-Петербурга, який проживає в штаті Флорида США. На той час вони вже займалися Nupedia – інтернет - енциклопедією, що відрізнялася від своїх попередниць тим, що була простіше та більш доступною.

Одним з ноу-хау першого проекту було залучення авторів-добровольців до створення вивірених енциклопедичних статей, які потім могли б використовуватися всіма бажаючими. Однак робота йшла повільно, тому що написання й рецензування виявилося справою складним. Але увагу ентузіастів привернула комплексна інтернет-видавнича система Wiki, розроблена в 1995 р. програмістом з Портленда Уордом Каннингемом. Вона дозволяє підтримувати інтернет - сайти, інформацію на які можна редагувати й доповнювати в онлайновом режимі. Учасник Wiki може внести зміни на будь-яку сторінку сайту, і їх відразу побачать всі відвідувачі. При цьому між сторінками активно розставляються гіперпосилання, від чого довідкова функція сайту поліпшується.

Програма вийшла вдалої. Назва wiki відбулося від гавайського wikiwiki - «дуже швидко». Поступово розробка вийшла за рамки базового програмного продукту й перетворилася в концепцію. Вікі - гіпертекстова інтернет - середовище, призначене для колективного редагування, нагромадження й структуризації текстової інформації.

На сьогодні у Вікіпедії 29 447 статей (не враховуючи зображень), означених як стаб. Це лише позначені статті, якими користується 12 572 людей всього Світу, та це число зростає кожен день.

4 квітня 2004: офіційно активовано українську частину вікіпедії (www.uk.wikipedia.org) з кількістю статей — 1000.

28 березня 2008 року українська Вікіпедія вийшла на рівень 100 тисяч статей і посідає дев'ятнадцяте місце серед проектів іншими мовами (між Вікіпедіями мовою есперанто та турецькою мовою). Щодня в ній створюється близько 200 нових статей і редагується близько 1000 наявних; щомісяця число зареєстрованих дописувачів зростає більш ніж на 900.Для порівняння, англійська Вікіпедія налічує понад 2,3 млн. статей, німецька понад 700 тисяч та французька понад 600 тисяч статей, польська та японська 470 тис., російська, китайська приблизно 200 тис. За дотримуванням правил Вікіпедії спостерігають 14 адміністраторів.

Найкращими статтями української Вікіпедії є т. з. «Вибрані статті» і «Вибрані списки», обрані користувачами як ті, що відповідають високому рівню якості, викладання матеріалу, досконалості, нейтральності, об'єктивності та відповідності до наукових джерел. Є також окрема категорія «Добрі статті», які ще не досягають рівня «вибраних», однак можуть бути зараховані до одних із кращих статей української Вікіпедії. Відповідність статей до цих категорій вирішується голосуванням користувачів.

Статті, що, навпаки, поки що не відповідають належному рівню відносяться до категорії «Статті, які слід доробити».

В українській Вікіпедії також діють портали — сторінки, розраховані служити «Головними сторінками» для конкретних галузей знань. Портали призначені для координації зусиль з написання статей та пошуку інформації з певних тем. Їхня кількість та якість постійно зростає, на сьогодні в українській Віікіпедії 24 портали.

Станом на початок 2008 року з понад 4,5 млн. користувачів Інтернету в Україні - 10144 зареєструвались у Вікіпедії (0,23%).

Однією з головних переваг сайту - наявність функції тлумачного словника, яки окрім обґрунтованого тлумачення слова дає посилання на статті в яких було знайдено це слово або словосполучення. Це дає можливість глибокого вивчення всіх аспектів заданого слова.

2.1.2 Практична частина

Для проведення практичного завдання я обрала декілька українських слів, щоб перевірити обсяг тлумачення та потім порівняти результат запропонований Вікіпедією з іншим Українським онлайновим тлумачним словником.

Перше запропоноване слово – веселка.

Веселка - (тж. Райдуга) оптичне явище в атмосфері, що уявляє собою одну, дві чи декілька різнокольорових дуг, що спостерігаються на фоні хмари, якщо вона розташована напроти Сонця. Червоний колір ми бачимо із зовнішнього боку райдуги, а фіолетовий — з її центральної частини.

Вікіпедія навела наукову, змістовну, досить складну версію тлумачення слова Веселка. У дитини це тлумачення могло б викликати додаткові питання, але створювачі сервісу передбачили необізнаність деяких користувачів. Синім кольором виділені слова, натиснувши на них здійснюється автоматичний перехід на статтю, в які дається змістовне обґрунтування виділеного слова, терміну або словосполучення.

Додатковим плюсом є те, що сервіс надає можливість одразу прочитати всю статтю, яка стосується виключно слова «веселка», з якої можна дізнатись про виникнення райдуги, послідовність та навіть приклади, що зв`язуюсть дане слово з міфологією. Сторінка містить зображення та схеми які розширюють межі тлумачення слово.

Друге обране слово для практичної частини – зухвалість.

Нажаль сервіс не надав жодного тлумачення даного слова. Видав лише статті в яких воно використовується.

Останнім завданням практичної частини була перевірка наявності тлумачення слів діалектичного утворення. Для цього я обрала слово «Мешти».

Результат був кращий ніж попередній але гірший ніж перший(зі словом «веселка»).

Сервіс надав пояснення слова «мешти», який знайшов у статті «Львівська говірка». Літературною українською - це черевики.

Натиснувши посилання на статтю «Львівська говірка» можна дізнатись про специфіку цього діалекту. Також можна переглянути близько 50 слів, в алфавітному порядку, цієї мовної структури.

2.2 Словник.Нет

2.2.1 Загальна характеристика та основні можливості українського тлумачного словника Словник.Нет

Великий тлумачний словник сучасної української мови онлайн (www.slovnyk.net), містить понад 207 000 словникових статей та близько 18 000 фразеологізмів. У словнику представлено активну лексику української літературної мови, терміни, номенклатурні та складноскорочені слова, слова історичного фонду, що свого часу належали до широковживаних, найбільш відомі у вжитку слова, пов'язані з релігійними та філософськими поняттями, найуживаніші архаїзми, лексичні діалектизми та найпоширеніші неологізми, що з'явилися протягом останніх років. Проект СЛОВНИК.НЕТ базується на другому виданні ВТС СУМ / Голов. ред. В.Т.Бусел, редактори - лексикографи: В.Т.Бусел, М.Д. Василега - Дерибас, О.В.Дмитрієв, Г.В.Латник, Г.В. Степенко. - К.: Ірпінь: ВТФ "Перун", 2005. Словник розраховано на широке коло людей, що вивчають українську мову, послуговуються нею у повсякденному житті, цікавляться українською культурою. СЛОВНИК.НЕТ постійно поповнюється новими словами.

Для покращання результатів пошуку бажано прочитати розділ "Як користуватися словником". В якому йдеться про основні правила користування сайтом:

1. Іменники треба вводити у називному відмінку однини, крім тих іменників, які взагалі не мають однини, або ж вживаються переважно у множині.

2. Прикметники треба вводити у називному відмінку чоловічого роду в повній формі.

3. Дієслова треба вводити у теперішньому часі у неозначеній формі.

4. Займенники треба вводити у називному відмінку.

5. Числівники треба вводити у називному відмінку.

6. Для пошуку фразеологічного виразу (позначається **) треба вводити його основне слово (змістову серцевину). Напр. Комендантська година знаходиться у статті година.

Літери, які знаходяться під наголосом виділяються червоним кольором.

Однією з плюсів сервісу – наявність посилань на Вікіпедію та функція пошуку у Веб. Також, якщо ви не згодні з тлумаченням слова, ви можете обговорити його на форумі сайту.

2.2.2 Практична частина

Для виконання практичної частини я обрала таке саме завдання, як і для Вікіпедії.

Першим словом, для перевірки було «Веселка».

Веселка (-и; ж) – дугоподібна різнобарвна смуга, яка з`являється в атмосфері внаслідок заломлення сонячних променів у краплинах дощу, сніжинках; райдуга.

Порівнюючи із результатом, який був отриманий у Вікіпедії, тлумачний словник Словник.нет дав на багато простішу а коротку версію публіцистичного стилю. Також явним мінусом є відсутність посилань на інші статті.

Для другого етапу тестування було обрано слово «зухвалість».

Сервіс Словник.Нет приємно здивував, на відміну від Вікіпедії, надавши тлумачення цього слова.

Зухвалість, -лості, ж. 1. Властивість за значенням Зухвалий. 2. Зухвалий учинок.

Досить коректне тлумачення слова. Але занадто згорнуте, що не дає зрозуміти слово в біль широкому сенсі.

І нарешті останній етап – перевірка на тлумачення діалектичного слова «мешти».

Мешти, мешт, мн., діал.. Легкі татарські черевики.

І знову сервіс тлумачного словника Словник.нет приємно дивує наявністю в словниковій базі слова діалектичного походження. Дає навіть більш розгорнуте, ніж у Вікіпедії, тлумачення.

3. Системи перекладу в Інтернеті

3.1 Promt

3.1.1Загальні характеристики та можливості системи перекладу.

Одним з найвідоміших постачальників сервісів онлайнового перекладу в російському Інтернеті є компанія ПРОМТ (www.translate.ru), яка займається розробкою систем автоматизованого перекладу з 1991 року й відома своїми машинними перекладачами. Крім програм, ПРОМТ пропонує широкий спектр послуг онлайнового перекладу, для роботи з якими досить мати доступ в Інтернет. На сайті можна перекласти невеликий текст або безкоштовно зареєструвавшись –текст об`ємом до 500 символів, а також електронний лист або Веб – сторінку з повним збереженням форматування. Існує також спеціальна послуга онлайн - перекладу для користувачів стільникових телефонів (ВАП - Перекладач), є версія сайту для власників кишенькових комп'ютерів (http://pda.translate.ru).

Сервіс Транслейт. ру пропонує переклад для семи європейських мов: англійської, німецької, французької, іспанської, італійської, португальської й російської. У цілому користувачеві доступний 21 напрямок перекладу, а також великий набір додаткових настроювань (спеціалізовані словники, переклад тексту більшого обсягу, доступ до додаткової граматичної інформації та ін.). Для одержання доступу до додаткових сервісів потрібна реєстрація (безкоштовна).

3.1.2 Практична частина

Щоб краще зрозуміти принципи дії систем машинного перекладу та методи використання словників і аналізу граматики, так само як і синтезу структур вихідною мовою, треба на практиці перекласти кілька текстів різних по функціональному стилі й тематиці.

Візьмемо як перший приклад наступний уривок художнього тексту:

«When I first time came to England in 1938 thought I knew English fairly well. In Europe my English proved quite sufficient.

In England I found two difficulties. First: I didn`t understand people, and secondly: they did not understand me. It was easier with written texts. Whenever I read a leading article in The Times, I understood everything perfectly well, except that I could never make out whether The Times was for or against something. In those days I put this down to my lack of knowledge of English.»

Ось ' вільний ‘ переклад на російську мову:

«Когда я впервые приехал в Англию, в 1938, я думал, что знаю английский язык довольно хорошо. В Европе моё знание английского языка было более чем достаточным для общения.

В Англии я нашел две трудности. Во-первых: я не понимал людей, а во-вторых: они не понимали меня. С письменными текстами - было легче. Всякий раз, когда я читал передовицу в "Таймс", я все понимал достаточно хорошо, за исключением того, что не мог разобрать - была ли "Таймс" за или против чего-то. В те дни я относил это к моей нехватке знания английского языка.»

При перекладі мені довелося поміняти порядок слів у декількох реченнях.

А от як перекладає цей текст система автоматичного перекладу в Інтернеті PROMT (www.translate.ru):

«Когда я сначала время прибыло в Англию, в 1938 думал, что я знал английский язык справедливо хорошо. В Европе мой английский язык оказался весьма достаточным. В Англии я нашел две трудности. Сначала: я didn `t понимаю людей, и во-вторых: они не понимали меня. Это было легче с письменными текстами. Всякий раз, когда я читал передовицу в "Таймс", я понял все совершенно хорошо, за исключением того, что я никогда не мог разбирать, была ли "Таймс" для или против кое-чего. В те дни я подавлял это к моей нехватке знания»

Перше, на що слід звернути увагу – система не переклала дієслово «didn`t». Іноді програма надає варіанти перекладу слів (дані у фігурних дужках) - другі значення відповідних слів у вихідній мові. Таким чином, відбираючи, виходячи з контексту, найбільш імовірні значення слів, програмі ПРОМТ іноді важко видати однозначний варіант, залишаючи, таким чином, право вибору за редактором-перекладачем.

Але найбільшою «помилкою» є не узгодження в роді та числі. Це пояснюється тим, що англійські іменники втратили граматичну категорію роду. Тому майже всі вони узгоджуються із займенником 3 особи однини "it" - середнього роду. У російській мові категорія роду іменників присутня й в 3 особі однини вони узгоджуються із трьома різними займенниками залежно від граматичного роду. Отож, система ПРОМТ, синтезуючи текст вихідною мовою не враховує можливість узгодження іменника й займенника.

Не дивлячись на помилки, зроблені системою перекладу, текст виявився доволі читабельним.

Як другий приклад візьмемо початок Декларації Незалежності

США. Тут ми побачимо переклад системою PROMT тексту, написаного в офіційно-діловому стилі наприкінці XVIII століття. Ось оригінал тексту:

"When in the course of human events, it becomes necessary for one people to dissolve the political bands which have connected them with another, and to assume among the powers of the earth, the separate and equal station to which the laws of nature and of nature's God entitle them, a decent respect to the opinions of mankind requires that they should declare the causes which impel them to the separation. We hold these truths to be self-evident, that all men are created equal, that they are endowed by their creator with certain unalienable rights, that among these are life, liberty and the pursuit of happiness, that to secure these rights, governments are instituted among men, deriving their just powers from the consent of the governed..."

Як ми бачимо, цей текст далеко не простий з погляду сприйняття: речення довгі, багато підрядних речень і однорідних членів. З іншого боку, незважаючи на те, що тексту більше 225 років, в ньому немає слів або граматичних конструкцій, які були б незрозумілі людині, що знає англійську мову хоча б на рівні носія. У тесті не використовуються слова, значення, які застаріли б і тому єдиною складністю є великий обсяг речень і відносна складність їхньої конструкції.

Щоб зробити порівняння перекладу, я спочатку переклала текс власноруч:

"В ходе человеческой истории для одного народа становится необходимо разорвать политические узы, что связывают его с другими, и занять среди наций мира самостоятельное и равное положение, данное ему в силу природного права и законов Божественной Природы, - уважение мыслей человечества требует декларации причин, которые двигают его к отделению. Мы считаем самоочевидными следующие истины: все люди созданы равными, они наделены Творцом (Создателем) определёнными неотъемлемыми правами, среди которых есть право на жизнь, свободу и стремление к счастью; для обеспечения этих прав среди людей существуют правительства, которые осуществляют свою всласть с согласия тех, кем они руководят.

Ось переклад цього тексту, здійснений системою ПРОМТ в Інтернеті:

"Когда в ходе человеческих событий, это становится необходимым для людей расторгнуть политические полосы, которые соединили их с другим, и принимать среди полномочий земли, отдельная и равная станция, на которую законы природы и Бога природы дают право им, приличное уважение к мнениям относительно человечества требует, чтобы они объявили причины, которые побуждают их к разделению. Мы держим эти истины, чтобы быть самоочевидным, что все мужчины созданы равные, что они обеспечены их создателем с определенными не могущими быть отчуждённым правами, которые среди них являются жизнью, свободой и преследованием счастья, что, чтобы обеспечить эти права, правительства назначены среди мужчин, получая их справедливые полномочия из согласия, которым управляют… "

Як ми бачимо, з таким текстом у системи машинного перекладу виникає більше проблем. Ґрунтуючись на даному зразку перекладу тексту, можна одразу побачити всю недосконалість механізмів граматичного аналізу й синтезу цих систем.

Відносно граматичного синтезу, з іншого боку, сказати можна не так багато. Ну, наприклад, вихідний варіант "дают права им" не відповідає нормі мови з погляду порядку слів. Таким чином, при синтезі граматичних структур вихідною мовою, ми знов-таки бачимо тверду прив'язку до порядку слів у тексті вхідною мовою. Потім, така фраза як "Мы держим эти истины, чтобы быть самоочевидным.." сильно нагадує мовлення іноземця, що вивчив російську мову за допомогою розмовника. Але ж програма писалася російськими фахівцями! Однак у цьому випадку, лінгвістів, що брали участь у створенні систем ПРОМТ у незнанні граматики рідної мови звинуватити не можна. Адже проблема тут не в синтезі граматичної структури, а все в тому ж нерозумінні структури вхідної мови - тобто в граматичному аналізі.

Граматичний аналіз, як ми бачимо, перебуває на самому примітивному рівні. Так, прості речення система перекладає майже без помилок. Складносурядні, та й класичні приклади складнопідрядних речень теж даються системі з відносною легкістю. Однак як тільки виникає нестандартна ситуація (наприклад, одне підрядне речення ускладнюється іншим або, навіть, елементарною вставною або пояснювальною конструкцією і, як наслідок, розривається) і програма не знаходить підходящого алгоритму граматичного аналізу - вона відразу забуває про синтаксис і починає елементарний послівний переклад, формально (за допомогою флексій) намагаючись зв'язати хоча б поряд написані слова. Ця спроба зв'язати граматично поруч стоячі слова, неправильним вибором значень деяких слів, ще більше заплутує вихідний варіант.

3.2 Systran

3.2.1 Загальні характеристики та можливості системи перекладу

Онлайн-Сервіс перекладу іншого відомого розроблювача систем машинного перекладу — американської компанії Сустран— можна знайти на сторінці www.systran.ru. Тут заявлено більше 35 напрямків перекладу.

Крім традиційної для всіх онлайн- перекладачів функції перекладу тексту, за допомогою Сустран можна перекладати письмові тексти, файли пакету Майкрософт Оффис та Web-Сторінки. Для підвищення якості перекладу розроблювачі пропонують спеціалізовані словники по дев'яти тематиках, а також опцію створення користувачами власних словників. Сьогодні Онлайн сервісом користується більш ніж 500,000 людей.

Для використання Сустран більше п'яти разів потрібно пройти безкоштовну процедуру реєстрації. Швидкими та легкими настроюваннями сервісу можна користуватись з першого дня підписки.

Сайт пропонує три сервіси перекладу: СустранЛинкс, СустранБокс та СустраНет.

Коротко про кожний:

СустранЛинкс

Готовий сервіс Онлайн перекладу, файли якого розміщуються на серверах Сустран, що забезпечує локалізацію веб - сторінок та контент - додатків (наприклад, пошукові засоби), створюючи центр багатомовного спілкування в режимі реального часу. Підвищує рівень інформованості користувачів про торгівельну марку в новій сфері діяльності та створює нові джерела прибутку. Одним з пріоритетів сервісу є функція, що дозволяє одним натисканням миші перекласти сторінку на ріду мову користувача.

СустранБокс

Це місце для користувачів, де вони можуть спілкуватися на різних мовах та розуміту будь-яку інформацію на іноземних мовах, перекладаючи короткі тексти особистого, чи ділового характеру, а також веб-сторінки. Користувач поже здейчнювати переклад у 38 напрямках. СустранБокс використовує такий самий надійний механізм перекладу, як і портали інтернету всесвітніх корпорацій та органи правління.

СустраНет

Завжди готова до використання онлайн- послуга для перекладу. Дозволяє скористатись перевагами перекладу звичайного тексту, веб-сторінки та особистих файлів в режимі реального часу просто з робочого столу комп’ютера. Для перекладу доступні 36 мовних пар. Переклад відобразиться у вікні браузера або буде надісланий на Вашу електронну адресу за декілька секунд. На сайті представлена велика кількість додаткових спеціалізованих словників, які, також, можна використати при перекладі. Ви можете створювати свої власні словники та використовувати їх для підвищення якості Вашого перекладу. При перекладі зберігається вихідний формат документу.

3.2.2 Практична частина

Для практичної частини своєї курсової роботи я взяла таке саме завдання, як і для системи перекладу Промпт.

Ось як СустранБокс упорався з першою частиною тесту- перекладом уривку художнього тексту:

«Когда первый раз I пришел к Англия в 1938 подумал что я овладело английским справедливо хороший. В европе моя английская язык доказала довольно достаточную.

В Англия я нашел 2 затруднения. Во первых: `T didn i понимает людей, и secondly: они не поняли меня. Было легке с написанными текстами. Когда я прочитал ведущую статью в временах, я понял все совершенно наилучшим образом, за исключением того, что я смог никогда не сделать вне были ли времена для или против что-то. В тех днях я кладу это опустите к моему недостатку эрудиции английской языка.»

На жаль, результати перекладу з англійської на російську не тільки не виправдали очікувань, а, навпаки, розчарували. Як ми бачимо багато слів перекладено не вірно, граматичний синтез фактично відсутній, з дієсловом минулого часу «didn`t» трапилось щось зовсім не зрозуміле та, навіть, прислівник «secondly» залишились на первісній мові тексту.

Подивимось, як Сустран впорається з другим завданням – переклад уривку з Декларації Незалежності США.

«Когда в процессе людских случаев, его будет необходимо для одного люд для того чтобы растворить политические диапазоны которые соединяли их с другими, и принять среди сил земли, отдельно и равной станции к которой естественные законы и Бог природы озаглавливают их, пристойное уважение к мнениям человечества требует что они должно объявить причины которые побуждают их к разъединению. Мы держим эти правды для того чтобы быть самоочевидны, т все люди созданный равный, то они обеспечены доходом их создателем с некоторыми unalienable правами, то среди этих жизнь, вольность и преследование счастья, которое для того чтобы обеспечить эти права, правительствам учреждают среди людей, выводя их справедливые силы от согласия управленное…»

Як ми бачимо результат знов не виправдав очікування. Як і в першому випадку велика кількість слів перекладена не за змістом, англійське слово «unalienable», що українською перекладається, як «невід’ємний», залишилось мовою оригіналу. Граматичний синтез взагалі відсутній.

У цілому якість онлайн-перекладу сервісу Сустран залишає бажати кращого. Хоча цілком можливо, що даний сервіс із перекладом текстів з інших мов справляється краще.

Висновок

Серед онлайнових словників можна відзначити досить тверду конкуренцію - практично всі розглянуті сервіси гідно впоралися з перекладом слів, але визначити абсолютного фаворита дуже важко. На жаль, неможливо однозначно зрівняти такий найважливіший показник, як кількість слів і словосполучень у словнику. Причина - різні принципи індексації й обліку словникових одиниць, у результаті чого порівняння по даному параметру стає не просто марним, а навіть шкідливим і вводить в оману. Електронні словники легше порівняти за глибиною та точністю перекладеного слова, а також за кількістю додаткової інформації запропонованої словником.

За цими критеріями визнаним фаворитом по результатам тесту курсової роботи - є сервіс «Лінгво Онлайн».Він досить швидко здійснив пошук за назвою словникової статті, переклав слово, надав транскрипцію, навів конкретні приклади використання і стійкі вираження, у яких зустрічається слово «surveillance». Також словник запропонував звернутись до чотирьох спеціалізованих словників: економічного, медичного та наукового у яких теж є переклади даного слова. Такий пошук створює багатомірний портрет слова.

Однак для перекладу спеціалізованих термінів краще звертатися до сервісів, що пропонують більше широку в тематичному плані добірку словників.

Професійним перекладачам рекомендую звертатися до словника MultiLex, що не тільки охоплює величезне число тем, але й дає можливість обговорити безпосередньо в онлайні переклад складного терміна з іншими користувачами. Єдиним явним мінусом МултіЛексу – є повільність роботи сайту, а також,навіть при багаторазовому перезапуску, сервіс відмовлявся розкривати іконки з транскрипцією слова.

Стосовно частини курсової роботи, присвяченої тлумачним словникам. Можливо, було не вірним порівнювати багатомовний проект Вікіпедія (енциклопедію із функцією тлумачного словника) із сервісом українського тлумачного словника Словник.Нет. Бо переваги Вікіпедії очевидні.

Крім тлумачення, система запропонувала звернутись до статей, в який зустрічається слово - Це дає можливість багатовимірного вивчення даного слова.

Але із тлумаченням іменника «зухвалість» у Віквпедії виникли труднощі. Система навела лише декілька статей в яких зустрічається дане слово, але змісту слова не розкрила. З цим завданням добре впорався Словник.Нет, надавши обґрунтоване значення цього слова. Із тлумаченням діалектичного слова обидва словника впорались, але більше інформації запропонував Словник.Нет. Взагалі, український тлумачний словник Словник.Нет впорався зі всіма завданнями добре, єдине, що мені не сподобалось – велика кількість скорочень.

Останнім етапом курсової роботи було тестування систем перекладу в Інтернеті: Promt та Sysytran. Для завдання я обрала 2 тексти різних за стилем написання та складністю побудови речень.

Краще всіх з перекладом текстів впорався онлайн-сервіс www.translate.ru від компанії Promt. Зміст перекладу уривку художнього тексту, не дивлячись на зроблені помилки, можна було зрозуміти без проблем. При перекладі спеціалізованого тексту система перекладу впоралася гірше, але загальний зміст уривку взятого з Декларації Незалежності США був доволі зрозумілим. Коли виникає нестандартна ситуація система утруднюється перекласти текст. Наприклад, одне підрядне речення ускладнюється іншим або, навіть, елементарною вставною або пояснювальною конструкцією і, як наслідок, розривається. Програма не знаходить підходящого алгоритму граматичного аналізу - вона відразу забуває про синтаксис і починає елементарний послівний переклад, формально (за допомогою флексій) намагаючись зв'язати хоча б поряд написані слова. Ця спроба зв'язати граматично поруч стоячі слова, неправильним вибором значень деяких слів, ще більше ускладнює розуміння перекладу.

Компанія SYSTRAN, незважаючи на заявлене на сервісі велику кількість тематичних словників, не змогла здійснити виразний переклад уривку художнього тексту й допустила велику кількість неточностей при перекладі Декларації США. Багато слів було перекладено не правильно, граматичний синтез фактично відсутній, декілька слів залишились на первісній мові тексту.

У цілому якість онлайн-перекладу сервісу SYSTRANet залишає бажати кращого. Хоча цілком можливо, що даний сервіс із перекладом текстів з інших мов справляється краще.

Головною перепоною для досягнення високоякісного перекладу є те, що мова - це жива структура, що не піддається повній алгоритмізації й, отже, за допомогою одних лише алгоритмів проблему машинного перекладу не вирішити. Машина не розуміє текст, вона лише перетворює його за допомогою різних алгоритмів і правил. І не важливо, скільки буде цих правил, без, хоча б, загального розуміння вхідного тексту, не може бути зв`язного й стабільного процесу перекладу. На рівні простих речень і в межах певної жорсткої тематики машинний переклад, в принципі. можливий, але не більше.

До рівня повної автоматизації перекладу людство ще не дійшло, та й дійде, імовірно, не швидко. Причиною цьому є, імовірно, недостатній рівень розвитку наук, пов`язаних із створенням подібних систем. Занадто складно сказати, як людина перекладає - а тим більше складно змоделювати цей процес за допомогою комп'ютерної програми. Тим більше складно зробити це, якщо врахувати, що людина мислить образами, а навчити цьому комп'ютер - неможливо в принципі.

Мова - відбиття реального життя. А життя не стоїть на місці: з'являються нові галузі виробництва, науки, бізнесу, культури. У звичайне розмовне мовлення приходять нові слова, терміни, сталі словосполучення. Тому повністю покладатись на переклад зроблений машиною не варто.