Чисто новият електронен преводач на ЕК, вграден в интернет страницата на Българското председателство на Съвета на ЕС, представен вчера от министър Лиляна Павлова и проф. Светла Коева, директор на Института за Български език на БАН, стана само за ден хит в социалните мрежи. Преводачът е автоматичен - превежда текст от и на български език от останалите 23 езика в ЕС и се намира на този адрес: https://eu2018bg.bg/bg/translation.

Новият инструмент веднага бе "изпитан" от потребители в частта му за превод от български на английски и обратно. Оказа се, че понякога се получават не дотам сполучливи словосъчетания... 

Например ако се напише слоганът на Европредседателството "Съединението прави силата", английският превод няма нищо общо с официалното "United we stand strong", ами е "The compound makes the force". Думата "compound" наистина значи "съединение" и точно тази дума ще ви излезе, ако ползвате електронен българо-английски речник и напишете в него "съединение". Само че става дума за ... химическо съединение. "Единство", което е смисълът на слогана, е Unity.  За сравнение Google Translate превежда българската фраза така: "Unity makes strenght", което е доста по-близо до реалното значение. 

Някои фрази, тествани от потребителите, например "Къде мога да ям боб" - са си съвсем точни на английски - "Where can I eat beans". Шопската салата обаче се оказва костелив орех за европреводача - ако Google Translate я превежда като Shopska salad, то в сайта на Председателството ще получите "shopping salad"... Думата "такси" на български също е трудна - на английски се получава "fees" - множественото число на думата "такса". Баницата, която практически няма еквивалент на английски и преводачът на Google просто транслитерира думата на латиница, то европейският преводач ще ви прати за ... банани. И така нататък. 

Европреводачът обаче се представя много по-добре, ако му се даде специализиран документ - например някой европейски регламент. Въобще с "цели" текстове, а не само с фрази от всекидневната реч инструментът наистина постига доста по-добри резултати, показват опитите. И още нещо - завършени изречения, ако са без препинателния си знак накрая - наример точка, се превеждат по-неточно, отколкото ако мисълта е завършена и с прилежащата й пунктуация. Например "I am fine, thank you" без точка накрая излиза като "Аз съм глобен, благодаря", но с точката става "Аз съм наред, благодаря". (Fine на английски се превежда и като глоба, глобявам - б.р.) Преводът от английски на български, а не обратното също е сравнително по-точен. 

IT специалистът Божидар Божанов - един от тествалите преводача, обясни каква е вероятната причина за "смешките" и за добрия превод на документи и всъщност похвали работата, свършена по направата на европейския преводач:

Отворих системата за преводи на ЕК, която е вградена в сайта на председателството (https://eu2018bg.bg/bg/translation). 

И да, получават се забавни преводи на разговорна реч, песни и други неща. I'm fine, thank you не е "аз съм глобен, благодаря". И сигурно сме готови да скочим срещу ЕС как харчи публични средства, за да направи по-лош Google translate.

Но трявба да поставим инструмента в контекст - основната му цел е да се използва за превод на документи и официална комуникация. И когато го пробваме с такива текстове, резултатите са доста, доста добри.

Пуснах текстове от два регламента на ЕС (eIDAS и GDPR) за превод и разликите на резултата с официалния превод са изцяло стилистични. Така че, добра работа.

Интересното е, че пуснах същите текстове на Google translate и той извади същите резултати, със същите грешки. След като пуснах още няколко текста от тези регламенти обаче, имаше малка разлика между инструмента на ЕК и Google translate. Ясно е, че и двата инструмента са ползвали правните текстове и техните преводи в корпусите, с които тренират невронните си мрежи. Интересно е обаче дали инструментът на ЕК (т.е. на Tilde) не сравнява своя превод с този от Google translate по някакви критерии, и ако собственият му е по-лош (според тези критерии), не показва превода на Google translate.

 

Според професор Светла Коева, която представи преводача ден по-рано, както съобщиха от Председателството, за реализирането на превод, максимално близък по смисъл и съдържание до текстовете на български, е използвана т. нар. „невронна мрежа“, наподобяваща човешкото мислене - изкуствен интелект изучава целия контекст на изречението, за да предложи гладък, четивен, почти „човешки“ превод.

С новият инструмент могат да се превеждат текстове, документи и цели уебсайтове - и трите функционалности са налични. Българската версия на преводаческия инструмент е разработена в партньорство с Института за български език на БАН и Виенския университет, с подкрепата на Главна дирекция „Преводи“ на ЕК, в партньорство с държавите от тройката Австрия и Естония и водещата технологична компания в областта на езиковите и преводните услуги Tilde.

Преводачът на ротационното председателство на Съвета на ЕС съчетава услугата eTranslation – един от основните елементи на Механизма за свързване на Европа, разработена от Главна дирекция „Преводи“ на ЕК, с инструменти за превод на националните езици на ротационните председателства, специално разработени от водещата европейска технологична компания в областта на езиковите и преводните услуги Tilde.