Може ли компютърът да превежда? Новият софтуер BULTRA на българската фирма ProLangs се опитва да даде отговор на този въпрос. Програмата е предназначена за всеки – както за хората, които въобще не знаят английски, така и за професионалните преводачи, смята д-р инж. Стоян Димитров, управител на ProLangs. Докато предимството за първите е ясно, заклетите преводачи трябва да помислят, дали им отнема повече време да превеждат ръчно, или да редактират вече преведения от BULTRA текст.
Работа с BULTRA
Програмата прилича на текстообработващо приложение, подобно на MS Word, като се състои от два панела – левият е за оригинала на английски език, а десният – за преведения текст на български.
Оригиналът може да бъде файл, да се въведе ръчно, да се сканира или с помощта на copy и paste да се вземе от друго приложение. Имате възможност за превеждане на целия документ, отделни страници, абзац или прескачане на места, които не желаете да се превеждат. След това трябва да изберете лексическата база, спрямо типа текст от падащо меню. BULTRA има основна база, съдържаща 250 300 думи и изрази (за сравнение един двутомен речник има около 50 000 думи), както и няколко специализирани лексически бази (виж вид и обем на базите). Програмата предоставя възможност за въвеждане на думи и изрази, които липсват в базите от данни.
След превода можете да запазвате, отпечатвате, редактирате и форматирате както оригинала, така и превода. Разбира се, ще се наложи да редактирате превода.
Скорост, разбираемост и адекватност
Според тестовете, проведени от фирма ProLangs, в зависимост от вида на компютъра превод на 50 страници се извършва в границите от 60 до 160 секунди т.е на секунда се превеждат максимум до 133 думи. По отношение на това колко добър е преводът се използват две характеристики: разбираемост и адекватност (доколко смисълът на преведения текст отговаря на оригинала). При тест на 595 различни по синтаксис изречения, 53% от преведените изречения са за оценка “отличен” и в 35% за оценка “много добър”.
Успешния превод е на 88%. В 12% от изреченията оценката е по-ниска от много добър. Изискването разбира се е английското изречение да е написано правилно.
Принцип на действие
Първият етап от създаването на софтуер за превод е натрупването на лексически бази. За всяка дума от английския език се въвеждат значенията за глагол, съществително, прилагателно и т.н., както и например спреженията по род и число и окончанията за времената на глаголите.
Алгоритъмът на превеждане започва с определяне началото и края на изречението, предсинтактичен анализ и синтактичен анализ. Следва синтеза на преведеното изречение, като междувременно може да се избере друго (не основното) значение на дадена дума.
Технически изисквания и цени
“BULTRA” работи под Windows 9x и Windows NT, като е желателно оперативната памет да бъде минимум 32МВ. За инсталиране на програмата са необходими 50 МВ дисково пространство.
Базовата цена за BULTRA 1.0 е $590, а за версия 1.1, която поддържа потребителски речник е $690. Цените за допълнителните лексики са $299 или $399 в зависимост от лексиката. Закупилите BULTRA до края на 2001 ще ползват 50% отстъпка за българо-английския вариант. На сайта на ProLangs www.bultra.com ще намерите и таксите за онлайн превод.
Следващи разработки и допълнения
Ръководството на фирма “ПРО ЛАНГС” не счита, че компютърния преводач е окончателно завършен.
Продължава работата по усъвършенстване на алгоритмите и създаването на нови лексически бази. Работи се по техническа, строителна, спортна, химическа, физическа, политическа други лексически база. Усъвършенства се програмата за абонаментен и ограничен безплатен превод в Internet, която ще бъде пусната до края на март. По същото време ще бъде завършена и web-базираната версия за интранет сървър. Подготвя се българо-английският вариант за извършване на превод с помощта на компютър. Разработват се вариантите за превеждане от френски на български и от немски на български.
Вид и обем на базите*
Компютърният преводач от английски на български език съдържа няколко вида бази, които имат следния обем:
| Вид на базите
| Брой думи и изрази
|
| Основна лексическа база
| 250 300
|
| Специализирани лексически бази:
|
|
| -медицинска лексика
| 29 780
|
| -икономическа лексика
| 15 020
|
| -юридическа лексика
| 5 134
|
| -юридико-икономическа лексика
| 18 223
|
| -лексика по информатика
| 12 400
|
| -лексика по телекомуникации
| 16 000
|
| -военна
| 42137
|
| -военна и военно-политическа лексика
| 39 358
|
| -военна и военно-икономическа лексика
| 55 000
|
| -военна и съкращения на НАТО
| 41849
|
| -военна и съкращения на OOН
| 41726
|
| -военна и съкращения на UK
| 42016
|
| -военна и съкращения на USA
| 41775
|
В основната лексическа база са включени думи и изрази, обхващащи общата лексика в говоримия и писмения английски език.
Една част от общата лексическа база е със специализирани думи и изрази, включващи част от съдържанието на специализираните лексически бази.
Съдържанието на специализираните лексически бази включва:
-медицинска лексика. Обхваща специализирани думи изрази и съкращения в областта на хуманната и ветеринарната медицина, стоматологията, фармакологията, биологията и зоологията;
-икономическа лексика. Обхваща специализирани думи, изрази и съкращения в областта на икономиката, финансите, банковото дело, бизнеса и търговията;
-юридическа лексика. Обхваща специализирани думи, изрази и съкращения в гражданско-правните; наказателно правните и публично-правните науки;
-юридико-икономическа лексика.
Съдържа специализирани думи, изрази и съкращения в областта на правото и икономиката, финансите, банките, бизнеса и търговията;
-лексика по информатика. Обхваща специализирани думи, изрази и съкращения в областта на информатиката, компютрите, автоматизацията и електрониката;
-военна и военно-политическа лексика. Обхваща общи специализирани военни и военно-политически думи, изрази и съкращения, както и установени такива в страните членки на НАТО, САЩ, Великобритания и Франция;
-военна и военно-икономическа лексика. Насочена е в областта на специализирани думи, изрази и съкращения във военната икономика.
-военни лексически бази. Обхващат общи специализирани военни и военни думи, изрази и съкращения, използвани в страните членки на НАТО, САЩ, Великобритания и Франция и ООН.
Всяка от специализираните лексически бази работи съвместно с общата, тоест когато думата не присъства в специализираната база, значението й се взима от общата.
* Към 20.01.2001г.
Накратко
За: Висока скорост на превеждане, сравнително разбираем превод
Против: Необходимост от редакция на превода, добре е да знаете английски
Заключение: Идеален за хора, които не знаят английски и искат да разберат смисъла на даден текст. За постигане на добър превод на български, обаче се налагат сериозни редакции.
Бистра Папазова