Главная Обратная связь

Дисциплины:

Архитектура (936)
Биология (6393)
География (744)
История (25)
Компьютеры (1497)
Кулинария (2184)
Культура (3938)
Литература (5778)
Математика (5918)
Медицина (9278)
Механика (2776)
Образование (13883)
Политика (26404)
Правоведение (321)
Психология (56518)
Религия (1833)
Социология (23400)
Спорт (2350)
Строительство (17942)
Технология (5741)
Транспорт (14634)
Физика (1043)
Философия (440)
Финансы (17336)
Химия (4931)
Экология (6055)
Экономика (9200)
Электроника (7621)






Автоматты (машиналық) аударма



Машиналық аударма жүйелері кибернетикалық модель жасау аясына қатысты болуы себепті шет тіліндегі мәтінді ана тіліне және керісінше аудару тұсындағы адамның тілдік әрекеті арқылы іске асады. Сондықтан аударма ісі электронды-есептеу машиналарының (ЭЕМ) көмегімен аудармашы әрекетін қайталауға бағытталады.

Аудармашының тілдік әрекетінің, яғни сөйлеу-ойлау қызметінің моделін машиналық аударма жүйесі арқылы жүзеге асыру екі түрлі таптастыру параметрлері бойынша анықталады:

– автоматтандыру дәрежесі, яғни компьютерге жүктелетін жұмыстың нақты көлемі. Мұнда мынадай жағдаяттарды айырып қарастыру керек [19, 3-б.]:

1) аударма жұмысы толығымен немесе толыққа жуық ЭЕМ арқылы орындалады;

2) аударма жұмысын аудармашы атқарады да, ал ЭЕМ жәрдемші рөлін атқарады (мысалы, қажетті сөздің аудармасын сөздіктен тауып алу жұмысында).

– аудармашы адамды қатыстыру стратегиясы, яғни аударма жұмысының негізгі бөлігі компьютер арқылы орындалады да, ал аудармашы аударылған мәтінді өңдеуге, яғни аудару кезінің әр тұстарында (басында, ортасында, аяғында) редакциялық жұмысқа қатынасады [20, 12-13-бб.].

Аудармашының сөйлеу әрекетінің ерекшелігі мынаған саяды: бастапқы нысан ретінде бір тілдегі мәтін алынады да, ал тілдік қызметтің нәтижесі ретінде – мағыналық жағынан аударылуға тиісті мәтінге барабар, басқа тілдегі мәтін болып табылады. Басқаша айтқанда, аталған нәтиже міндетті түрде мәтін түрінде ұсынылуы қажет.

Аталған ерекшелік автоматты аудармаға белгілі принциптік құрылымды сақтауды міндеттейді. Төменде ондай құрылым мүмкіндігінің ең жақсы деген (идеалды) көрінісі берілді.

«Х» тіліне талдау жүргізу мен оны өзгертудің мақсаты – «Х» тілінің сөздігі, грамматикасы және қолдану ережелері негізінде «Х» тіліндегі мәтіннің мазмұнын ашу. Ал «Ү» тіліне жинақтау әдісін қолдануды – «Ү» тіліндегі шығару мәтінін құрастыру (немесе оны синтездеу) деп атайды. «Ү» тіліндігі мән-мағына сол тілдің сөздігі мен грамматикасы негізінде ашылады.



ЭЕМ-сыз дәстүрлі аудармашының мәтінді аудару кезіндегі талдау мен жинақтау компоненттерінің орын алуы айқын түрде байқалмағанымен, автоматты аударма жасау процесінде ондай тәсіл бөліктері міндетті түрде орын алуы қажет.

       
   

 

 


АНАЛИЗ СИНТЕЗ

(талдау) (жинақтау)

 

       
   

 


«Х»-ті өзгерту «Ү»-ті өзгерту

 

 
 

 


Сызба.Автоматты аударма процесінің

идеалдық құрылымы

 

Ал сызбадағы «өзгерту» топтамасының қажеттілігі ең қарапайым жағдайда да айқын байқалады. Мысалы, аударуға қажетті «Х» тілінің сөздік бірлігі мағыналық жағынан екінші тілдің («Ү») сөздік бірлігімен және екі тілдің («Х» пен «Ү») синтаксистік құрылымдары да бір-бірімен сәйкес келіп тұрған жағдайда да (тіпті сөздердің орналасу тәртібіне дейін) тиісті өзгерістердің жасалатыны белгілі. Негізінен алғанда, сөздердің грамматикалық тұлғалары мен аударма баламасының сөйлем ішінде дұрыс орналасу тәртібі өзгертуді қажет етеді.



Бірақ жоғарыда қарастырылған жайт идеалды жағдаятына сай және тілдің шектеулі сөздік бөлігі мен синтаксисіне тән болып келеді. Сонымен бірге мұндай жағдаят тек әрбір нақты тілдер жұбы үшін ғана ұтымды деуге болады. Әзірше екі тілдің лексикалық бірліктері мен синтаксистік құрылымдары бойынша басым көпшілік тілдерге жоғарыда аталғандай тұспа-тұс сәйкестік жайлы айту қиын. Оған себеп – әртүрлі тілдердегі көп мағыналы сөздер көлемінің сәйкес келмеуі. Лексикалық сәйкестіктің ең соңғы бұзылу жағдайы – қайсыбір тілдерде баламасыз лексиканың болуы. Әдетте, олар тұрмыстық бұйымдарды, мәдениетті сипаттайтын сөздердің екінші (аударуға қажетті) тілдің лексикалық қорынан орын алмайды. Мұндай жағдай лексикалық элементті сипаттау немесе калькалау үшін оның мәнін дұрыс түсінуді қажет етеді. Басқаша айтқанда, мағынаға сәйкес келтіру үшін қажетті деген өзгертулерді (өңдеулерді) жүргізу керек болады.

Егер аударма мәселесін, автоматты аударманы қоса есептегенде, тіларалық сәйкестіктің бұзылуы тұрғысынан қарастырсақ, онда оның мақсатын екі тіл жұбы мәтіндерін мағыналық сәйкестікке келтіру деп ұғыну қажет. Яғни екі тіл арасындағы әртүрлі элементтердің (сөздік, құрылым, сөздер тәртібі және т.б.) мазмұнды ашу құралдарын сәйкестікке келтіру деп түсіну керек болады. Мұндай сәйкестікке келтіру мәселесін шешу жоғарыда көрсетілген сызбадағы топтамалар қызметінің барлық машиналық аударма жүйесінде орындалуын қажет етеді. Сәйкестікке келтіру мүмкіндігі және аударманың принциптік жақтарының барлық тілдерге ортақ болуы тілдің сызықтық және таңбалық сипаттарына негізделеді (Ф. де Соссюр). Ал таңбалық қасиеттің негізінде (мағыналық тұрғыда) барлық халықтардың ойлау қызметін таңбалау мен қоршаған ортаның физикалық ортақ қасиеттерінің жататыны белгілі.

Машиналық аударманың «өмірге келуіне», біріншіден, ХХ ғасырдың екінші жартысынан бастап әр елдерде (континенттерде) бірнеше тілдегі ақпарат ағымының қарқындап өсуі, екіншіден, ғылыми-техникалық прогресс үшін оларды меңгеру қажеттігіне қатысты әлеуметтік себептер негіз болды. Осыған байланысты машиналық (автоматты) аударма жұмысының даму барысына қатысты кейбір жайттарға тоқталайық.

Аталған әлеуметтік себептер аударма мәселесінің шешімін табуды және оның ұтымды жолдарын іздестіруді қажет етті. Бұған ең алдымен аудармашының тілдік қызметінің ерекшеліктері ішінен шеттілдік мәтіннің құрылымын зерттеудегі таза формалды талдау жолын жатқызуға болады [21]. Мысалы, аудармашыға мәтіннің грамматикасы және лексиканың көмекші сөздері мен есімдік сөздері және басқа да осы сияқты функционалды грамматиканың элементтері белгілі болғанымен, салалық мәтіннің арнайы лексикасы таныс болмауы мүмкін.

Шеттілдік мәтінді аударудағы оның тұрпаты (формасы) бойынша мән-мағынаны ашу ерекшеліктерін модельдеу, ең алдымен, аудармашының іс-әрекетін зерттеу нысаны ретінде алуға бірден-бір себепші болды. Сонымен, мұндай модельдеу шеттілдік мәтінді аударуда тілдің ақиқат деректерін «шеттетіп», тілдің семантикасын арнайы талдамай-ақ, формалды тұрғыда аударма баламасын табуға мүмкіндік жасайды.

Автоматты аударма жасаудың бастамасы ретінде ресми түрде 1949 жыл саналады. Тілді формалды тұрғыда қарастыра отырып, электронды-есептеу техникасының көмегімен аударманы жүзеге асырудан бұрын оны механикалық машиналар жолымен іске асыру идеясы аталған мезгілден де көп бұрын бастама алғаны белгілі. Мысалы, А.Кахердің ойлап тапқан аударма-жазба машинасы жайлы мәлімет «Үава таа» газетінде 1924 жылдың 24 ақпанында шағын хабарлама ретінде жарық көрген болатын [22]. 1933 жылы Кеңес Одағында П.П.Смирнов-Троянскийге бір тілден екінші тілге аудару машинасын ойлап шығарғаны үшін арнайы патент тапсырылғаны да жұртшылыққа мәлім [23].

Аударма жасауда екі немесе одан да көп тілдердің бірліктері арасындағы мағына сәйкестігін анықтау үшін алғашында механикалық тәсілдер қолданылды. Сондықтан аударма жұмыстарының жетістіктері әлемдік ғылымға тек ХХ ғ. 50-жылдарында ғана белгілі бола бастады. Ең алғашқы машиналық аударма жүйелері АҚШ-та пайда болды. Тарихи тұрғыдан қарастырғанда машиналық аударма жүйесін құрастыруға жалпытілдік көзқарастағы криптография (шартты белгілермен жазылған құпия жазу) саласының теориясы мен практикасы негіз болды.

Екінші дүниежүзілік соғыс кезінде әр елдерде, әсіресе Англия мен АҚШ-та құпия хаттардағы шифрлы жазуды үйреншікті жазуға ауыстыру (дешифровка) жұмысын машинасыз да және машинамен де әрекет ету арқылы көптеген нәтижелерге қол жеткені белгілі. Мысалы, гитлерлік басқару орындарының шифрланған бұйрықтары мен хабарларын жай жазуға айналдыратын «Ультра» атты дешифровалды машинаның құрастырылғанын айта кетуге болады.

Лингвистикалық тұрғыдан қарастырғанда, шифрланған (кодталған) хабарды дәстүрлі жазуға келтіру дегеніміз, ол лексикалық қоры белгісіз және грамматикалық ережелері әлі анықталмаған шет тілінде жазылған мәтінді аудару жағдаятымен барабар деуге болады. Мұндай аударма жұмысы бір кодтағы жүйеден екінші кодтағы жүйеге ауыстыру әрекетімен бірдей келеді.

Дешифровщиктер мамандардың пайымдауынша, шифрланған (кодталған) хабарды жай жазуға келтіру әрекетіне қарағанда бір табиғи тілдегі мәтінді екінші табиғи тілге аудару әрекеті жеңіл деп бағаланады. Себебі, қазіргі табиғи тілдерді сипаттайтын көптеген сөздіктер мен грамматикалардың негізінде тілдің өзіне ғана тән лексикалық, морфологиялық және синтаксистік ерекшеліктері алдын ала белгілі деуге болады. Ал есептеу техникасы ондай сөздіктер мен грамматикаларды қалаған тәртіпте, бағдарламаға сай өз жадында орналастыра алады.

1946-1947 жылдары ЭЕМ арқылы машиналық аударма жасау идеясы Принстонның ғылыми-зерттеу институтында арнайы мәселе ретінде талқыланады (У.Уивер, А.Л.Бут және т.б.). Ең алғаш бұл идея дешифровка ісінің америкалық маманы Уоррен Уивердің меморандумында бірізді шешімге келтірілді. Ал 1949 жылдың 15 шілдесінде атақты ғалым өз меморандумында көтерілген мәселелерді тіл және есептеу техникасы мен дешифровка салаларындағы екі жүзден астам мамандарға жария етті.

У.Уивер машиналық аударманың принциптік мүмкіндігін мүлде бөлек тілдердің ұқсас қасиеттерімен және әр тілдің өзіне ғана тән формалды сипатта болуымен байланыстырады. Қорыта айтқанда, У.Уивердің пікірі бойынша, қытайша жазылған кітапты қытайша шифрланған (кодталған) ағылшынша немесе басқа ұлттық тілдердегі кітап деп түсінген жөн [24, 33-45-бб.].

Сонымен машиналық аударманың өзінше бөлек ғылыми бағыт ретіндегі даму кезеңі Уивердің меморандумынан бастама алады. Бұл бағытты, шартты түрде, негізгі үш кезеңге бөліп қарастыруға болады [25; 19; 26; 27]. Мысалы, ол хронологиялық жағынан былайша айырым табады:

1-кезең: 1949 жылдан бастап 60-жылдардың ортасына дейін;

2-кезең: 60-жылдардың ортасынан 70-жылдардың аяғына дейін;

3-кезең: 80-жылдардан қазіргі кезеңге дейін.

Мұндай үш кезеңге бөлуге негіз болған ғылым мен техниканың дамуындағы қол жеткен нәтижелер екені белгілі. Міне, солардың ішінен лингвистикалық, математикалық, техникалық машиналық аударма жүйесін жабдықтау мәселелері айрықша орын алады.

1954 жылы АҚШ-та Джорджтаун университетінде проф. Леон Е.Достердің жетекшілігімен GAT жүйесі негізінде құрастырылған орыс тілінен ағылшын тіліне аударатын машиналық аударма жүйесі жұртшылық назарына ұсынылды. Бұл бір тілден екінші тілге ЭЕМ (IBM-701) арқылы орындалған ең алғашқы аударма тәжірибесі болып саналады. Ғылымда бұл тәжірибе Джорджтауындық эксперимент деген атпен тарихта қалды [24]. Аталған экспериментте «тікелей» машиналық аударма жағдаяты (бір тілдік жұпқа қатысты жүйелер) тексерістен өткен болатын. Жүйе сөздігінің көлемі бар болғаны 250 сөзді ғана қамтыса, ал оның грамматикасы тек алты синтаксистік ережеге ғана негізделеді [20]. Кеңес Одағында француз тілінен орысшаға аударатын машиналық аударманың бірінші эксперименттік жүйесі О.С.Кулагина мен И.А.Мельчуктың авторлығымен 1955-1956 жылдары құрылғаны осы сала мамандарына белгілі [28]. Бұл жүйедегі негіз сөздер сөздігі 1236 сөз, ал сөз айналым сөздігі 250 бірлікті қамтиды. Аударма бірлігі ретінде толық сөйлем түрі есептеледі. Морфологиялық талдау алгоритмі жалғаулардың кестесімен әрекет ету арқылы аударылатын фразаның (сөйлемнің) сөздеріне қажетті деген грамматикалық ақпаратты тіркейді. Бұл жүйенің артықшылығы – омонимдік сөздерді ажырата алатын топтамасы (блогі) болуында. Орыс тіліндегі фразаны синтездеу топтамасында сөздердің орналасу тәртібінің дұрыстығын тексеру мүмкіндігі алдын ала қарастырылған. Сонымен бірге, Т.Н.Молошнаяның жетекшілігімен ағылшынша-орысша аударма жасау жүйесінің алғашқы жобасы ұсынылды [29].

Машиналық аударма жұмысының бастамасы, жалпы алғанда, өрлеу сипатында болды – тілшілер зерттеудің жаңа бағытын ашты, ал программистер күн тәртібіндегі күрделі және аса қызықты мәселелердің шешімін табуға қызыға кірісті. Бұл кезеңде тіл мен аударма процесіне қатысты барлық мәліметтерге қол жеткендей сезілді. Сондықтан егер оларды формалды пішінге келтіру ісі жүзеге асырылса, машиналық аударманың әмбебаптық жүйесі құрылып, алға қойылған негізгі мақсатқа тез арада жететіндей көрінген болатын. Бірақ бастапқы және кейінгі тәжірибелердің нәтижелері бұл мәселенің шешімі ойлағандай оңай табылмайтынын байқатты.

Солай бола тұра, атқарылған жұмыстар тек машиналық аударма аясындағы зерттеулерге ғана емес, сонымен бірге ғылыми ізденушілерді тілдің теориялық және құрылымдық жағына да көңіл аударуға ынталандырды.

Қорыта айтқанда, автоматты аударманың бірінші кезеңі белгілі дәрежеде айтарлықтай нәтижелі болды. Себебі, аталған кезеңде көптеген іргелі мәселелердің бастамасы анықталып, зерттеудің болашағы сараланып, жолдары айқындалды. Мысалы, автоматты сөздіктерді құрастыру, аралық-тілдіқұрастыру, сөздердің омонимдік сипаты мен синтаксистік құрылымы, яғни сөздердің сөйлемдегі тіркесімі, фразеологизмдердің жасалу жолдары және көптеген басқа да мәселелердің сыр-сипаттары анықталды.

 

 

28. Аударманың сыны /таппадым кімде бар болса айтындаршы/

 

 

29. Аударма сапасын бағалау әдістері.


Эта страница нарушает авторские права

allrefrs.ru - 2018 год. Все права принадлежат их авторам!