2000/2

Könyvszemle

INTELLIGENS SZÖVEGKEZELÉS SZÁMÍTÓGÉPPEL

A modern kor igényeinek megfelelő informatikai szemléletű nyelvész, illetve nyelvészeti nézőpontú informatikus szerzőpáros munkája kitűnően mutatja be a magyar nyelvi technológia mai állapotát. Az Európai Unióhoz közeledve nemcsak a gazdaságnak, a jogrendszernek, a közigazgatásnak, az oktatásnak, hanem a nyelvészeti kutatásoknak és az informatikának is változnia kell. Fel kell készíteni hazánkat és anyanyelvünket az új kommunikációs helyzetekben való sikeres szereplésre. Nemcsak nagyszámú új kifejezést kell befogadnunk, hanem meg kell felelnünk a gyors, hatékony kommunikáció igényeinek is, amiben az informatikának kell segítenie a nyelvhasználókat. A haladó szellemű magyar nyelvtudományban erősödik a felismerés: a nyelvi mérnökökre vár a feladat, hogy helyesírás-ellenőrző, nyelvhelyesség-ellenőrző, elválasztó, pontos és hatékony keresést biztosító, szótárazó, illetve fordító programokat kell kifejleszteni. Prószéky Gábor és Kis Balázs kötetében minderről megtudhatjuk a legfontosabb és legfrissebb információkat. Számítógépes nyelvészet címmel már 1989-ben megjelent egy kötet Prószéky Gábortól, és eljött az idő, hogy erről a rendkívül gyorsan változó területről újabb, komoly tudományos értékű összefoglalás szülessen.

A kötetet akár tankönyvként és tudományos forrásanyagként is kiválóan alkalmazhatják a nyelvész és informatikus szakemberek, valamint a témával csak most ismerkedők, ami különösen annak köszönhető, hogy a számítógépes szövegkezelés, a digitális nyelvi modellezés sok tekintetben új tudományterületén logikus és következetes terminológiát dolgoztak ki a szerzők.

Megismerhetjük miként működnek a magyar nyelvű szövegszerkesztőket használók számára évek óta természetes elválasztó, helyesírás-ellenőrző, és újabban már nyelvhelyesség-ellenőrző programok, milyen nyelvi modellezés van a háttérben. A magyar nyelv teljes struktúráját feldolgozó, kétszintű morfológiai számítógépes nyelvi modellt kellett felállítani ahhoz, hogy a nyelvünk szerkezetének és szabályainak megfelelő gépi helyesírás-ellenőrzés hatékony legyen. Azért kell képessé tenni a nyelvhelyesség-ellenőrzőt a nyelv modellezésére (így a megjelenő szöveg elemeinek a felismerésére és elemzésére), mert gyakorlatilag lehetetlen kivitelezni olyan működőképes automatát, amelyik ismeri az összes lehetséges szóalakot, szintagmát és ezek minden kombinációját. A magyar nyelv morfológiai alapú számítógépes modellezésével - azaz a morfémák és azok alakváltozatainak felismerésével, valamint az alkalmazási szabályok összekapcsolásával - a helyesírás és nyelvhelyesség-ellenőrző képes a szöveg felszíni szerkezetén megjelenő szóalakok helyességét eldönteni. Már önmagában ez is komoly tudományos eredménynek tűnik, de még mindig nem elég a szövegszintű nyelvhelyesség-ellenőrzéshez. A nyelvi modellező programnak a szóhatárt is át kell lépnie ahhoz, hogy a szintaktikai összefüggések ismeretében legyen képes javaslatokat adni a mondatszerkesztési, szórendi és egyéb hibák kijavításához. Hangsúlyozni kell azonban, hogy a számítógépes helyesírás és nyelvhelyesség-ellenőrzés nem csodafegyver, nem helyettesítheti az anyanyelvi ismereteket, hiszen ezek hiányában nem leszünk képesek a felkínált alternatívák közül választani.

A számítógéppel készülő dokumentumokban keletkező tipikus hibákat felsoroló fejezetből megtudhatjuk, hogy a legtöbb hiba a karakterek (betű, szám, írásjel, speciális jel stb.) eltévesztéséből (ti. gépelési hiba), illetve a lexémák szintjén keletkező, egyszerűbb helyesírási, nyelvhelyességi hibákból származik, míg stilisztikai, tipográfiai hibákból áll a kisebbik rész. A jó, szószintű helyesírás- és nyelvhelyesség-ellenőrző programok általában a jelentkező hibák 80-85%-át képesek kiszűrni, a maradék 15-20% javítására a szó szintjénél nagyobb szerkezeti egységeket is felismerő programra van szükség.

Egyre nagyobb az igény arra, hogy a - főként az európai integráció és globalizáció miatt - jelentkező nagy mennyiségű fordítást gépileg gyorsítsuk. Különbséget kell tennünk a piacon ma fellelhető digitális szótárak, egyszerű szótárazó programok és a valódi, magas színvonalú fordító programok között. Az utóbbiakból csak nagyon kevés, nagyon drága rendszer létezik a világon. A Prószéky-Kis szerzőpáros érdekes párhuzamot von a jó számítógépes fordítórendszerek és a világ legjobb sakkautomatáinak működési elve között. Ezek az eszközök a világ legtökéletesebb sakkozóinak a megoldásait, szituációit "tanulták meg", és közülük képesek rendkívül gyorsan az aktuális helyzetnek megfelelő analógiát keresni. A jó számítógépes fordítóprogramok mindegyike rendelkezik ún. fordítómemóriával, amelyik, a sakkautomatához hasonlóan, az éppen fordítandó szöveghez hasonló, egyszer már emberi fordító által megoldott változatot, analógiát keres.

A nyelvi információtechnológia az ember szövegalkotását bonyolult rendszereivel kiegészíti, segíti, gyorsítja, pontosítja, de az emberi munkát helyettesíteni nem képes. Prószéky Gábor és Kis Balázs kötetéből megtudhatjuk, hogy milyen nyelvi modellre épül, és a gyakorlatban hogyan működik a számítógépes szövegkezelés. (Prószéky Gábor-Kis Balázs: Számítógéppel emberi nyelven.. SZAK Kiadó, Budapest,1999.)

Bódi Zoltán


<-- Vissza az 2000/2 szám tartalomjegyzékére