Helyesírás-ellenőrzők

Ingyen a weben

Hagyományos őszi sajtótájékoztatóján számolt be az elmúlt hónapok eredményeiről a MorphoLogic. Tavaly óta interneten át ingyenesen használható a Helyes-e? helyesírás-ellenőrző magyar változata, ez most angol, amerikai és német változattal bővült a www .primposta.hu felhasználói számára, az ingyenes szolgáltatásként korábban elindított internetes MorphoLogic-szótárközpont, a MoBiDictionary (www .mobidictionary.com) pedig már további portálokról is elérhető.

Két, a szomszédos országokkal kapcsolatos hírről számolt be Prószéky Gábor ügyvezető igazgató. Elkészült a ragozó szinonimaszótár-program román nyelvi változata, amely tetszőlegesen toldalékolt román szavakra a szó szótári alakját ajánlja fel, és ehhez keres további rokon értelmű alakokat. Másrészt a MorphoLogic teljes magyar nyelvhelyességi csomagja része lett a szlovák nyelvre lokalizált Office 2000 csomagnak, ugyanis a Microsoft adatai alapján a szlovákiai magyarság számaránya megfelel a nyelvi kisebbség általuk használt definíciójának.

Az ékezet nélküli magyar szövegek automatikus ékezetesítését végzi a nemrégiben elkészült InDia (Insertion of Dicacritics), ez elsősorban az e-mailben érkezett dokumentumoknál lehet hasznos.

Egyelőre elsősorban külföldi kiadók használják a Helyes-e? rendszer statisztikai modulokkal kombinált változatát, amely nagy mennyiségű adat (könyvek, kiadványok) hatékony helyesírás-ellenőrzésére szolgál, az ellenőrzési idő alatt kimutatásokat készít a hibákról, illetve a dokumentumban előfordult ritka szavakról.

Az utóbbi év egyik legfontosabb fejlesztése a Windows 2000 operációs rendszer Index Serverét "tanítja meg" magyarul, azaz a Win2000-ben végzett összes keresés a magyar szavak tövei szerint, nem pedig a betűalak szerint történik, tehát a Word-, Excel- vagy PowerPoint-anyagokban, HTML-lapokon megtalálhatók a formailag különböző, de azonos jelentésű szóalakok. Ehhez kapcsolódik a találatkiemelő modul, amely a fájlon belül képes kiemelni a megtalált szavakat, és a fejlesztés elindult a szinonimákon keresztül történő keresés irányába is. A találó nevű "nyelvi boszorka" (LangWitch) rövid szövegrészből is felismeri a különböző nyelveket, és meghívja a megfelelő nyelvi ellenőrzőt.

A cég közel tízéves története során most indult az első olyan K+F projekt, amelynek a finanszírozásában magyar állami intézmény is részt vesz. A téma a magyar szövegek optikai karakter- és kézírás-felismerésének támogatása; az OCR-programokban szokásos utólagos helyesírás-ellenőrzés helyett a kutatás aktív együttműködést javasol a nyelvi és a jelfelismerő rész között. Alapvetően új elem tehát a nyelvi és a nem nyelvi rendszer interakciója, amelyhez már megkezdődött a meglévő technológiákra épülő programrendszer kidolgozása.

Végül megemlítjük, hogy az EU-csatlakozással kapcsolatos jogharmonizációs feladatok fordítási munkáira kiírt Phare-projekt keretében a MorphoLogic nyelvtechnológiai eszközeinek segítségével negyvennégyezer oldal jogharmonizációs fordítás készült el. A fordítások közben létrejött egy tizenkétezer kifejezésből álló EU-jogi terminológiai adatbázis.