Összebeszél az IBM és a Philips

Együtt fogja terjeszteni az IBM és a Philips a beszédfelismerési technikákat. A közös fejlesztések eredményeit mindkét cég mások rendelkezésére bocsáthatja és közzéteheti. Az IBM és a Philips közös célja egyrészt a minél több nyelvű beszédfelismerés megvalósítása, másrészt a szabványosítás elősegítése annak érdekében, hogy a beszédfelismerő programokat minél előbb széles körben használják. Emellett a Philips jogot nyert arra, hogy új programokba beépítse az IBM szövegfelolvasó modulját.

W. S. "Ozzie" Osborne, az IBM beszédrendszerek részlegének vezetője szerint exponenciálisan gyorsulva bővül a beszédfelismerő, illetve beszélő programok piaca, ahogy azok kilépnek a szokásos számítógépből, és megjelennek például a telefóniában, a hívásfogadó rendszerekben, a mobilkészülékekben. Ron van den Bos, a Philips beszédfeldolgozási részlegének vezetője szerint az IBM-mel kötött megállapodás előnye a kutatási erőforrások és a nyelvi fejlesztések megosztásának a lehetősége. A megegyezésről szóló jelentés kiemeli elemzőknek a CeBIT-ről szóló beszámolónkban megírtakat megerősítő véleményét, miszerint a beszédfelismerés a következő két-három évben a legfontosabb technikák közé emelkedik majd. A kezelő-gép kapcsolat fejlődésében ennek jut a legfontosabb szerep a következő évtizedben.

Az IBM ViaVoice beszédfelismerő programja több mint harmincéves kutatásra épül, mégpedig a beszédfelismerési algoritmusépítés mellett a kezelői felületére és az ember-gép kapcsolatéra is. Több mint száz szabadalma van az IBM-nek beszédfelismerésre, beszédszintetizátorra, beszélőazonosításra (ez áll a középpontjában Szolzsenyicin magyarul is megjelent regényének, "A pokol tornácá"-nak), valamint a természetes nyelv megértésére. Az IBM évekkel ezelőtt az elsők között hozott forgalomba beszédfelismerő programot - bénáknak, hogy a számítógépet kezelni tudják. A ViaVoice már nyolc nyelven ismeri fel a diktált szavakat, fogadja el a parancsokat.

A beszédfelismerés úttörőjeként törekedett és ezután a Philips-szel karöltve törekszik az IBM nyílt beszédfelismerő standardok kialakítására, hogy elősegítse e technikának az alkalmazását a tartalomszolgáltatásban, a kiszolgáló rendszerekben, az integrált beszéd-adat-alkalmazási infrastruktúra kialakulása érdekében. A Philips beszédfeldolgozási részlegét szintén az úttörők közé sorolják. Ők is a beszédfelismerési, természetes emberi beszéd- és nyelvmegértési technika világpiacának a vezető szereplői közé tartoznak. A beszédvezérelt telefonos programokat fejlesztő Philips megoldásait széles körben használják. A SpeechMania természetes dialógus és a SpeechPearl beszédfelismerő programot széles körben építik be különféle alkalmazásokba. A Philipsnél negyvenéves fejlesztési és piacra viteli tapasztalat gyűlt össze e témakörben, és 1993-ban elsőként dobott piacra folyamatos diktálást szövegbe áttenni képes PC-s rendszerrel. A kis irodai piacra készített FreeSpeech 98 és FreeSpeech 2000, valamint a professzionális gépíróknak szánt SpeechPro 16 nyelven ért. A VoCon beszédfelismerőt pedig már számos fogyasztói elektronikai készülékbe építik be. VaMá

A Philips negyven, az IBM harminc, Gordos Géza, a Budapesti Műszaki Egyetem Távközlési és Telematikai Tanszékének tanszékvezető professzora több mint húsz éve foglalkozik beszédfelismeréssel, beszédszintetizálással. A beszédfeldolgozás különféle aspektusait kutatók közül vele együtt a tanszékről még Németh Géza adjunktus, Olaszi Gábor docens, aki egyúttal az MTA Nyelvtudományi Intézet Fonetikai Laboratóriumának tudományos munkatársa is, Tatai Péter tudományos főmunkatárs és Vicsi Klára tudományos munkatárs, valamint az Ericsson Magyarország tanácsadója, Takács György vette át az Akadémiai Díjat a Magyar Tudományos Akadémia közgyűlésén. Kutatásaik eredményeképpen vannak használatban magyarul szépen beszélő rendszerek egynéhány, bár sajnálatosan kevés helyen.

A BME Távközlési és Telematikai Tanszékének szervezésében Budapesten kerül sor szeptemberben az Eurospeech ’99 konferenciára, amely talán felhívja a kormányzat figyelmét is a téma fontosságára. Nem kevesebbről van szó, mint arról, hogy képesek leszünk-e mi magyarok magyarul beilleszkedni abba a távközlési cégek, számítógépes multik által felvázolt világba, amelyben a telefonba angolul bemondott mondatokat a japán hívott japánra fordítva hallgathatja.