Ezzel a címmel tartott konferenciával egybekötött sajtótájékoztatót a Nyelv- és beszédtechnológiai platform december 8-án a Magyar Tudományos Akadémián. A platform célja, hogy összefogja a jelentősebb hazai nyelv- és beszédtechnológiai kutatás-fejlesztést végző tudásközpontokat. Ebben az összefogásban a WebLib is közreműködik tagként, így a mostani konferencián is részt vettünk a bemutatók között.
Az egyre növekvő mennyiségű információ világában való eligazodásban elengedhetetlenül szükség van a nyelv- és beszédtechnológiai alkalmazásokra, melyek elősegítik az ember és a gép, illetve a gépeken keresztül az emberek közötti kommunikációt – hangsúlyozta ki Váradi Tamás a platform elnöke. A megalakulása óta eltelt egy év alatt sikerült megfogalmazni egy Stratégiai kutatási tervet, mely átfogó jelenképet ad a terület aktuális helyzetéről, illetve jól megalapozza egy reális jövőkép kialakítását. A platform különlegessége abban rejlik, hogy a tagok egymást kiegészítve és nem egymással versengve tudnak összefogni, így nem áll messze a valóságtól a címként megfogalmazott jelenség.
Szó volt még az előadások során Prószéky Gábor részéről az egynyelvűség, többnyelvűség kérdéséről, a gépi szótárak, illetve fordítók fejlődéséről és lehetőségeiről. Kézzelfogható jó példát láttunk az ezen a téren történő együttműködésre, hiszen a soknyelven tudó fordítógép legjobban akkor működik, ha minden nyelv a saját hazájában már működő rendszeren keresztül kapcsolódik össze. Bár a fordítógépek minősége nem tökéletes, de a fejlődés hatalmas, hiszen másodperceken belül érthető fordításokat kaphatunk számunkra teljesen idegen nyelvű szövegekről is.
Mihajlik Péter a beszédfelismerés témájában egyértelműen kihangsúlyozta, hogy az áttörés megtörtént, a beszédfelismerés működik. Természetesen a módszerek közül egyik sem tökéletes, talán nem is lesz az, hiszen a gép megérteni sosem fogja amit „hall”, de sok alkalmazás létezik már, ahol jól hasznosítható.
A gépi megértés, szemantika, logika témájában Kornai András adott elő. A fő kérdés az volt, hogy ha működnek a technológiák az ontológia eszközei nélkül is, akkor szükség van-e egyáltalán rájuk. Ha valaki egy szöveg elolvasása után képes a feltett kérdésekre válaszolni, akkor megértette a szöveget – ugyanígy működik a gépi megértés is. A természetes nyelvi logika a hibás állításokat használja ki, sokkal fontosabb tehát, hogy egy hibás állítást javítani tudjon, mint hogy hibátlanul működjön. Ez a matematikai logikánál sokkal egyszerűbb, hétköznapi logikát mutat. Hasonlóképpen az ontológia is szükséges, de ennek sem kell feltétlenül minden létező dolgot lefednie – hiszen mi emberek sem tudunk mindent – viszont tartalmaznia kell nem létező, absztrakt dolgokat is mivel elsődleges célja az információ átadása és nem a létezés vizsgálata. A kiindulási kérdésre adott válasz szerint a szemantikára mindenképpen szükség van, hiszen a statisztikai módszerek bár működnek, de a nyelvtechnológia kritikus részei számára nélkülözhetetlen.
Ezek után a bevezető gondolatok után került sor a tagok, közöttük a WebLib, interaktív bemutatkozására. Ennek során az érdeklődök meggyőződhettek a keresés során alkalmazott nyelvi technológiák fontosságáról: a nyelvi variánsok automatikus kezelése vagy a nyelvstatisztikai tartalomjegyzék megvalósítása a téma szerinti szűréshez mind a keresési eredmények minőségének javulását és a közöttük való eligazodás megkönnyítését szolgálják. A tudományos kutatások eredményei mellett jelen voltak tehát olyan gyakorlati alkalmazások is, melyek felhasználják a már létező technológiákat és erőforrásokat. Így az interneten elérhető szótárak, gépi fordítók, keresők, automatikus címkéző rendszerek, szótárak, ontológiák, beszédfelismerő alkalmazások mutatkoztak be, illetve keresték egymással az együttműködés lehetőségeit.
WebLib is a member of the Platform for Language and Speech Technology