Bookmark and Share

Home
Next Generation Search and Knowledge Discovery Tools for the Web

English

Nyelvi áttörés - a nyelv- és beszédtechnológia mint húzóágazat

Tue 15 December, 2009

Ezzel a címmel tartott konferenciával egybekötött sajtótájékoztatót a Nyelv- és beszédtechnológiai platform december 8-án a Magyar Tudományos Akadémián. A platform célja, hogy összefogja a jelentősebb hazai nyelv- és beszédtechnológiai kutatás-fejlesztést végző tudásközpontokat. Ebben az összefogásban a WebLib is közreműködik tagként, így a mostani konferencián is részt vettünk a bemutatók között.

Az egyre növekvő mennyiségű információ világában való eligazodásban elengedhetetlenül szükség van a nyelv- és beszédtechnológiai alkalmazásokra, melyek elősegítik az ember és a gép, illetve a gépeken keresztül az emberek közötti kommunikációt – hangsúlyozta ki Váradi Tamás a platform elnöke. A megalakulása óta eltelt egy év alatt sikerült megfogalmazni egy Stratégiai kutatási tervet, mely átfogó jelenképet ad a terület aktuális helyzetéről, illetve jól megalapozza egy reális jövőkép kialakítását. A platform különlegessége abban rejlik, hogy a tagok egymást kiegészítve és nem egymással versengve tudnak összefogni, így nem áll messze a valóságtól a címként megfogalmazott jelenség.

Szó volt még az előadások során Prószéky Gábor részéről az egynyelvűség, többnyelvűség kérdéséről, a gépi szótárak, illetve fordítók fejlődéséről és lehetőségeiről. Kézzelfogható jó példát láttunk az ezen a téren történő együttműködésre, hiszen a soknyelven tudó fordítógép legjobban akkor működik, ha minden nyelv a saját hazájában már működő rendszeren keresztül kapcsolódik össze. Bár a fordítógépek minősége nem tökéletes, de a fejlődés hatalmas, hiszen másodperceken belül érthető fordításokat kaphatunk számunkra teljesen idegen nyelvű szövegekről is.

Mihajlik Péter a beszédfelismerés témájában egyértelműen kihangsúlyozta, hogy az áttörés megtörtént, a beszédfelismerés működik. Természetesen a módszerek közül egyik sem tökéletes, talán nem is lesz az, hiszen a gép megérteni sosem fogja amit „hall”, de sok alkalmazás létezik már, ahol jól hasznosítható.

A gépi megértés, szemantika, logika témájában Kornai András adott elő. A fő kérdés az volt, hogy ha működnek a technológiák az ontológia eszközei nélkül is, akkor szükség van-e egyáltalán rájuk. Ha valaki egy szöveg elolvasása után képes a feltett kérdésekre válaszolni, akkor megértette a szöveget – ugyanígy működik a gépi megértés is. A természetes nyelvi logika a hibás állításokat használja ki, sokkal fontosabb tehát, hogy egy hibás állítást javítani tudjon, mint hogy hibátlanul működjön. Ez a matematikai logikánál sokkal egyszerűbb, hétköznapi logikát mutat. Hasonlóképpen az ontológia is szükséges, de ennek sem kell feltétlenül minden létező dolgot lefednie – hiszen mi emberek sem tudunk mindent – viszont tartalmaznia kell nem létező, absztrakt dolgokat is mivel elsődleges célja az információ átadása és nem a létezés vizsgálata. A kiindulási kérdésre adott válasz szerint a szemantikára mindenképpen szükség van, hiszen a statisztikai módszerek bár működnek, de a nyelvtechnológia kritikus részei számára nélkülözhetetlen.

Ezek után a bevezető gondolatok után került sor a tagok, közöttük a WebLib, interaktív bemutatkozására. Ennek során az érdeklődök meggyőződhettek a keresés során alkalmazott nyelvi technológiák fontosságáról: a nyelvi variánsok automatikus kezelése vagy a nyelvstatisztikai tartalomjegyzék megvalósítása a téma szerinti szűréshez mind a keresési eredmények minőségének javulását és a közöttük való eligazodás megkönnyítését szolgálják.  A tudományos kutatások eredményei mellett jelen voltak tehát olyan gyakorlati alkalmazások is, melyek felhasználják a már létező technológiákat és erőforrásokat. Így az interneten elérhető szótárak, gépi fordítók, keresők, automatikus címkéző rendszerek, szótárak, ontológiák, beszédfelismerő alkalmazások mutatkoztak be, illetve keresték egymással az együttműködés lehetőségeit.
 

Try our medical search engine

HealthMash

Platform for Language and Speech Technology

Customers