Orvosi Leletezõ Rendszer - IKTA-00056/2003 |
Kezdõlap | Adatbázis | Gasztroszkópia és ultrahang | Scintigráfia | Kapcsolat |
MRBA - Magyar Referencia Beszéd Adatbázis |
||
A Magyar Referencia Beszédadatbázist (MRBA) a BME TMIT Beszédakusztikai Laboratóriuma és a szegedi SZTE Informatikai Tanszékcsoport együttműködésben hozta létre. A cél egy olyan irodai, otthoni környezetben olvasott folyamatos szöveget tartalmazó beszédadatbázis megalkotása és akusztikai, nyelvi feldolgozása volt, amely alkalmas PC-s beszédfelismerők betanítására, tesztelésére. Az adatbázis szöveganyaga gondos tervezés eredménye. A szöveg előállításához használt módszert az alábbi ábrán mutatjuk be. (Az ábra nagyításához, kérjük, kattintson az ábrára!)
A felvételek mindegyikét annotáltuk, azaz minden hangfájl mellé egy címkefájlt készítettünk, amely különféle információkat tartalmaz a hangfájl paramétereivel és tartalmával kapcsolatban: az elhangzott szöveg ortografikus lejegyzését, hibás kiejtést, nem érthető szavakat, szótöredékeket, a beszélő nem beszédből származó hangjait, környezeti zajokat, stb. Az adatbázis közel egyharmadán, azaz 100 beszélő anyagán manuálisan fonetikai szintű szegmentálást és címkézést is végeztünk. A felvételek elkészítésekor az alábbi illusztrációban bemutatott felvételi rendszert alkalmaztuk. További információkért kattintson ide: http://alpha.tmit.bme.hu/speech/hdbMRBAhu.php |
©2006 Minden jog fenntartva. A honlap tartalmát és az azon szereplő dokumentumokat szerzői jog védi, azok vagy részeinek felhasználása a szerzők tudtán kívül jogi következményeket vonhat maga után. |