hex23.gif
hex38.gif
hex32.gif
hex26.gif
hex35.gif
hex29.gif

Budapest University of Technology and Economics Department of Telecommunications and Media Informatics Home send e-mail
Back to the first page
 


 

 
 

Oktatás - Témakiírások


 

back

 
 

Beszédfelismerők betanító anyagának elokészítése
VITT4353-04—TTT-0031

 


  Témavezető Drótpostacím Telefon  
  Vicsi, Klára  vicsi@tmit.bme.hu 463-1940  
  Teleki, Csaba  teleki@tmit.bme.hu 463-1111/5626  



  Létszámkorlát 3 fő  
  Munka helye 1111 Budapest, Sztoczek u. 2. II/202  
  Előkövetelmények a hallgatókkal szemben · angol nyelvismeret · a téma iránti érdeklődés · előnyös, de nem kötelező a C/C++ vagy Delphi programozási ismeret.  
  Kivonat A beszédfelismerők alapos betanításához nagyméretű adatbázisokra van szükség. Ez nem csak a szöveges felvételek meglétét és a beszélőről rendelkezésre álló adatok (pl. kor, nem, dialektus, környezet, stb.) dokumentációját jelenti, hanem szükség van a felvételek alaposabb feldolgozására is, szegmentálásra, a zajjelenségek, szünetek, esetleges hibás részek bejelölésével párhuzamosan.  
  Részletes leírás A jelölt feladata a szöveganyag kiválasztott felismerési egység (pl. szótag, félszótag, fonéma) szerinti szegmentálása, azaz e felismerési egységek határainak bejelölése és a szegmensek felcímkézése (az ott elhangzott hangjelenségek, hangok lejegyzése). A munka során színképelemzési módszereket használunk, így lehetőség nyílik a beszédszerkezet, illetve az egyes beszédhangok tulajdonságainak mélyebb megismerésére is, a szegmentálás pedig szoftvertámogatással végezhető feladat. A munka során így elkészített adatbázist felhasználva, a gépi beszédfelismerés témájában lehetőség van a laborgyakorlat diplomatervezésben történő folytatására.  
  Kiegészítő megjegyzések Villamosmérnök hallgatók jelentkezését is várjuk. A feladatok folyamatosak, egészen a diplomamunka megírásáig folytathatók.