hex23.gif
hex38.gif
hex32.gif
hex26.gif
hex35.gif
hex29.gif

Budapest University of Technology and Economics Department of Telecommunications and Media Informatics Home send e-mail
Back to the first page
 


 

 
 

Oktatás


 

back

 
 

Beszédakusztika - VITTD019

 


 
Tárgyfelelõs: dr. Vicsi Klára tudományos fõmunkatárs, TMIT
Elõadók: dr. Vicsi Klára, tudományos fõmunkatárs, dr. Németh Géza, dr. Olaszy Gábor, TMIT
 

TEMATIKA

1. hét: Beszédlánc
Nyelvi szervezõdés, a beszéd nyelvi alapjai, Fonetikus átírás
Tarnóczy Tamás: Az emberi üzenetváltásról, Magyar Tudományos Akadémia Nyelvtudományi Intézete (1992)
Kiefer Ferenc: Strukturális magyar nyelvtan II, Akadémai Kiadó (1994)

2.hét: Akusztikai alapfogalmak
  Hangforrás és a hangtér
2.1. Rezgõmozgás, rezgéscsillapítás, kényszerrezgés, rezonancia
Beszédhang, mint rezgés
2.2. A hangtér
Hanghullámok, hang terjedése
Hangnyomás, hangteljesítmény, hangintenzitás dB érték
Tarnóczy Tamás: Hangnyomás, hangosság, zajosság, Akadémiai Kiadó (1984)
Gyakorlat: Dragon Beszédfelismerõ rendszer bemutatása

3.hét: Emberi beszéd képzése – Gépi beszédszintézis
a beszédhangok képzése, létrejötte
a beszéd nem beszédhangok egymásutánja (kivágott hangok példája stb.)
a beszéd egy folyamatos jel (lehet folyamatos mozgás, folyamatos rezgésváltozás)
a beszédhangok fajtái, az artikuláció akusztikai vetülete, a beszédhangok variánsai,
a hangok egymásra hatásának megismerése és ennek fontossága informatikai szempontból
Ray D. Kent, Charles Read: The Acoustic Analysis of Speech, Singular Publishing Group, INC. San Diego, Califronia (1992)
Olaszy Gábor: Elektronikus beszédelõállítás, Mûszaki Kiadó (1989)
Bolla Kálmán: Magyarfonetikai atlasz Nemzeti tankönyvkiadó 1995. Magyar hangalbum, Magyar Fonetikai Füzetek 6.
Beszéddel válaszoló rendszerek életünkben

4.hét:
4.1. Beszédhangok akusztikai leírása
 szinképelemzési módszerek,
 magánhangzók, diftongusok, mássalhangzók akusztikai leírása
Douglas O’Shaughnessy: Speech Communcation, Addison-Wesley Publishing Company (1987)
Gordos G Takács Gy. Digitális beszédfeldolgozás, Mûszaki Kiadó 1983
Ray D. Kent, Charles Read: The Acoustic Analysis of Speech, Singular Publishing Group, INC. San Diego, Califronia (1992)
Olaszy Gábor: Elektronikus beszédelõállítás, Mûszaki Kiadó (1989)

4.2. Beszédhangok sorozata - statisztikák
Kiefer Ferenc: Strukturális magyar nyelvtan II, Akadémai Kiadó (1994)
P. Berényi, K. Vicsi: On the proper subword unit inventory for CSR
EUROSPEECH’93 Berlin (1993) 1631.
Gyakorlat: Speech Production and Perception MIT szoftver bemutatása

5. hét: A magyar beszédhangok akusztikai szerkezete
Olaszy Gábor: Elektronikus beszédelõállítás, Mûszaki Kiadó (1989)
Gósy Mária: Fonetika, a beszéd tudománya (2004)
Olaszy Gábor: A magyar beszéd leggyakoribb hangsorépítõ elemeinek szerkezete és szintézise, Nyelvtud. Értekezések 121. Akadémiai Kiadó (1985)
Gyakorlat: Speech Production and Perception MIT szoftver bemutatása

6.hét:
6.1. A beszéd és a beszédhangok kapcsolata
Olaszy Gábor: Elektronikus beszédelõállítás
 Mûszaki Kiadó (1989)
6.2. A hangtér hatása a beszédre
Beszédzavarás
Tarnóczy Tamás: Teremakusztika, Akadémiai Kiadó (1986)
Gyakorlat: CSLU programrendszer bemutatása

7. hét: A beszéd többsíkú információt hordozó szerepe
a beszéd szegmentális és szupraszegmentális szerkezete
a szegmentális szerkezet felépítése (elméleti különválasztás)
a szegmentális szerkezet és az általa közölt információ
a szupraszegmentális szerkezet és az általa közölt információ.
mondatszintû leírás
szószintû leírás
kifejezés formák és azok összefüggései.
Beszédkutatás 1994--99 tanulmánykötetek, MTA Nyelvtud. Intézet
Kiefer Ferenc: Strukturális magyar nyelvtan II., Fonológia Akadémai Kiadó (1994)
Gósy Mária: Fonetika, a beszéd tudománya (2004)
Gyakorlat

8. hét:
8.1. Hallás.
 Fül, Idegi feldolgozás, Fiziológiai leírás – Funkcionális leírás
Pitel József: Audiológia, Viktoria 1996
8.2. Hangérzet jellemzõi
Hangmagasság, hangerõsség
Tarnóczy Tamás: Zenei Akusztika, Zenemûkiadó (1982)
Gyakorlat: Az AKL Hallásmodeljének bemutatása -

9. hét: Beszédhangok érzékelése
Douglas O’Shaughnessy: Speech Communcation
Addison-Wesley Publishing Company (1987)
Gyakorlat: A short tutorial and perception test on Categorical perception(Anders Eriksson)

10. hét: Az automatikus felolvasó rendszerekben alkalmazott technológiák a beszédkeltéshez.
Formáns, LPC, wavelet, wave,
Gyakorlat: K. Felbaum: A tutorial on human speech production, (vagy valamelyik másik)

11. hét: Beszédadatbázisok tervezésének szempontjai beszédfelismerõkhöz
Vicsi K. Vig A. 1998 Az elsõ magyarnyelvû beszédadatbázis, Beszédkutatás’98, 163-177.
Beszédadatbázis tervezésének akusztikai szempontjai beszéddel válaszoló rendszerekhez
Gyakorlat: The EMU speech database system

12.hét: Gyakorlati példák a fonetikai ismeretek felhasználására
beszélõ rendszerek tervezésénél (SZÁMOK pr. jó és rossz példákkal)
Gyakorlat: A MULTIVOX  rendszer bemutatása

13. hét: A Profivox szövegfelolvasó rendszer
szerkezeti elemek, fejlesztõi környezet
Gyakorlat: A POFIVOX szintetizátor fejlesztõi környezetének bemutatása,

14. hét: A gépi beszédfelismerés problémaköre, a beszédfelismerõk fajtái
Steve Young and Gerrit Bloothoft: Corpus -based Methods in Language and speech Processing
Kluwer Academic Publishers (1997)
Vicsi K.- Vig A. Berényi P. Magyar nyelvû folyamatos beszéd gépi felismerése
Beszédkutatás 1993. MTA Nyelvtudományi Intézet, (1993).164-182.
Gyakorlat