hex23.gif
hex38.gif

hex32.gif
hex26.gif
hex35.gif
hex29.gif

Budapest University of Technology and Economics Department of Telecommunications and Media-Informatics Magyarul Home send e-mail General Informations Researches in progress
Back to the first page
 


 

 
 

 

 
 

Endoszkópos és hasi ultrahang leletek diktálása


A BME TMIT Beszédakusztikai Laboratóriumában kifejlesztésre került egy Windows XP alatt működő beszédfelismerő fejlesztői környezet, amely alkalmas különböző középszótáras 1000-10000 szavas szövegek betanítására és felismerésére.

A felismerő a statisztikai alapon működő HMM akusztikai fonémamodellekkel, valamint a statisztikai alapú bi-gram nyelvi modellel működik, akusztikai és nyelvi adaptációt használva. Az akusztikai modelleket az MRBA beszédadatbázissal tanítottuk.

Az alábbi ábrán a statisztikai alapú gépi beszédfelismerés egyszerűsített blokkvázlata látható. (Az ábra nagyításához,kattintson az alábbi ábrára!)


Statisztikai alapú gépi beszédfelismerés egyszerűsített blokkvázlata - Klikk a nagyításhoz

A nyelvi betanításhoz a budapesti SOTE II. sz. Belgyógyászati Klinikájától (2700 gasztroszkópiai és 2500 hasi ultrahang lelet) és a szegedi Orvostudományi Egyetemről (6365 lelet) gyűjtött korábbi leletanyag korpuszt használtuk.

A felismerő optimális működését az akusztikai [4] és nyelvi modellek változtatásával állítottuk be. Lényegében a nyelvi modellhez n-gram modelleket használtunk, de az egyik megoldásban a hagyományos szóalakok az alkotó elemek, a másik megoldásban viszont a morfémák.

Külön súlyt fektettünk a valós idejű felismerés elérésére: a dinamikus címzésen és az akusztikai modellek indirekt megközelítésén túl memóriaelérési optimalizáció, valamint nyalábolt keresésnél (Beam Search) változó terű nyaláb alkalmazásával.


Az elkészült részfeladatok és az elért eredmények bemutatása:
                                                                                    reszfeladatok_elert_eredmenyek.pdf

A beszédfelismerő felhasználói kézikönyve is elérhető pdf formátumban:
                                                                                    felhasznaloi_kezikonyv.pdf

                                                                                                   

Amennyiben nem tudja megnyitni a fenti dokumentumokat, töltse le a legfrissebb Acrobat READER programot az alábbi ikonra kattintva.