Fonetické signály a jejich kódování

B162 - Letní 16/17

Fonetické signály a jejich kódování - XP31FSK

Kredity 4
Semestry letní
Zakončení zkouška
Jazyk výuky čeština
Rozsah výuky 2P+2S
Anotace
Předmět uvádí do problematiky zpracování řečových signálů. V rámci předmětu se studenti seznámí od základních až po pokročilé moderní algoritmy analýzy, syntézy, kódování či zvýrazňování řeči. Další část je zaměřena na rozpoznávání řeči, kde se studenti seznámí s moderními pokročilými přístupy v úlohách jako rozpoznávání s malým a velkým slovníkem či rozpoznáváním řečníka. Významná pozornost je věnována použití různých klasifikačních technik na bázi GMM, DTW, HMM, ANN/DNN, WFST, JFA, i-vektorů, apod. \\Výsledek studentské ankety předmětu je zde: http://www.fel.cvut.cz/anketa/aktualni/courses/XP31FSK
Cíle studia
Žádná data.
Osnovy přednášek
1. Model vzniku a vnímání řeči, fonetický popis řeči.
2. Spektrální charakteristiky řeči (DFT, LPC, banky filtrů).
3. Kepstrální reprezentace řeč a možné aplikace.
4. Detekce řečové aktivity a potlačování šumu v řeči.
5. Syntéza řeči
6. Kódování řeči
7. Základní a speciální metody extrakce řečových příznaků (PCA, LDA).
8. Používané klasifikátory pro různé úlohy (GMM, HMM, VQ)
9. Moderní metody verifikace a identifikace mluvčího (UBM-GMM, JFA, i-vectory).
10. Rozpoznávání řeči na bázi DTW a HMM
11. Rozpoznávání spojité řeči, jazykové modelování, využití WFST
12. Adaptační techniky v rozpoznávání řeči.
13. Moderní systémy na bázi ANN/DNN, metody hlubokého učení.
14. Rezerva.
Osnovy cvičení
Program cvičení je organizovaný formou společných konzultací zapsaných studentů. Důraz je kladen na samostatnou práci studentů v průběhu semestru a samostatné zpracování zvoleného tématu. Řešení individuálních projektů jsou na společných konzultacích průběžně podrobně diskutovány.
Literatura
[1] Psutka, J.: Komunikace s počítačem mluvenou řečí. Academia Praha, 1995
[2] Deller, J.R. - Hansen, J.H.L. - Proakis, J.G.: Discrete-time processing of speech signals, New York: IEEE Press 2000, 908 s., ISBN 0-7803-5386-2
[3] http://www.ee.ic.ac.uk/hp/staff/dmb/courses/speech/speech.htm
Požadavky
Vstupními požadavky jsou znalosti z oblasti číslicového zpracování signálů.