Prelucrarea Semnalului Vocal si Recunoasterea Vorbirii

Consortiu de cercetare si activitate didactica:
* Laboratorul de Sisteme Inteligente - Universitatea Tehnica "Gh. Asachi" Iasi
* Catedra de Informatica Aplicata - Fac. de Informatica, Universitatea "Al. I. Cuza"
* Laboratorul de Procesarea Semnalelor si Sisteme Fuzzy si Neuro-Fuzzy -
- Institutul de Informatica Teoretica al Academiei Romane

 

MINI PROIECTE

 

Participantii la curs sunt incurajati sa aleaga unul dintre mini-proiectele de maj jos, pentru rezolvare. Aceste mini-proiecte vor fi notate si luate in considerare la nota finala. De asemenea, mini-proiectele pot fi dezvoltate in teze de finalizare a studiilor de masterat.

1. Realizarea unei mini-baze de date de cuvinte si sonograme pentru limba romana si adnotarea sonogramelor. Se vor culege semnale acustice pe posturi radio (crainici) sau se vor folosi inregistrari dialectale. La acest miniproiect ar fi util sa colaboreze mai multe persoane.
2. Sonograme pentru cuvintele "Gheorghe /Ion/ Neculai /Nicolae/ Nicolai/ Stefan/ Horia/ Vasile/ Constantin/ Pavel/ Petru/ Bogdan/ Matei/ Alexandru/ Cristian/ Octavian/ Octav/ George/ Mihai/ Florin/ Maria/ Ioana/ Georgeta/ Mihaela/ Alexandra/ Elena/ Florina/ Doina/ Cristina/ Magdalena/ Roxana/ Oana/ Liliana/ Octavia/ etc" (nume proprii specifice); idem pentru denumiri geografice.
3. Implementarea unui filtru de ordin (5,5), tip ARMA.
4. Transcrierea sonogramei intr-un cod pentru sintetizor formantic.
5. Mini-sistem de recunoastere a unui set restrans de cuvinte izolate.

Instructiuni pentru primele doua mini-proiecte

1. Situatia cea mai buna este inregistrarea direct de la un post de radio: crainicii sunt persoane "cu voce educata" sa pronunte clar si "curat", chiar cand vorbesc relativ repede.
2. In cazul in care inregistrati singur cuvintele, aveti grija sa va aflati intr-o camera fara zgomot si fara reverberatie.
3. Calitatea microfoanelor si a preamplificatorului de microfon sunt esentiale.
4. Este preferabil sa folositi 2 microfoane (stereo) pentru a avea doua inregistrari mono: este mai usor de facut segmentarea (pentru evidentierea silabelor/fonemelor/inceputului si sfarsitului fonemului), mai ales daca cele doua microfoane sunt situate in pozitii suficient de diferite fata de gura. Deoarece in mecanismul vorbirii intra doua procese (generatorul si modulatorul), pentru obtinerea sonogramelor cu contributii diferite ale celor 2 procese, in lit. se recomanda plasarea unui microfon mai jos de gura, iar a celui de al doilea mai sus de gura.
5. Pentru memorare, se vor folosi fisiere wav, frecventa de esantionare de 16 KHz, 16 bit/esantion.
6. Se vor alege acele inregistrari care corespund unor cuvinte fara intonatie speciala, cu durata suficeint de mare (pronuntate nu prea rapid) si cu pitch-ul relativ stabil.
7. Placa de sunet (sau sistemul audio, daca sistemul audio e incorporat pe placa de baza) trebuie sa fie de buna calitate (zgomot total propriu mic).
8. In cazul in care dispuneti de un laringofon (asu un traductor piezoelectric cu amplificator corespunzator) si puteti inregistra si semnalul de la laringofon, acesta va poate ajuta la segmentare. In lit. se recomanda si inregistrarea electro-glotogramei in acest scop.

 

MENIU


- Introducere
Welcome message
- Programa analitica
- Materiale suplimentare pentru laborator, seminar si curs
- Note de curs, lucrari indicate pentru lectura
- Referinte
- Mini-proiecte
- Corpusuri (Baze de date - semnale vocale)
- Exemplu de proiect de materat (disertatie), in curs de realizare
- Alte teme de cercetare curente ale colectivului (aceste teme pot deveni subiecte ale unor teze de disertatie sau diploma)
- Varia - materiale pentru cursuri, laboratoare, mini-proiecte etc.


Aceasta pagina este in continua modificare. Orice sugestii de imbunatatire a continutului sunt bine venite.

Contact: Tf. 21.37.37 - int 115 or 144 (HN Teodorescu) sau hteodor@etc.tuiasi.ro

(C) H.N. Teodorescu

(Pagina este -relativ - frecvent modificata) Ultima modificare: October 17, 2003

Return to mainpage