SUNETELE LIMBII ROMÂNE
 
 SRoL Sitemap


 Prima pagină

 Fonetica limbii române

 Arhiva sunetelor

   Vocale
   Consoane
   Diftongi
   Fraze
      Prozodie standard
      Voci emoţionale
      Voce umană-voce sintetică
      Particularităţi lingvistice

 Voci dialectale

   Colaborare - Prof. D. Scheianu
   RoToBi System (în engleză)

 Protocoale

 Instrumente de analiză

 Referinţe

 Legături utile


 
Dacă aţi accesat accidental această pagină, fără a citi şi a consimţi deplin cu Notificările Legale de Copyright, vă rugăm să le citiţi aici.
Comparaţii între vocea umană şi vocea sintetizată


Puteţi asculta corpusul de voci sintetice aici.
      Vocea reflectă starea generală fizică, mentală şi emoţională. Vocea sintetică (vorbirea artificială) este produsă de calculator.
      Pentru aprecierea calităţii vocii sintetice pe bază de mărimi măsurabile relevante, am testat/investigat relevanţa parametrilor: F1/F0, F2/F0, F3/F0, precum şi duratele şi energiile medii ale fonemelor, corelate cu linia prozodică.

      Metodologie
      Metoda de comparaţie priveşte două aspecte:
- determinarea statistică a valorii medii pentru vocea umană a formanţilor (raporturi între formanţi şi frecvenţa fundamentală) şi duratelor fonemelor, respectiv a dispersiilor,
- compararea acestor informaţii cu valorile obţinute pe vocea sintetică, folosind ca intervale de acceptare X-2σx, X+2σx.
      În paralel, s-a realizat o caracterizare subiectivă a vocii sintetice cu privire la ritm, accent, dinamica intonaţiei, precum şi privind unele caracteristici subiective ale fonemelor individuale şi cu specificul global armonic ("voce plină", "voce în butoi" etc.). Pe baza observaţiilor primite de la persoanele care au ascultat vocea sintetică s-a urmărit o corelare a acestor observaţii cu informaţiile statistice extrase şi deducerea unor concluzii.
      Pentru comparaţii s-au utilizat voci umane (feminine) din corpusul adnotat SRoL pentru care frecvenţa fundamentală este apropiată de cea a vocii sintetice. Comparaţia priveşte singurul sintetizor comercial autohton (BAUM) identificat pentru limba română.
      Puteţi asculta mai jos frazele sintetizate precum şi unele exemple semnificative de voci umane, ton neutru, din pagina Voci emoţionale.

Voce sintetizată
Sintetizatorul Baum,
viteza 60
 
Voce umană
 
 
      
Fişă vorbitor #1
 
Fişă vorbitor #2
 
Fişă vorbitor #12
 
Fişă vorbitor #13
 
Fişă vorbitor #16
Aseară
    
Aseară
 
Aseară
 
Aseară
 
Aseară
 
Aseară
Vine mama
    
Vine mama
 
Vine mama
 
Vine mama
 
Vine mama
 
Vine mama
Cine a făcut asta
    
Cine a făcut asta
 
Cine a făcut asta
 
Cine a făcut asta
 
Cine a făcut asta
 
Cine a făcut asta
Ai venit iar la mine
    
Ai venit iar la mine
 
Ai venit iar la mine
 
Ai venit iar la mine
 
Ai venit iar la mine
 
Ai venit iar la mine

Documentaţie:
  1. Horia-Nicolai Teodorescu, Monica Feraru, De ce nu place vocea sintetizată? - câteva elemente de comparaţie cu vocea umană, ConsILR, noiembrie 2008, Iaşi, România
  2. BAUM Engineering, TTS Online, Voce sintetică românească profesională Ancutza v3.6.16., http://www.baum.ro/index.php?language=ro&pagina=despre_noi, http://www.baum.ro/index.php?language=ro&pagina=ttso nline
  3. Horia-Nicolai Teodorescu, M. Feraru, M. Zbancioc "Assesing the quality of voice synthesizers", SpeD 2009, June 18-21, 2009, Constanţa, România prezentare


H.N. Teodorescu, M. Feraru
Cu colaborarea: M. Zbancioc, L. Pistol
   
Această pagină a fost modificată ultima oară de H.-N. Teodorescu şi M. Feraru la data de
Copyright©2006 - SRoL