Stellar Blade Un'esclusiva PS5 che sta facendo discutere per l'eccessiva bellezza della protagonista. Vieni a parlarne su Award & Oscar!
 
Pagina precedente | 1 2 | Pagina successiva

Costruzione modelli acustici per Julius

Ultimo Aggiornamento: 31/03/2015 21:03
Autore
Stampa | Notifica email    
OFFLINE
Post: 26
Sesso: Maschile
28/10/2013 17:19

Non credo che tutto andrà liscio!
Ricordati che stai costruendo un modello fonetico speaker-dipendent..
Non puoi mettere mano tu agli hmmdefs.. Se li modifichi in maniera non opportuna, rischi di creare un modello acustico che non riconosce niente, oppure non leggibile da Julius, oppure -addirittura- che la prossima esecuzione di Herest ti dia "FATAL ERROR"!

La cosa migliore sarebbe, almeno x la mia esperienza a riguardo:
1- Scegli il dominio di parole da utilizzare;
2- Costruisci la fonetica utilizzando i fonemi che vuoi;
3- Segui tutti i passi standard illustrati qui o su voxforge.

Tieni presente che Herest (che crea gli hmmdefs) non considera un solo fonema (una coppia di fonemi o 3 fonemi, dipende da come la utilizzi) alla volta, ma ha un funzionamento molto più complesso...
Es del funzionamento di Herest per singoli fonemi:
parte dal primo fonema della prima parola del primo sample e ne costruisce un modello nascosto di markov con accuratezza 1.
Elabora il secondo fonema della prima parola del primo sample, controlla se è uguale agli altri fonemi fin ora incontrati e se trova uguaglianze ne updata il modello nascosto corrispondente incrementando l'accuratezza di un fattore dipendente da tutti i fonemi fin ora considerati..
Ciò significa che una modifica effettuata a mano in un file hmmdefs, deve essere fatto tenendo presente l'intero modello fonetico e l'intero training (e anche i fonemi utilizzati nell'header di albero decisionale), una cosa che è difficile da fare a mano anche solo x un dominio di 10 parole.

Quel che vuoi fare tu, se ho capito bene, è prendere un modello acustico sviluppato da voxforge x l'inglese e riallinearlo a mano x l'italiano. Si può fare, ma non come intendi farlo tu. Oppure creare da zero un modello acustico utilizzando i fonemi inglesi.

Per ri-allineare un modello acustico devi avere a disposizione tutto lo speech corpus da cui è stato creato, il prompts.txt e .dict. (trovi tutto su voxforge). Dovresti comunque effettuare un training pari al 50-60% del training di partenza, ma SOLO per le stesse parole!

Se non è questa la tua intenzione, nel tuo lavoro o nei tuoi esperimenti, tieni sempre presente che la ripetizione in un solo sample della stessa parola, apporta poche modifiche ai modelli nascosti che gestiscono i relativi fonemi.. L'inserimento di poche parole in un modello acustico già esistente è -in proporzione- molto più pesante dell'inserimento di 200-300 parole.

Altrimenti, se vuoi utilizzare fonemi inglesi per costruzione fonetica di parole italiane, non hai nessun problema.
Puoi utilizzare fonemi reali dell'italiano, dell'iglese, dell'arabo o addirittura inventarli tu. Ma non sono consentite lettere accentate.
Sia questo tutorial che quello di voxforge funziona perfettamente con qualsiasi modello fonetico, purchè sia coerente. Coerente significa che per un dato suono, utilizzi sempre lo stesso fonema XD

Non so se sono stato chiaro..
Amministra Discussione: | Chiudi | Sposta | Cancella | Modifica | Notifica email Pagina precedente | 1 2 | Pagina successiva
Nuova Discussione
 | 
Rispondi
Cerca nel forum

Feed | Forum | Bacheca | Album | Utenti | Cerca | Login | Registrati | Amministra
Crea forum gratis, gestisci la tua comunità! Iscriviti a FreeForumZone
FreeForumZone [v.6.1] - Leggendo la pagina si accettano regolamento e privacy
Tutti gli orari sono GMT+01:00. Adesso sono le 15:54. Versione: Stampabile | Mobile
Copyright © 2000-2024 FFZ srl - www.freeforumzone.com