00 09/09/2012 14:41
Installazione di HTK
L'hidden Markov model toolkit è un insieme di librerie scritte in perl e C, che servono per la creazione, la gestione e l'elaborazione di modelli nascosti di Markov. I modelli nascosti di Markov, sono un potente modo di elaborazione statistica di processi il cui stato -di per se- non è misurabile.
In effetti il vostro computer quando si trova ad ascoltare la vostra voce dal microfono, non sa quello che voi potreste dire! Quindi potete immaginare che i calcoli che un riconoscitore vocale deve effettuare sono anche molto legati a condizioni statistiche..
Quanto dovete sapere di statistica? Niente. Non dovete essere voi a stillare statistiche ma utilizzerete questo simpatico tool!
Quanto dovete sapere di modelli nascosti di Markov? Niente. Utilizzando questo tutorial, vi verrà semplicemente chiesto di scrivere dei comandi sulla Cygwin e di creare dei file con all'interno delle parole chiave.
Il tutorial originale per questa parte di preparazione dell'ambiente di sviluppo, lo trovate qui: www.voxforge.org/home/dev/acousticmodels/windows/create/htkjulius/tutorial/...
Procediamo con il lavoro!
3) Scarica HTK.
Per scaricare l'HTK, è necessaria un'iscrizione al sito di sviluppo. Capisco che può ai più può sembrare una perdita di tempo, ma se non si vuole cacciare soldi, un minimo di tempo si deve "investire"!
Aprite in un'altra scheda questa pagina: htk.eng.cam.ac.uk/register.shtml
Compilate tutti i campi, immettendo -almeno- la vostra mail in maniera esatta.. Dopo aver compilato i pochi campi, scorrete la pagina verso il basso e premete il pulsante "yes".
Vi verrà inviata una mail all'indirizzo che avete specificato, all'interno di questa troverete una password.
Questa password, insieme al nome utente scelto da voi, vi serviranno per accedere al sito dell'HTK.
Non vi resta che scaricare il tool, seguendo questa procedura:
1- clicca sull'indirizzo:
htk.eng.cam.ac.uk/ftp/software/htk-3.3-windows-binary.zip
2- Si dovrebbe aprire una finestra che chiede username e password, scrivete la username che avete scelto e la password che vi è stata inviata tramite e-mail, quindi chiudete la scheda e cliccate nuovamente sullo stesso indirizzo: htk.eng.cam.ac.uk/ftp/software/htk-3.3-windows-binary.zip
Il download verrà effettuato in automatico.
3- Clicca sull'indirizzo: htk.eng.cam.ac.uk/ftp/software/HTK-samples-3.3.zip
Il download verrà effettuato automaticamente.
4) Installa HTK.
Apri le risorse del computer, clicca una volta sul disco fisso C: (anche se si ha più di un disco fisso, se si sono seguite queste istruzioni, trovate sempre tutto come viene descritto).
Apri la cartella Cygwin.
Crea una nuova cartella all'interno della cartella Cygwin (già ti trovi dentro la cartella cygwin, quindi non ti resta che cliccare con il pulsante destro del mouse su un punto qualsiasi della finestra che vedi, ma non su altre icone, clicca nello spazio bianco, ti si apre un menù, da questo seleziona "nuova cartella").
Chiama la nuova cartella "HTK" e lasciala aperta.
Copia i due file che hai appena scaricato.. In genere i file che vengono scaricati da internet vengono memorizzati (quindi li trovi lì), all'interno della cartella documenti, in una cartella che si chiama "Download" o qualcosa di simile ("Downloads"..).
I file che hai appena scaricati si chiamano:
"htk-3.3-windows-binary.zip" e "HTK-samples-3.3.zip".
Bene.. Copia questi due file e incollali nella cartella HTK, che hai precedentemente creato all'interno della cartella cygwin.
(per copiare un file, non devi fare altro che cliccare sopra al file con il pulsante destro del mouse e selezionare la voce "copia". Per incollare un file che si è precedentemente copiato, basta cliccare in un punto qualsiasi della cartella destinazione, con il pulsante destro del mouse e selezionare la voce "incolla")
Dopo aver copiato i due file nella cartella HTK, fate un click con il pulsante destro del mouse sopra al file "htk-3.3-windows-binary.zip" e dal menù che vedete, selezionate "Extract All" (potresti non leggere questa opzione ma opzioni tipo "Extract Here", "Estrai qui", "Estrai in htk-3.3-windows-binary", vanno bene allo stesso modo!).
Questo procedimento si deve ripetere per il file "HTK-samples-3.3.zip".
5) Copia alcuni script HTK.
La prima cosa da fare è capire come si chiama la tua "directory di lavoro".. Questa deriva dal nome che è stato dato al computer e/o dal nome di un eventuale account, comunque è importante che venga capito il nome specifico in maniera corretta, per farlo utilizziamo la cygwin.
Vai su start, programmi, cygwin e seleziona cygwin bash shell.
All'interno della finestra con sfondo nero che ti si apre, scrivi il seguente comando: "pwd" (scrivilo tutto minuscolo e senza le doppie virgolette). Premi quindi il pulsante "invio" che trovi sulla tastiera.
La cygwin, a questo comando, risponderà scrivendoti la tua directory di lavoro (la cygwin sa come si chiama il tuo computer e non commette errori). In genere viene scritto un qualcosa del genere:
/home/Administrator
Ma al posto di "Administrator", potresti trovare scritto il tuo nome tipo:
/home/Carlo
Oppure /home/Windows.
Ad ogni modo ora sai che la tua directory di lavoro è /home/[nome], dove [nome], può essere Administrator, Carlo, il tuo nome oppure Windows..
Proseguiamo..
Vai in risorse del computer, clicca sul disco fisso C:, apri la cartella "cygwin", apri la cartella "home".
Ti ricordi quel che hai letto dalla cygwin? /home/[nome]
Bene, apri la cartella che si chiama [home].
(se non hai mai installato la cygwin o meglio.. Se non è mai stata installata la cygwin sul tuo computer, dovresti trovare all'interno della cartella "home", solo un'altra cartella, quindi non dovresti avere incertezze!)
All'interno della cartella [nome], crea una nuova cartella e chiamala "voxforge".
Dopo averla creata, apri la cartella "voxforge" e crea una nuova cartella chiamandola "HTK_Scripts".
Lascia aperta questa cartella e vai su risorse del computer, clicca C:, poi cygwin, poi HTK, poi htk-samples-3.3, poi samples, poi RMHTK, poi perl_scripts.
Troverai un elenco di file, tra questi copia il file "mkclscript.prl", chiudi la finestra e incollalo nella cartella che hai creato prima e chiamato HTK_Scripts.
Apri risorse del computer, vai su C:, vai su cygwin, vai su HTK, vai su htk-samples-3.3, vai su samples, vai su HTKTutorial.
Trovi anche qui un elenco di file, copia "maketrihed" e incollalo sulla cartella che hai chiamato HTK_Scripts, copia "prompts2mlf" e incollalo nella stessa cartella, copia "prompts2wlist", chiudi la finestra e incollalo nella stessa cartella (HTK_Scripts).
6) Modifica mkclscript.prl per farlo funzionare sulla cygwin.
Vai in risorse del computer, poi in C:, poi in cygwin, poi in home, poi in [nome], poi in voxforge, poi in HTK_Scripts.
Clicca con il pulsante destro del mouse sopra il file che si chiama "mkclscript.prl", ti si aprirà un menù dal quale devi selezionare "apri con", dall'elenco di programmi, scegli "notepad" (oppure WordPad).
Ti si apre un editor di testo con dentro scritto il codice sorgente di mkclscript.prl, devi solo vedere dove sta scritta la parola "chop;".
Ogni volta che trovi la parola "chop;", posiziona il cursore del mouse dopo il punto e virgola e scrivi nuovamente "chop;".
Nient'altro.. Devi solo sostituire la parola "chop;" con "chop;chop;".
Non modificare nient'altro!
Salva il le modifiche che hai apportato..
Apri la cygwin:
1- scrivi "cd [nome]" ([nome] è il nome della tua directory di lavoro, quella che hai letto nel passo precedente!) e premi invio;
2- scrivi "cd voxforge" e premi invio;
3- scrivi "cd HTK_Scripts" e premi invio;
4- scrivi "dos2unix mkclscript.prl" e premi invio;
Finito. Hai installato le librerie HTK che ti servono.
[SM=g27989]
.. Continua con l'installazione dell'engine di speech to text Julius.
[Modificato da calel82 09/09/2012 18:33]