Sintesi vocale su Linux utilizzando Festival e integrazione con KDE
Febbraio 15th, 2008In questo articolo vi guidero’ nella configurazione di un sistema di sintesi vocale su Linux, in grado di leggere testi con accento italiano. La guida e’ stata creata testando i software su openSuSE 10.2 cio’ non toglie che risultati analoghi non possano essere ottenuti con qualsiasi altra distribuzione Linux.
Sintesi vocale su Linux
Il tutto e’ incentrato su Festival, un software di sintesi vocale molto potente, in se’ non grafico, ma che possiede diverse GUI sia per KDE che per Gnome in grado di integrarlo benissimo con queste interfacce grafiche.
Installazione su openSuSE 10.2 (KDE)
Procediamo in shell per velocizzare le operazioni di installazione, eseguite questa sequenza di comandi:
su (verra' poi chiesta la password di root) wget http://www.openlinux.eu/download/gizmo/festival/opensuse10.2.sh sh opensuse10.2.sh
Se lo script termina senza errori avrete nel sistema tutto l’occorrente, ora potrete passare alla configurazione della parte grafica.
Installazione su Mandriva 2006/2007
Installate tramite il vostro package manager “festival” e “kdeaccessibility3″ dopo di che’ eseguite questi comandi da una shell:
su (verra' poi chiesta la password di root) wget http://www.openlinux.eu/download/gizmo/festival/mandriva200x.sh sh mandriva200x.sh
Se lo script termina senza errori avrete nel sistema tutto l’occorrente, ora potrete passare alla configurazione della parte grafica.
Installazione (Generica)
Configurazione KDE (Valido per ogni distribuzione)
- Aprite il centro di controllo di KDE
- Regionali e accesso facilitato
- Pronuncia
- Andate sulla linguetta “Audio”
- Selezionate il dispositivo “ALSA” al posto di “aRts” (almeno in openSuSE 10.2 vuole ALSA, chi ha altre distribuzioni dovra’ fare qualche tentativo)
- Andate sulla linguetta “Operatori”
- Aggiungi
- Nella finestra che comprare: Lingua = Italiano, Sintetizzatore = Lasciate Festival
- Premete OK
- Ora dovrebbe comparire l’operatore “lp_diphone Femmina”
- Premete modifica, settate la velocita’ a 85% e SE volete cambiare la voce con quella maschine selezionate “pc_diphone”
- Premete Applica
- Chiudete il centro di controllo
- Avviate KSayIt (in openSuSE: menu’ K > Accessori > Desktop)
- Apparira’ una piccola icona raffigurante una bocca nel vassoio di fianco all’orologio di sistema, cliccandoci sopra verra’ pronunciato il contenuto degli appunti.
- Fine
Utilizzo di KSayIt (esempio)
- Aprite Konqueror ed andate in un sito qualsiasi
- Col mouse selezionate una porzione di testo e premete Ctrl+C
- Cliccate sulla bocca di KSayIt
KSayIt leggera’ il testo che avete selezionato. Ovviamente ci sono altre interfaccie per Festival, divertitevi a vedere come funzionano e cosa fanno di bello.
Perche’ il mio sintetizzatore “Gracchia”?
La voce sintetizzata purtroppo mentre parla fa dei gracchiamenti, questo credo sia dovuto in parte al file dizionario (esattamente lex.out). Lex.out e’ un dizionario contenente le definizioni di pronuncia di migliai di parole, dalle prove che ho fatto pare che la pronuncia sia quasi sempre perfetta e pulita per tutte le parole contenute in questo dizionario e un po’ meno perfetta e a volte gracchiante per le parole non contenute in esso.
Se qualcuno ha idea di come fare, potra’ aggiungere nuove parole al dizionario, nel tal caso sarebbe carino che mi contattasse in modo che io possa integrarle nel pacchetto in modo che sia a disposizione di tutti.
Autori ufficiali dei file linguaggio in italiano
Questo e’ il sito ufficiale, e’ un sito universitario. Pare che questi file linguaggio siano stati sviluppati come tesi da un gruppo di universitari nel 2003/2004. Purtroppo il progetto sembra abbandonato a se stesso, oltre tutto la versione 2.0 degli stessi file e’ rilegata solamente a Windows, infatti hanno creato delle patch su Festival di cui forniscono i sorgenti per windows ed i binari in formato .exe… Di fatti la versione 2.0 non sembra utilizzabile su Linux.
Se qualcuno fosse in grado e interessato a migliorare il supporto della lingua italiana in festival partendo da cio’ che esiste si faccia avanti qui su openlinux, supporteremo eventualmente il progetto.
File audio Demo
Articolo originale: http://www.openlinux.eu/content/view/129/34/