Esistono sistemi operativi gestiti “vocalmente”? Se no, entro quanto tempo si potranno avere?

Il software di riconoscimento vocale fornisce un modo per interagire con le
applicazioni software nel modo più naturale:

parlando
.

Viene impiegato per programmi di apprendimento linguistico, per dettare testi
di e-mail e documenti, per inviare comandi al sistema.
operativo. È così possibile scorrere le pagine di un documento, spostare il
puntatore del mouse, cliccare o altro ancora.

Questa forma di interazione è interessante non solo per chi ha problemi
motori o cognitivi.

Il primo sistema efficace di riconoscimento è stato commercializzato nel
1991. Per i sistemi operativi Windows e Macintosh
sono in vendita, a prezzi accessibili, microfoni e software. Per trovare
informazioni su tali prodotti in Internet si può
usare un motore di ricerca e le parole: riconoscimento vocale.

Principi di funzionamento

Innanzitutto la lingua parlata viene divisa
nelle sue unità elementari (fonemi) che vengono
riordinate in apposite banche dati. Il software di riconoscimento vocale
suddivide le parole pronunciate al microfono in
fonemi singoli. Confrontando l’input vocale con le combinazioni di fonemi
memorizzati, il sistema decide se ciò che è stato
detto corrisponde ad una parola o combinazione di parole memorizzate. Nel
confronto considera le diverse velocità e modalità
di pronuncia della frase pronunciata e di quelle memorizzate.

Questi programmi per funzionare richiedono un luogo silenzioso e che l’utente stacchi le
parole; hanno ancora bisogno di un breve
addestramento iniziale per riconoscere la voce di chi li usa, ma poi vi si
adattano migliorando progressivamente
l’accuratezza del riconoscimento.

Il programma non può capire quello che viene detto e non riesce a
interpretare parole non pronunciate correttamente, o parole
diverse che hanno un suono praticamente identico. Per effettuare tali
discriminazioni, il programma può interpretare la parola rispetto al
contesto in cui viene pronunciata analizzando frasi e proposizioni,
piuttosto che singole parole.

L’avvicinamento alla perfezione del riconoscimento procede insieme con
l’aumento della potenza di calcolo dei computer. La
ricerca attuale cerca di rendere il software indipendente dal parlatore e di
eliminare la necessità di pause tra la pronuncia
delle parole.