![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
Coordinamento di Luciano Giustini![]() |
di Luigi Gangitano
La più grande rivoluzione informatica dall' avvento delle interfacce grafiche sta per compiersi: è arrivato il momento di "parlare" col computer.
Se ne ...parla ormai da parecchio e molte software house si sono impegnate nella ricerca di tecniche che permettessero l'interazione vocale. I problemi incontrati sono stati tanti: lo sviluppo di un buon metodo di riconoscimento, la creazione di un algoritmo di compressione vocale che non penalizzasse troppo il sistema, la capacità di comandare tutto il software presente sul mercato, la facilità di personalizzare il sistema, ecc. In un primo momento l'IBM era ricorsa ad una scheda aggiuntiva con un processore RISC per ovviare alle non sufficienti operazioni dei processori di classe 486 nella compressione audio. Ora, grazie alla possibilità di affidarsi ad un processore di classe Pentium, la scheda aggiuntiva non è più necessaria ed è stata eliminata per rendere il prezzo più concorrenziale (che, infatti, è passato dai circa due milioni e mezzo della versione 2 al milione e duecentomila lire della nuova versione 3). Inoltre, grazie all'esperienza maturata, il sistema di riconoscimento vocale è stato migliorato ed è ora in grado di riconoscere il 96% di ciò che viene dettato da una persona che non ha effettuato il training, e più del 99% dopo l'allenamento. Note introduttivePrima di cominciare a parlare delle caratteristiche di questo prodotto, devo parlare prima di come è stato effettuato il test: ho provato due versioni dello stesso programma, quella contenuta dentro la beta di OS/2 4.0 Merlin e quella invece fatta apposta per Windows 95. Le versioni sono praticamente uguali, in quella per OS/2 mancano però il VoicePad (sostituzione del WordPad di Windows 95 e quindi abbastanza fuori luogo in OS/2, dove è stato sostituito da una più anonima Finestra di dettatura) e il VoiceDirect (che permette la dettatura in qualsiasi programma e che nella versione per OS/2 è stato sostituito da un finestra che si apre quando si vuole cominciare la dettatura e dalla quale sarà possibile importare il testo nell'applicazione desiderata alla fine della dettatura).La versione per OS/2 era in americano, mentre quella per Windows 95 era in italiano; vista la mia scarsa conoscenza della pronuncia americana, ho preferito approfondire la prova della versione per Windows 95, che trovate qui recensita. Un'ultima nota: la versione per OS/2, a parità di hardware è risultata leggermente più veloce. Requisiti hardwareIl sistema richiesto prevede:- Processore Pentium 90 o superiori; - 16 Mb di RAM più la RAM necessaria a far girare le altre applicazioni; - Scheda Audio Sound Blaster Compatibile; - Microfono direzionale (in dotazione o acquistabile separatamente); - Windows 3.11 oppure - Windows 95 oppure - OS/2; Metodi di controlloEsistono due metodi di controllo: uno per i comandi e uno per la dettatura. Per inviare dei comandi al PC è importante pronunciare tutto il comando attaccato, mentre per la dettatura è necessario inserire una breve pausa tra una parola e l'altra per permettere al programma di capire quando finisce una parola e comincia un'altra.Voice Center Voice Center è il centro di controllo del programma attraverso il quale è possibile farsi "sentire" dal PC. Dopo averlo avviato rimane sopra le altre e notifica il funzionamento del sistema. ![]() Fig.1 Voice Center Ecco l'elenco dei pulsanti, da sinistra: - Il pulsante che identifica lo stato del microfono, che può essere:
- Il pulsante "Cosa posso dire", che attiva l'omonima finestra che mostra tutte i possibili comandi per la finestra attiva. ConclusioniDopo una fase di apprendimento il sistema si è rivelato molto comodo che facile da usare, permettendo tra l'altro la possibilità di continuare ad usare sia la tastiera che il mouse. Si rivela molto utile in tutti quei casi in cui è necessario lavorare con il computer pur avendo le mani libere per fare qualche altra cosa (per esempio, un radiologo che detta il referto guardando la radiografia), oppure per tutte quelle situazioni nelle quali è possibile rimandare la correzione del testo dettato o in altro tempo o ad altra persona pur avendo la possibilità di dettare il testo velocemente. Sebbene sia possibile cominciare a lavorare subito è comunque consigliabile effettuare l'apprendimento prima di iniziare un uso intensivo, evitando così qualsiasi problema di riconoscimento.N.B. Questo articolo è stato dettato con il sistema di dettatura VoiceType 3.0 di IBM.
|
Luigi Gangitano è raggiungibile su Internet tramite la redazione
Copyright © 1996 BETA. Tutti i diritti riservati.
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |