Metodi di valutazione e normative internazionali
L’importanza della corretta comprensione di un messaggio vocale diffuso da un impianto di emergenza è essenziale. Come effettuarne una valutazione?
Esistono vari metodi per valutare l’intelligibilità del parlato in relazione ad un determinato ambiente. Essi si dividono sostanzialmente in:
- metodi per valutazioni acustiche
- metodi per valutazioni elettroacustiche,
rispettivamente aventi come obiettivo la caratterizzazione acustica dell’ambiente e la valutazione della bontà di un sistema di diffusione sonora ivi installato. Tali metodi si differenziano per il genere di sorgente sonora che fornisce lo stimolo per l’analisi, Nel primo caso si tratta tipicamente di una sorgente sonora di tipo omnidirezionale (quantomeno nella regione di frequenze di interesse) e dalla risposta in frequenza lineare, mentre nel secondo possono essere i diffusori acustici previsti installati nella loro sede definitiva. Di seguito saranno presentati alcuni di questi metodi, con particolare riferimento alla valutazione del sistema elettroacustico.
Il test a vocabolario
Si basa su di una sorta di “dettato” in cui un certo numero di lettori provvede a leggere alcuni gruppi di parole, non necessariamente di significato compiuto, a beneficio di più ascoltatori che provvedono ad annotare ciò che percepiscono. Si tratta di uno dei più sperimentati metodi per la caratterizzazione dell’intelligibilità del parlato, del quale esistono numerose varianti. A titolo di esempio, le tabelle 1 e 2 nel pdf scaricabile qui sotto riportano due liste per il test di intelligibilità a vocabolario, la prima utile per valutare l’intelligibilità della prima consonante, la seconda utile per la valutazione dell’intelligibilità della seconda consonante di una parola.
[sociallocker id=2710][/sociallocker]
Il test di intelligibilità a vocabolario è di ampia diffusione sia in Europa che negli Stati Uniti, per quanto solo in quest’ultimo paese sia stato normalizzato anche un elenco di parole adatte allo scopo. La versione forse più diffusa è basata su di un processo di lettura-ascolto+scrittura di 20 liste di 50 parole fonemicamente bilanciate (abbreviato PB, dall’acronimo del termine inglese) ciascuna, per un totale di 1.000 parole. Le parole devono essere incluse nella stessa frase portante tipo: “Scrivete ora la parola …..”. L’ascoltatore dovrà scrivere su di un foglio di carta ciò che ha percepito. Il tempo di riferimento per amministrare una lista di 50 parole PB è di 200 secondi (una frase ogni 4 secondi); ad ogni lettore necessiteranno circa 15 minuti per esaurire il suo compito.
Esistono precise direttive anche su come svolgere un test di questo genere, a cominciare dalla scelta dei lettori e degli ascoltatori. I lettori (almeno cinque secondo le norme americane) vanno scelti fra i parlatori medi (non professionisti, cioè non attori o doppiatori), rappresentativi per lingua madre, età e sesso di chi sarà l’utilizzatore dell’impianto analizzato; ovviamente essi non devono evidenziare alcun grave difetto di pronuncia o inflessione dialettale non locale. Le parole delle liste vanno lette a cadenza regolare e conservando il medesimo tono di voce, senza enfasi; nel caso di articolati sistemi di diffusione sonora, la lettura deve essere effettuata da ogni postazione ove sia prevista la presenza di un microfono. Per ogni microfono senza filo, è sufficiente l’effettuazione di una sola prova.
Gli ascoltatori scelti (in numero pari o superiore ai lettori) devono essere rappresentativi per lingua madre, età e sesso di chi sarà il fruitore dell’ambiente analizzato; ovviamente essi non devono evidenziare alcun grave difetto percettivo. Essi devono distribuirsi in maniera casuale nella zona riservata loro, nell’ambito dell’area destinata all’audience; persone di una certa età dovranno prendere posto in realistica prossimità di un sistema di altoparlanti dell’impianto. Lettori ed ascoltatori dovranno essere istruiti sia in termini di procedura di test, sia (a seconda della metodologia di test adottata) in termini di conoscenza delle liste di parole. In modo particolare i lettori devono abituarsi a mantenere una velocità di lettura uniforme e conforme con i segnali di temporizzazione. Gli ascoltatori devono essere istruiti prima in un ambiente silenzioso e quindi nell’ambiente che sarà sede del test utilizzando l’impianto da valutare.
Il livello sonoro, misurato in prossimità della testa dell’ascoltatore, deve essere il medesimo di quello previsto nell’ambito del funzionamento dell’impianto. Un valore tipico è pari a 65 dB-A e comunque dovrà superare di almeno 15 dB il rumore di fondo dell’ambiente nelle condizioni di utilizzo. L’assorbimento della stanza (e conseguentemente l’RT60) dovrà essere il medesimo di quello misurabile in condizioni di presenza di un numero di ascoltatori conforme all’applicazione. Il metodo di valutazione più semplice consiste nel ricavare il numero percentuale di parole correttamente percepite in rapporto al totale delle parole che sono state lette, dopodiché è ammissibile fornire un giudizio qualitativo in base alla seguente tabella:
Percentuale | Grado di intelligibilità del parlato |
Inferiore al 35% | Cattivo |
Compresa tra il 35% e il 65% | Scarso |
Compresa tra il 65% e l’80% | Sufficiente |
Compresa tra l’80% e il 95% | Buono |
Superiore al 95% | Ottimo |
La formula di Peutz-Davis
Il grado di intelligibilità del parlato in un determinato ambiente viene valutato stimando la quantità percentuale di consonanti non comprese dall’ascoltatore durante l’articolazione del parlato (%Alcons o semplicemente Alcons), teoricamente pari a:
\[ AL\,_{cons}= (\frac{200·d^2\,·RT_{60}\,^2}{V·Q}+a)\,\% \]
in cui d è la distanza di valutazione dalla sorgente (in metri), RT60 è il tempo di riverberazione (in secondi) relativo alla banda d’ottava centrata intorno alla frequenza di 2 kHz, V è il volume dell’ambiente (in m3) e Q è il fattore di direttività del diffusore acustico impiegato, anch’esso riferito alla frequenza di 2 kHz. Il fattore correttivo “a” tiene conto del grado di attitudine alla comprensione dei messaggi vocali da parte dell’ascoltatore (dettato da ragioni emotive, linguistiche, culturali, ecc.). Nel caso di un attento ascoltatore, a=1,5, per un ascoltatore medio a=2,5 e per un ascoltatore scarso a=12,5. Ovviamente, più basso è l’ALcons migliore sarà l’intelligibilità del parlato.
La citata formula è da ritenersi valida solo per distanze inferiori alla distanza limite (DL=3,16 DC nel caso di RT60 minore di 1,5 secondi) e se il rapporto segnale-rumore è maggiore o uguale a 25 dB. Oltre la distanza limite DL, l’ALcons si mantiene sempre di valore pari a:
\[ AL\,_{cons}=(9\,·RT_{60}+a)\,\% \]
La percentuale di consonanti perse può essere valutata anche facendo ricorso a particolari diagrammi che legano tra loro i valori dell’ALcons, del rapporto segnale-rumore e del tempo di riverberazione (grafici di Peutz, vedi puntata precedente).. Tali diagrammi sono altresì utili per una stima del massimo livello di rumore di fondo o del massimo tempo di riverberazione ammissibili al fine di non incorrere in condizioni di intelligibilità non sufficiente. Una volta ottenuti, o per via matematica o per via grafica, i risultati dell’indice ALcons vanno interpretati come segue:
VALORI DI ALCONS | GIUDIZIO |
da 0 a 5 | intelligibilità ottima |
da 5 a 10 | intelligibilità buona |
da 10 a 15 | intelligibilità sufficiente |
da 15 a 20 | scarsa intelligibilità |
superiore a 20 | cattiva intelligibilità |
Qualora siano presenti più sorgenti sonore distanziate tra loro, come è il caso di sistemi di diffusione sonora distribuiti, la formula di Peutz-Davis non trova una applicazione immediata principalmente per il fatto che il fattore di direttività relativo ad ogni sorgente è in genere diverso, anche se queste ultime sono identiche, in quanto l’asse di emissione cui si fa riferimento è differente. L’unica eccezione si ha quando è possibile considerare il campo sonoro attorno ad ogni sorgente come se fosse generato solo da questa, trascurando in pratica gli effetti sul campo riverberato di tutte le altre sorgenti. Sono comunque note due varianti della formula di Peutz-Davis, applicabile in una tale circostanza, ovvero:
\[ AL\,_{cons}= (\frac{200·d^2\,·RT_{60}\,^2·N}{V·Q ·M})\,\% \]
in cui N è il rapporto in potenza tra il contributo del diffusore acustico che produce nel punto a distanza d il campo diretto ed il contributo di tutti gli altri diffusori acustici, ovviamente valutati con gli stessi in contemporaneo funzionamento e nella medesima posizione. M è un fattore, in genere di valore unitario, che tiene conto di estensioni della distanza critica per cause di varia natura (es. assorbimento addizionale da parte di un gruppo di ascoltatori). Un’altra formula proposta è la seguente:
\[ AL\,_{cons}= (\frac{200·d^2\,·RT_{60}\,^2 · (n+1)}{V·Q·M}+a)\,\% \]
in cui figura direttamente il numero di diffusori acustici impiegati (n).
I metodi STI e RASTI
Il metodo STI (Speech Trasmission Index) e la sua versione approssimata RASTI (Rapid Speech Trasmission Index) ipotizzano che un’ottima trasmissione del parlato si accompagni all’assenza di severe modificazioni nella forma dell’onda sonora nel passaggio da sorgente ad ascoltatore. La qualità della intelligibilità è valutata analizzando la modulazione subita dall’onda sonora emessa dalla sorgente a causa di:
- rumore di fondo;
- tempo di riverberazione;
- assorbimento differenziato dei materiali che compongono l’ambiente.
Questi metodi sono molto utilizzati dai programmi di calcolo per PC ed in genere forniscono previsioni piuttosto accurate. La relazione matematica che lega l’STI all’ALcons è:
\[ AL\,_{cons}= 171·e^{-5,4(STI)} \]
e inversamente:
\[ STI= 0,95 – 0,19·Ln\,(AL\,_{cons}) \]
In forma di tabella si ha:
STI | ALCONS | GIUDIZIO |
da 0,75 a 1 | da 0 a 5 | intelligibilità ottima |
da 0,6 a 0,75 | da 5 a 10 | intelligibilità buona |
da 0,45 a 0,6 | da 10 a 15 | intelligibilità sufficiente |
da 0,3 a 0,45 | da 15 a 20 | scarsa intelligibilità |
inferiore a 0,3 | superiore a 20 | cattiva intelligibilità |
Il metodo di misurazione RASTI si avvale di un segnale test che viene applicato ad una sorgente sonora e da questa immesso nell’ambiente di interesse. Tale segnale possiede delle caratteristiche ben precise che ricalcano quelle possedute dalla voce umana. Il metodo RASTI è valido solo se la trasmissione sonora avviene in modo lineare, il rumore di fondo non subisce sbalzi di livello e se il tempo di riverberazione non varia in base alla frequenza (alle frequenze intermedie). Esso inoltre non considera la banda di frequenze sopra i 2.000 Hz ed è quindi valido solo per una valutazione, per quanto parziale, dell’intelligibilità del parlato. Noti i valori di RASTI è possibile risalire all’ALcons :
VALORI DI RASTI | VALORI DI ALcons | GIUDIZIO |
da 0,88 a 1 | da 0 a 5 | intelligibilità ottima |
da 0,66 a 0,86 | da 5 a 10 | intelligibilità buona |
da 0,52 a 0,64 | da 10 a 15 | intelligibilità sufficiente |
da 0,36 a 0,5 | da 15 a 20 | scarsa intelligibilità |
inferiore a 0,34 | superiore a 20 | cattiva intelligibilità |
Normative internazionali sulla intelligibilità del parlato
Il gran numero di metodi per valutare l’intelligibilità del parlato di un certo ambiente ha suggerito a Enti normatori come ISO, in Europa, ed ANSI, negli Stati Uniti, di promulgare delle normative che contenessero delle linee guida per l’esecuzione delle verifiche secondo i metodi più diffusi e fornissero nel contempo dei valori di riferimento universali. Per la precisione, dette normative sono le seguenti:
ANSI S3.2 (1991)
ISO/TR 4870 (1991), Acoustics – The construction and calibration of speech intelligibility tests
Il grafico in fig. 1, pubblicato nel fascicolo della norma ISO, stabilisce che ogni raccomandazione dovrà essere fatta in riferimento ad un nuovo indice di intelligibilità, leggibile sulla scala comune di intelligibilità (common intelligibility scale, CIS) e ricavabile in funzione del valore dell’indice di intelligibilità noto o misurato. E’ chiaro che la curva da prendere in esame dovrà essere quella riferita al metodo di interesse. Per esempio, un valore di STI pari a 0,5 individuerà un valore CIS pari a 0,7.

Bibliografia
[1] U.Nicolao, Manuale di Acustica Applicata per la Diffusione Sonora, Ed. Il Rostro, Milano, 2003;
[2] D. e C.Davis, Sound System Engineering, Howard Sams & Co., Indianapolis, IN, USA, 1987;
[3] AA. VV. La Diffusione Sonora in Ambienti Acusticamente Difficili, Quaderni di aggiornamento in tecniche e tecnologie audio, Ed. Il Rostro, 2002
[4] Speech Intelligibility, Pubblicazione JBL Professional, Stati Uniti;
1 Comment
Interessante serie di articoli che ho condiviso su Linkedin.
Ho anche seguito la sua lezione al corso tenutosi alla scuola di acustica di Ferrare nel 2016 (0 2015? non ricordo bene).
Ne approfitto per chiederle la cortesia di dirmi se e dove è possibile scaricare la lista delle parole foneticamente bilanciata o dei testi di rima modificata, necessari per fare valutazioni soggettive dell'intelligibilità.
La ringrazio per la disponibilità e le auguro una
buona giornata
Dott. Stefano De Stabile
Scrivi un commento