giovedì 25 ottobre 2012

psicoacustica_Percezione_spaziale_interaurale_stereofonica

(Le immagini sono state prese dal libro Stereophonic Sound Recording , C. Hugonnet , P. Walder) 


Percezione Spaziale

La posizione di una sorgente sonora è data da informazioni riguardanti la direzione ( azimuth ) , l’ altezza (elevazione)
e la distanza ( profondità)



Stereophonic Sound Recording ( C. Hugonnet , P. Walder)
























-direzione:

Le informazioni riguardo la posizione lungo l’azimuth di una sorgente sonora ci vengono fornite dalla differenza di intensità e il ritardo ( delay ) delle onde che raggiungono le nostre orecchie. Prendendo per esempio una sorgente posizionata alla destra dell’ascoltatore: il suono raggiungerà per primo l’orecchio più vicino ( il destro ) e in seguito l’orecchio più lontano ( sinistro ) ; inoltre poichè il suono che arriva all’orecchio più lontano avrà un’ intensità leggermente minore rispetto quello che raggiunge l’orecchio più vicino, questo perchè ha percorso una distanza maggiore ( l’intensità è inversamente proporzionale alla distanza )


Stereophonic Sound Recording ( C. Hugonnet , P. Walder)






Se consideriamo solo il ritardo  : si può considerare la testa umana come una sfera di raggio r , varrà pertanto: 



Stereophonic Sound Recording ( C. Hugonnet , P. Walder)



dove t  è la differenza di tempo tra le due orecchie ( delay ).

La lateralizzazione massima si avrà a 90 / 270 ° con un  t  = 0,65 ms , questo valore è ideale in quanto il ritardo dipende dalla frequenza e dal tipo di suono .

Se consideriamo solo la differenza di intensità  : in questo caso la differenza massima si ha a 60° , angolo di orientamento dei padiglioni e vale I = 7 dB . Anche questo è un valore ideale che varia in base alle frequenze:




Stereophonic Sound Recording ( C. Hugonnet , P. Walder)









La localizzazione lungo l’Azimuth risulta essere più precisa nel fronte / retro , infatti è più difficile localizzare con precisione una sorgente laterale



Stereophonic Sound Recording ( C. Hugonnet , P. Walder)







- Elevazione

Il fattore che ci da informazioni sull’ elevazione di una sorgente è la differenza di timbro : se consideriamo uno stesso suono proveniente prima dall’alto e poi dal basso esso avrà una certa differenza di timbro , dovuta dal fatto che avrà trovato lungo il proprio cammino ostacoli diversi ( testa , padiglioni ) quindi il suono viene “filtrato” in maniera differente. La mofologia della testa e soprattutto dei padiglioni sono i fattori che influenzano maggiormente sulla differenza di timbro percepita. Per poter riconoscere se un suono arriva dall’alto , dal basso , d’avanti o da dietro usiamo gli HRTF (Head related transfer functions): funzioni che tengono conto di come l'orecchio umano filtra il suono in arrivo (dei veri e propri dati memorizzati nel corso della nostra vita).
In generale ci sono delle frequenze che suggeriscono la posizione di una sorgente sonora:



Stereophonic Sound Recording ( C. Hugonnet , P. Walder)









- Distanza

Ci sono difersi fattori che ci danno informazione sulla distanza:

- rapporto tra segnale diretto / segnale riflesso ( riverbero );

- differenza di intensità : 6 dB = raddoppio della distanza ( vale solo se possiamo fare un confronto tra due posizioni differenti dello stesso suono);

- timbro : frequenze alte danno l’impressione di vicinanza;

- fronte d’onda .



Spazializzazione interaurale

Nell’ascolto in cuffie i valori massimi di differenza di intensità e ritardo visti precedentemente cambiano, questo perchè non utilizziamo più i padiglioni. Inoltre il suono risulta essere “dentro” la testa:





Stereophonic Sound Recording ( C. Hugonnet , P. Walder)



ritardo:  t (max) = 0,7 ms



Stereophonic Sound Recording ( C. Hugonnet , P. Walder)





non è 0,65ms perchè la cuffia si trova a 1 cm dal timpano , quindi viene associato un percorso maggiore.

differenza di intensità :  I (max) = 8 - 10 dB



Stereophonic Sound Recording ( C. Hugonnet , P. Walder)







non è 7 dB perchè  ,poichè non usiamo i padiglioni, la lateralizzazione massima si ha a 90° ( non a 60°).


Quando si vuole posizionare una sorgente in cuffie bisogna tenere presente che:

- il panpot fornito dalle DAW va da  a   , ma in realtà l’utile è da -5 a +5 dB

- in natura la differenza di intensità e il ritardo si presentano sempre assieme , pertando è importante agire su entrambi i fattori per ottenere un posizionamento il più reale possibile.

- in generale il ritardo è più “forte” della differenza di intensità

12 dB = 0.5 ms

ma questo è un valore ideale che varia in base al tipo di suono.


Abbiamo detto che in cuffie il suono risulta essere “dentro” la testa, un semplice metodo per far “uscire” il suono è quello di aggiungere un riverbero.



Ascolto stereofonico

Per ascolto stereofonico si intende la riproduzione di uno spazio solido reale attraverso 2 altoparlanti, che ricreano uno spazio piano (compreso e retrostante gli altoparlanti) composti di sorgenti sonore puntuali ( definite).
Lo standard di ascolto stereofonico implica che i 2 diffusori siano posizionati ai vertici di un triangolo equilatero di cui l’ascoltatore è il 3° vertice




Stereophonic Sound Recording ( C. Hugonnet , P. Walder)
Stereophonic Sound Recording ( C. Hugonnet , P. Walder)










Il posizionamento dell’ immagine della sorgente sonora si ottiene attraverso  ritardi e differenze di intensità tra i due canali, un’ eventuale differenza di timbro tra i due canali rende l’immagine non definita ( spread image ) e non più definita e puntuale:


( è quindi opportuno utilizzare diffusori con una risposta in frequenza identica )





Localizzazione attraverso il ritardo

Per portare un immagine ad un’estremità (+ 30°) è necessario introdurre un ritardo nel canale opposto di
t  = 0,9 - 1,1 ms




Stereophonic Sound Recording ( C. Hugonnet , P. Walder)







Quindi con un ritardo da 0 a 1 ms l’immagine va dal centro a destra / sinistra ( + / - 30° ) , se introduciamo un ritardo via via crescende succede che:

- 1 - 2 ms : l’immagine è a destra / sinistra con un eccessivo effetto di spazializzazione;

- 30 - 40 ms : inizia a crearsi un’immagine spread;

- > 40 ms: si ha un eco




Localizzazione attraverso differenza di intensità

Una localizzazione massima si ha per
I = 15 - 17 dB




Stereophonic Sound Recording ( C. Hugonnet , P. Walder)







Per ottenere una localizzazione più precisa e reale è opportuno usare in modo corretto entrambi i metodi di localizzazione:

Stereophonic Sound Recording ( C. Hugonnet , P. Walder)