Nos doigts se terminent par une empreinte digitale unique, nos oreilles aussi !
Pourquoi ? Parce que nos pavillons ne ressemblent à aucun autre.
En conséquence ils “déforment“ le son de façon singulière, spécifique pour chaque personne. La preuve, si on complète nos pavillons avec les mains, l'équilibre des timbres, la phase selon la fréquence, etc , tout est chamboulé.
Conséquence, une écoute binaurale ne sera pas universelle et chacun va l'entendre à sa façon. Les décalages vont de faible à très fort. C'est ce qui est nommé les HRTF, (Head-Related Transfer Function), fonction de transfert relative à la tête. On peut considérer sur le plan théorique qu’avec un choix de 1000 HRTF on va pouvoir trouver le sien. En réalité avec un échantillon d’une cinquantaine, on peut trouver globalement chaussure à son pied.
Pour pallier la question, deux solutions possibles :
- Enregistrer avec ses propres HRTF pour écouter selon sa morphologie de l'oreille externe. Processus de laboratoire long et couteux, ou bien le faire avec le matériel approprié type “Smyth Realiser“. La question demeure de l’usage et du portage facile, sans standards reconnus, selon les applications soft et hard.
- Utiliser et choisir au mieux parmi des HRTF générique, trouvable entre autres sur le site de l'Ircam.
- L’association son image et un peu d’apprentissages facilite grandement la reconnaissance qui n’a pas besoin de précision au degré, surtout en dehors du champ de vision et en bas.
- Un suivi de tête est important pour garder de la souplesse de mouvement tout en gardant le réalisme de la position d’écoute du corps supérieur selon la scène écoutée.

PS : il y a un monde énorme entre une écoute au casque juste stéréo ou en vrai 3D ....