Centre de recherches sur les communications Canada
Symbol of the Government of Canada

Perception des Sons

Perception des sons

Le groupe des Systèmes audio de pointe possède de l'expertise dans la conception de tests d'écoute, en analyse statistique des résultats de tests subjectifs ainsi que dans la modélisation de la perception des sons. Le groupe effectue des travaux de recherche sur la Perception des sons, incluant l'évaluation subjective de la qualité sonore des systèmes audio et de parole ainsi que la modélisation du système auditif humain.

Évaluation subjective de la qualité audio

La création d'un appareil ou d'un système audio exige une vérification de la performance sonore de cet appareil. Les mesures classiques que sont la réponse de fréquence, le rapport signal-bruit et la distorsion harmonique nous donnent une idée de sa qualité sonore, mais en fin de compte, on désire surtout déterminer la qualité du son obtenu. Pareille évaluation est par définition subjective. L'enjeu consiste donc à trouver une méthode quelconque pour obtenir cette mesure objectivement, autant de fois qu'on le souhaite.

Depuis 1990, le Groupe des Systèmes audio de pointe étudie l'évaluation subjective de la qualité perçue du signal sonore reproduit par une diversité de systèmes sonores et vocaux. Les recherches comprennent l'essai rigoureux de systèmes audio de grande qualité nécessitant la distinction d'infimes ou subtils artefacts et de systèmes de communication par la parole pour lesquels l'intelligibilité et la transmission de la communication l'emportent sur la qualité du son (voir Essais antérieurs et récents).

Laboratoire de perception des sons
Laboratoire de perception des sons

Notre expertise dans l'élaboration et la conduite de tests d'audition et nos installations, uniques en Amérique du Nord, sont à l'origine de la réputation que nous nous sommes taillée sur la scène internationale. En partant de méthodes connues de psychologie expérimentale (psychophysique et psychométrie), des recherches entreprises par d'autres laboratoires dans le monde et des recommandations des organisations de normalisation, nous avons mis au point les méthodes d'évaluation subjective les plus sensibles qui soient. Avec le concours de MPR Teltech, nous avons créé le premier système d'enregistrement et de lecture sur disque dur pour les laboratoires d'essais subjectifs. Ce système et d'autres du même genre, désormais couramment utilisés dans d'autres laboratoires que le nôtre, permettent aux auditeurs de passer sans transition du signal de référence à sa version modifiée en vue de les comparer et de fournir une évaluation de premier ordre. Ce système est devenu le CRC-SEAQ, le premier système d'essai subjectif multivoies et instrument de mesure objectif sur disque dur.

Parmi les autres innovations du Laboratoire de perception sonore, mentionnons des méthodes statistiques permettant d'estimer l'expertise de chaque sujet, l'utilisation de l'analyse de la variance (ANOVA) comme la meilleure façon d'analyser les données recueillies lors des essais subjectifs et un programme de formation complet pour les auditeurs.

Grâce à une participation dynamique aux travaux des organisations de normalisation comme l'UIT-R, la MPEG et l'AES au fil des ans, la plupart des innovations et des améliorations réalisées au laboratoire ont été intégrées aux méthodes recommandées à l'échelon international (p. ex. recommandation BS.1116 de l'UIT-R pour l'évaluation des systèmes entraînant de fortes dégradations).

Nous suivons à la lettre la recommandation BS.1116 lors de l'essai des systèmes à haute fidélité (surtout les codecs pour la radio numérique), soit : sélection des composantes audio essentielles; spécifications de la salle d'écoute de référence; qualité de l'équipement de lecture; formation très poussée des sujets avant les essais à double secret incluant l'application d'une échelle de classement; recours aux seules données des sujets démontrant une expertise suffisante; analyse des données par la méthode ANOVA en vue de l'interprétation des résultats. Regroupées, ces caractéristiques définissent le système d'évaluation le plus exigeant plutôt qu'un système d'évaluation moyen.

L'application de ces méthodes nous permet normalement d'obtenir des données situées à 5% de la cote d'évaluation subjective (à savoir, 0,20 de la cote ou moins, sur une échelle de 5, les sujets donnant une cote précise à la première décimale; donc échelle de 41 points, en réalité). Nous continuons à perfectionner nos méthodes, en cherchant constamment comment les améliorer.

Alors que la recommandation BS.1116 concerne la quantification des faibles dégradations, nous tentons actuellement de mettre au point une méthode qui permettrait d'évaluer les dégradations de moyenne et de grande importance. Avec la multiplication des codecs audio à plus faible débit binaire (p. ex. MP3) sur Internet et des applications multimédias, on a maintenant besoin d'une méthode fiable pour évaluer les systèmes audio de moins bonne qualité subjective. Les premiers résultats de ces travaux furent dévoilés au colloque de l'AES, à Florence, en septembre 1999. Notre méthodologie fut soumise à l'EBU et à l'UIT-R et devint la base de la recommendation BS.1534 de l'UIT-R, Méthode d'évaluation subjective du niveau de qualité intermédiaire des systèmes de codage.

Essais antérieurs et récents

Au fil des ans, nous avons mené plusieurs tests subjectifs pour évaluer et comparer la performance de divers codecs audio. Parmi ceux-ci, mentionnons celui mené en 1997 qui consista à étudier la performance de cinq codecs audio alors en vogue, soient mp2, mp3, Dolby AC-3, Lucent PAC et AAC. Les résultats firent l'objet d'un article paru dans l'AES Journal et cette contribution demeure à ce jour l'une des plus fréquemment citée dans le domaine (voir Subjective Evaluation of State-of-the-Art 2-Channel Audio Codecs, AES Journal, Mars 1998). Auparavant, nous avions effectué des tests pour l'UIT-R dans le cadre de la recommandation des codecs audio pour diverses applications en radiodiffusion. Nous avons aussi effectué des tests pour le National Radio Subcommittee de l'Electronics Industry Association des États-Unis dans le cadre de son évaluation des systèmes envisageables pour la radio numérique (EIA/NRSC DAR Systems Subjective Tests : Part I, Audio Codec Quality et Part II, Transmission Impairments, IEEE Transactions on Broadcasting, novembre 1997 et décembre 1997).

Dans le secteur des communications vocales, nous avons récemment mis au point et validé de nouvelles méthodes permettant d'évaluer l'interruptibilité des systèmes de communications employés par l'armée. Ces systèmes à commutation par paquets peuvent susciter des retards dans la transmission en temps réel. Nous avons aussi entrepris des essais sur l'intelligibilité de la parole pour l'armée canadienne, qui tenait à établir l'utilité des systèmes de communication en présence de bruit important.

Plus récemment, notre groupe a mené une suite de tests subjectifs pour mesurer la sonie de divers extraits audio afin de construire une banque de données de résultats subjectifs servant à évaluer la performance de divers modèles de sonomètres soumis à l'UIT-R pour l'établissement d'une norme internationale. Ceci fut suivi d'une autre série de tests d'écoute pour affiner l'algorithme de mesure de la sonie retenu par l'UIT-R dans le but de tenir compte des contributions du canal de basses fréquences d'un son multi-canaux, des périodes de silence et des signaux de faibles amplitude. Notre expertise couvre les domaines suivants : psychologie expérimentale (conception d'expériences, analyse statistique et psychoacoustique) et ingénierie.

Modélisation de la perception du système auditif humain

Il est important de comprendre comment le système auditif humain traite les stimulus acoustiques si l'on veut mettre au point de nouvelles technologies audionumériques. Les codecs audio, éléments essentiels des nouveaux services multimédias et de radiodiffusion numérique, exploitent les propriétés du système auditif pour comprimer les données audionumériques afin qu'elles soient enregistrées ou transmises à un débit binaire minimum. Récemment, de nouvelles techniques de mesure objective de la qualité des sons ont été conçues. Ces techniques utilisent un modèle du système auditif humain afin de produire des mesures objectives qui soient bien corrélées avec les résultats de tests d'écoute. Notre laboratoire effectue des recherches en vue de perfectionner et de tester de tels modèles psychoacoustiques du système auditif humain.

La recherche en psychoacoustique nous aide à saisir le lien qui existe entre les propriétés physiques d'un son et la manière dont l'oreille humaine perçoit ce son . Ainsi, pour l'auditeur, l'énergie d'un son correspond à l'intensité de ce dernier, tandis que sa fréquence correspond à sa hauteur (tonie). La fonction reliant les caractéristiques physiques d'un son et la façon dont ce son est perçu est souvent une fonction non linéaire. Par exemple, Stevens et Volkmann ont découvert en 1940 que la relation entre la fréquence et la tonie perçue d'un son est telle que décrite dans la figure ci-dessous.

Fonction fréquence/tonie

L'étude des liens entre les propriétés physiques des sons et la façon dont ces sons sont perçus nous aide également à comprendre les limites et la variabilité de l'ouie. Ainsi, les êtres humains n'ont pas tous la même aptitude à entendre les sons à haute fréquence. Les jeunes perçoivent fréquemment les sons allant jusqu'à 17 ou 18 kHz, tandis que plusieurs personnes agées n'entendent pas les fréquences supérieures à 8 kHz. D'autre part, certaines fréquences composant un son, physiquement présentes dans le signal, peuvent être rendues inaudibles par la présence d'autres composantes importantes situées à proximité dans le domaine temporel ou dans le domaine fréquenciel. Ce phenomène, appelé «masquage», varie considérablement d'un sujet à un autre.

Les progrès récents dans le domaine du codage source audio sont en grande parties dûs à l'exploitation du phénomène de masquage de l'oreille humaine. Des modèles psychoacoustiques sont utilisés dans les codeurs audio pour identifier les composantes inaudibles des sons à coder. En ignorant ces composantes inutiles, il est possible de réduire sensiblement le débit binaire requis pour transmettre ou enregistrer le signal audionumérique. L'efficacité des algorithmes de codage varie généralement avec le contenu du signal audio et certains algorithmes de codage exploitent mieux les propriétés psychoacoustiques de l'oreille humaine que d'autres. Notre groupe a développé et breveté un modèle psychoacoustique pour utilisation dans les systèmes de codage audio (voir H. Najaf-Zadeh, H. Lahdili and L. Thibault, "Incorporation of Inharmonicity Effects into Auditory Masking Models," 113rd AES Convention, Los Angeles, 2002 et H. Najaf-Zadeh, H. Lahdili, L. Thibault and M. Lavoie, "Use of Auditory Temporal Masking in the MPEG Psychoacoustic Model," 114th AES Convention, Amsterdam, 2003).

La psychoacoustique a aussi facilité l'élaboration de nouvelles méthodes pour mesurer objectivement la qualité sonore des systèmes audio en général, et des codecs audio en particulier. Une de ces méthodes, baptisée PEAQ (Perceptual Evaluation of Audio Quality - évaluation perceptuelle de la qualité sonore) a été normalisée par l'Union internationale des télécommunications - Secteur des radiocommunications (UIT-R) dans la Recommandation BS.1387 intitulée « Méthode de mesure objective de la qualité du son perçu ».

Certains éléments du modèle PEAQ de l'UIT sont tirés d'un modèle plus ancien, Perceval, un outil mis au point par le CRC pour mesurer objectivement la qualité sonore des codecs audio. Le modèle du système auditif périphérique de Perceval a été créé dans le cadre d'un contrat avec l'Université de Sherbrooke (Québec), au Canada. Un modèle cognitif, qui analyse le signal généré par le modèle du système auditif périphérique, a été créé et ajouté à Perceval par les chercheurs du CRC. Le modèle cognitif génère une mesure de la qualité sonore d'un signal ou encore une mesure du seuil de détection d'un son en présence d'un autre. Perceval reproduit les phénomènes psychoacoustiques élémentaires se produisant dans l'oreille humaine (tel le masquage) et mesure objectivement la qualité d'un signal sonore traité par une pièce d'équipement audio tel qu'un codec audio. Cette mesure objective est bien corrélée avec la qualité subjective attribuée par des sujets humains.

Note groupe a développé une version commerciale de la norme PEAQ de l'UIT-R dans le Module de test objectif du logiciel CRC-SEAQ. La recherche pour améliorer les méthodes objectives pour mesurer la qualité sonore se poursuit dans notre groupe.

L'utilisation de modèles de l'oreille humaine permet d'optimiser les performances de certains appareils de traitement des signaux audio ainsi que des équipments de mesure de qualité du son. Ceci est possible parce que le fonctionnement de l'oreille humaine est suffisamment bien connu et peut être modelisé en temps réel avec la technologie d'aujourd'hui. Néanmoins, certains aspects de la perception du son sont encore méconnus. Notre groupe a aménagé des installations et poursuit les recherches afin de combler les lacunes du savoir humain sur la perception du son (voir W. Treurniet and D. Boucher, "A masking level difference due to harmonicity", J. Acoust. Soc. Am., 109(1):306-320, 2001).

Plus récemment, notre groupe a développé une méthode objective pour mesurer l'intensité sonore des signaux audio. Notre méthode a été sélectionnée par l'UIT-R en 2006 parmi 11 méthodes proposées pour devenir une norme internationale décrite dans la Recommandation BS.1770, « Algorithmes de mesure de l'intensité sonore des programmes audio et des niveaux de crête vrais des signaux audio ». Cette méthode de mesure de l'intensité sonore a été adoptée par plusieurs associations de radiodiffuseurs (World Broadcast Union, North American Broadcast Association, Union européenne des radiodiffuseurs, Advanced Television System Committee, etc.) et est présentement déployée dans plusieurs studios de radiodiffusion à travers le monde. Notre groupe a développé sa propre version commerciale de la norme BS.1770 de l'UIT-R dans le Sonomètre du CRC.