La gestion des niveaux sonores (3): Variations du loudness

Suite à l’article sur la définition du loudness, intéressons-nous maintenant à ses conséquences directes et pratiques sur notre perception de la musique.

Suivant le type et le jeu d’un instrument ainsi que son contenu fréquentiel, la sensation du niveau sonore ne sera pas la même. Et ceci alors que l’indicateur de niveau sur la DAW me montre le même niveau sonore! Il faudra alors introduire une nouvelle unité de mesure objective des décibels (les Loudness Units LU) pour donner une indication plus précise du niveau subjectif.

Sons percussifs VS. Sons soutenus

Un premier paramètre influençant le loudness est le type de son joué, plus précisément son intermittence ou non. Typiquement, c’est la différence entre un son percussif (transitoires marquées) par rapport à un son continu et constant (un pad, une ambiance…).

Faisons le test en comparant le son d’une grosse caisse (Kick) avec celui d’un pad riche (dent de scie avec unison et joué en legato):

Son du Kick:

Son du Pad:

A ton avis, lequel des deux ressens-tu le "plus fort"?

Il s’agit du pad, n’est-ce pas? Pourtant, j’ai « bouncé » les deux sons exactement au même niveau de mesure. Voici maintenant le son du Kick ramené au même niveau subjectif que le son du Pad (compares bien en les écoutant plusieurs fois):

J’ai dû augmenter le Kick de 3 à 4 dB afin d’obtenir la même perception de niveau sonore. Ceci montre bien l’importance de distinguer la nature transitoire ou non des sons que l’on mixe.

La problématique du masquage en mixage audio

Une ressource importante en mixage est l’espace sonore. Quand différents instruments jouent ensemble, ils se disputent cet espace. Cela est principalement dû au phénomène de masquage: un son ressenti plus fort empêchera l’autre son d’être entendu correctement.

Des sons percussifs vont et viennent. Par exemple, entre chaque coup de kick, il y a peu voire plus du tout de son. Ces types de son (que l’on appelle transitoires, « transients » en anglais) se battent pour l’espace sur des périodes successives de temps délimité.

De l’autre côté, des sons soutenus sur une plus longue période de temps se battent constamment pour l’espace. Ici, l’exemple extrême du Pad montre que ce son remplit à la fois le spectre fréquentiel et la panorama stéréo. Il est alors susceptible de masquer beaucoup d’autres éléments dans le mixage.

En jouant les deux sons ensemble, l’impact du kick est nettement masqué:

Dans la pratique, les instruments soutenus requièrent plus d’attention. Que l’on travaille les niveaux, le panning ou les EQ, nos actions sur ce type de son ont un effet sur de plus longues durées. Augmenter le niveau d’un pad dense va engendrer plus de problèmes qu’augmenter le niveau du kick.

Un kick qui masque un autre élément va le faire seulement sur de courtes périodes. Mais dans le cas du pad, il masquera l’élément de manière constante, ce qui est bien plus problématique.

Sensibilité auditive en fonction de la fréquence

Petit rappel historique:

En 1933, deux chercheurs du Bell Labs, Harvey Fletcher et W.A. Munson, supervisèrent une des plus fameuses expérience en psycho-acoustique. Cette expérience était basée sur une série de tests appliqués sur un groupe de personnes devant écouter des sons à une certaine fréquence.

Chaque test consistait à émettre une tonalité de référence à 1 kHz, puis une autre tonalité test à une certaine fréquence. La personne qui écoute devait choisir laquelle des deux est la plus forte à ses oreilles.

Les tests successifs impliquaient différentes fréquences test (toujours par rapport à la même référence à 1 kHz), ainsi que les mêmes tests à différents niveaux sonores.

La compilation des résultats statistiques de cette expérience allaient donner les célèbres (et controversées suivant les époques) courbes de Fletcher & Munson.

Les courbes d'isosonie ou "Equal Loudness Contour"

La finalité de ces tests était de pouvoir conclure de combien il fallait augmenter ou diminuer le niveau (objectif, en dB SPL) des différentes fréquences pour qu’elles soient « perçues » au même niveau (subjectif) que celle à 1 kHz.

Depuis des expériences similaires ont été entreprises avec des résultats sensiblement différents à chaque fois (mais les conclusions restent les mêmes: voir plus loin). Aujourd’hui ces courbes sont reconnues sous le standard ISO 226 et sont nommées de manière formelle « Equal-loudness Contour » (ou courbes isosoniques en français).

Et en voici une représentation ci-dessous:

Comment "lire" ces courbes?

Tout d’abord, l’expérience démontre toute la différence entre un niveau sonore objectif mesuré et un niveau sonore subjectif perçu (résultats statistiques basés sur un panel de personnes).

Pour faire la différence avec le niveau de mesure en dB SPL, le niveau subjectif perçu est exprimé en « phones ». Seul le niveau à 1 kHz (la fréquence de référence) est équivalent à son niveau en dB SPL: dB SPL = phone à 1 kHz.

Exemple de la courbe à 40 phones

Pour bien comprendre comment lire ces courbes, prenons l’exemple de la courbe à 40 phones (en mauve). Cela veut dire que la tonalité de référence à 1 kHz est jouée à 40 dB SPL.

Si on prend la fréquence à 100 Hz, l’intersection avec la courbe correspond à 50 dB SPL. Cela signifie que pour un signal à 100 Hz (et à 40 dB SPL), la plupart des personnes ont besoin d’augmenter le niveau de +10 dB en moyenne pour ressentir la même impression de volume sonore qu’à 1 kHz.

Une différence de 10 dB

On a vu dans l’article précédent que notre oreille est capable de différencier l’impression de volume à 1 dB près. Et une différence de +10 dB correspond à une sensation de doublement du volume sonore.

Cet écart entre 100 Hz et 1 kHz est donc tout sauf négligeable!

En répétant le processus sur tout le spectre audible, puis à d’autres valeurs de dB SPL (de 10 à 120-130), on obtient l’ensemble des courbes (en faisant la moyenne statistique avec toutes les personnes testées).

Comment interpréter ces courbes?

L’analyse de ces courbes permet de conclure sur trois aspects fondamentaux:

1. L'oreille a un maximum de sensibilité aux alentours de 5 kHz

Notre ouïe est donc la plus sensible dans les médiums. On le voit à la courbe en cloche passant par un minimum entre 3 et 6 kHz. Ceci correspond à la zone de fréquence de résonance de notre canal auditif.

Il se trouve que les fréquences fondamentales pour la discrimination de la parole (compréhension des mots) sont concentrées dans les fréquences médiums (entre 800 et 5000 Hz en moyenne).

2. Plus les fréquences sont basses, moins l'oreille est sensible

L’oreille diminue fortement en sensibilité dans les basses fréquences (elle diminue également légèrement en sensibilité dans les hautes fréquences).

Par exemple, sur la courbe à 20 phones (donc 20 dB SPL à 1 kHz), il faut 80 dB SPL à 20 Hz pour ressentir le même volume sonore, soit une diminution de sensibilité de 60 dB par rapport à 1 kHz!

On peut voir aussi sur les courbes la différence de dynamique entre les graves (50 dB) par rapport aux médiums (120 dB de dynamique dans la zone 3 à 6 kHz).

Testes par toi-même sur le son suivant. Tu constateras bien une baisse de volume entre le son à 1000 Hz comparé au son à 63 Hz. C’est pourtant exactement le même son sans changement de volume. J’ai dû augmenté le son à 63 Hz d’au moins 13 dB pour avoir la sensation de même volume que celui à 1000 Hz:

Son filtré autour de 1000 Hz (bande 1/3 d’octave):

Même son filtré autour de 63 Hz (bande 1/3 d’octave):

Même son filtré autour de 63 Hz avec le volume augmenté de +13 dB:

3. Plus le niveau est fort, plus notre perception des basses fréquences augmente

Effectivement, plus on monte en niveau sonore, plus les courbes « s’aplatissent ».

Une autre façon de voir cela est que plus la musique est jouée forte, plus nous percevons les fréquences dans les extrêmes.

On associe généralement les basses avec la puissance et les aiguës avec la définition, la clarté et le scintillement (voir article sur la perception des bandes de fréquences). Il est donc naturel de trouver la musique plus plaisante à plus fort volume (si tenté qu’on l’écoute sur un bon système d’écoute, cela va de soit).

L’oreille agit finalement comme un filtre en fonction du volume global: plus ce dernier est faible et plus l’oreille « coupe » les fréquences graves et aiguës afin de privilégier les médiums.

Musique à volume normal:

Musique à bas volume:

Musique à bas volume avec les fréquences graves et aiguës réhaussées:

Une application aussi connue est le réglage Loudness que l’on trouvait naguère sur toutes les chaînes Hi-fi, qui permettait de rajouter les graves et aiguës manquantes à faible niveau, et qu’il fallait désactiver lorsqu’on remontait le volume.

Ce que cela implique en audio

1. Le syndrome du "plus c'est fort, mieux c'est"

La conséquence directe du dernier point est ce syndrome que nombre de mixeurs audio expérimente et se fait piéger. Une fois que les niveaux augmentent, il est difficile de continuer à écouter à plus faibles niveaux.

Un mixeur expérimenté a bien conscience de ce phénomène et sait y remédier. D’où le point suivant:

2. L'importance de l'écoute à différents niveaux en mixage

Le fait que le niveau sonore influence notre perception des fréquences est un aspect fondamental en mixage musical.

Comment est-on supposé réaliser un mixage équilibré si son contenu fréquentiel varie avec le volume? A quel niveau d’écoute doit-on mixer? Et que se passera-t’il si l’utilisateur final écoute à différents niveaux?

Une réponse simple à toutes ces questions est de bien vérifier son mixage à différents niveaux. Le niveau absolu d’écoute/de travail influence fortement la balance spectrale perçue et donc le travail:

– A bas niveau, moins de perception des basses donc risque d’en mettre trop.

– A haut niveau, plus de perception des basses donc risque d’en mettre pas assez.

Ces considérations dépendent bien sûr de l’expérience individuelle de chacun en mixage. Cependant, les considérations suivantes, généralement admises, sont une bonne manière de procéder:

* Un mixage bon à bas niveau a de grandes chances d'être bon à fort niveau

L’inverse n’étant pas toujours vrai!

* Le niveau d'écoute de référence doit être aussi proche que possible du niveau final pour lequel la musique est susceptible d'être jouée

Par exemple, une musique de style « dance » s’écoutera plus fort qu’un morceau d’ambient. Il est donc judicieux de prévoir le volume de travail du mixage en conséquence.

* Le mixage des fréquences médiums pour tous les éléments est la clé

Pour donner un exemple clair, si le son d’une basse n’est présent que dans les basses fréquences, la basse est susceptible d’être faiblement entendue (voire plus du tout!) à faibles niveaux. Mais si on fait en sorte de faire un traitement EQ de la basse dans les hauts-médiums, l’équilibre de l’instrument sera respecté quelque soit le niveau sonore.

Il est donc recommandé de travailler les éléments prédominants dans les basses ou les aiguës comme une extension aux fréquences médiums. Ces dernières variant peu avec le volume sont la clé d’un mixage équilibré.

Ce n’est pas un hasard si on retrouve dans quasi tous les studios professionnels une paire d’enceintes annexe Yamaha NS10! Elles sont connues pour leur courbe en fréquence pas du tout neutre (gros boost dans les médiums). Mais si elles sont très prisées, c’est parce que les ingénieurs savent que si le mixage sonne bien à l’écoute sur ces enceintes alors c’est qu’il est bon 😉

3. Un spectre équilibré requiert beaucoup plus de niveau dans les basses fréquences

Le phénomène de perception des basses fréquences qui augmente avec le niveau est parfaitement connu.

Les systèmes de HP (sono, monitoring) sont conçus pour avoir un niveau maximal en basses fréquences élevé (par rapport aux médiums/aiguës) pour pouvoir reproduire de la musique « normale ».

Cela sert aussi notamment à calibrer les cabines d’écoute à un certain volume de référence, censé être le plus linéaire en terme de perception des fréquences.

La visualisation d’un spectre « équilibré » montre toujours un niveau (moyen) en basses fréquence plus élevé:

Les unités de pondération des décibels

Cette différenciation entre niveau objectif et subjectif a donc des conséquences sur la mesure « réelle » des niveaux sonores.

Afin de « simuler » la réponse spectrale de l’oreille à différents niveaux sonores, il est nécessaire d’incorporer des filtres avant l’indication du niveau. Ces filtres sont basés sur les courbes de pondération. On parlera alors de décibels A, B, C, etc…

Pondération A

Elle est appliquée pour les niveaux faibles: coupe fortement les basses fréquences (-50 dB à 20 Hz) et un peu les hautes fréquences (environ -10 dB à 20 kHz).

En acoustique, quasiment tous les niveaux sont spécifiés en pondération A (même les forts).

Pondération C

Elle est utile pour les niveaux forts: coupe un peu les basses fréquences (environ -8 dB à 20 Hz) et les hautes fréquences (environ -10 dB à 20 kHz).

On retrouve donc les dBC dans la mesure des niveaux maximum de réglementation dans les concerts. C’est aussi le niveau de calibration pour toutes les écoutes en studio, post-prod et cinéma.

Les mesures de niveau en LU (Loudness Unit)

Et comment tout cela se concrétise sur la mesure et l’indication des niveaux dans notre DAW?

Généralement, les indicateurs de base ne permettent pas d’avoir une idée précise des niveaux de loudness. Seuls les niveaux « Peak » et moyen « RMS » sont directement visualisables. Mais je reviendrai en détail sur ce que représente ces différents niveaux dans un article consacré au « Metering » dans notre DAW.

Pour l’instant, saches qu’il existe aussi des plugins de mesure du loudness qui donnent une indication plus précise du niveau subjectif. L’unité de mesure est alors en LU (pour « Loudness Unit ») et les dBFS sont remplacés par des LUFS.

Ces analyseurs de niveau utilisent une « simulation » de la réponse de l’oreille à 70 dB SPL (niveau moyen d’écoute en radio et TV).

Ce n’est que récemment que des normes de niveaux ont été adoptés par ces analyseurs de Loudness (norme EBU R128 en Europe). Voir les articles suivants de cette série…

Conclusion

Cet article a montré en quoi le loudness peut influencer l’écoute et le mixage musical. En conséquence, j’ai donné des pistes de bonne pratique en mixage.

Mais il est possible de maîtriser le loudness en manipulant la dynamique du signal. Avant de parler des traitements de la dynamique (compression, limiteur, gate…), il est donc capital de comprendre ce que représente la dynamique d’un son et comment on la mesure.

Derniers articles publiés

Bienvenue sur Arsonor!

Tu cherches à maîtriser les outils modernes de la production musicale, traiter ton son comme il le mérite, en finir avec les blocages et finaliser tes morceaux une bonne fois pour toute?

Tu es au bon endroit! Je m’appelle Martin, et je partage avec toi toutes mes connaissances et expérience en ingénierie du son.

De nos jours, il est possible de faire (presque) tout depuis chez soi! Avec les bonnes connaissances, de l’abnégation et de la passion, je suis convaincu que la création musicale est accessible à tous. Je suis prêt à partager ici avec le plus de pédagogie possible, tous les conseils et astuces qui te seront d’une aide précieuse pour arriver à tes fins.

Partager l'article: