La normalisation sous Xcfa

samedi 23 février 2008
par  Dzef, zarer (Christophe Gallaire)
popularité : 6%

Pour bien utiliser les divers modes de normalisation sous Xcfa, il est peut être bon de préciser quelques points.

Quelques considérations dynamiques :

Les caractéristiques dynamiques d’un fichier audio s’expriment suivant plusieurs critères. En voici quelques uns :

Le niveau maximum ou peak.

C’est le niveau absolu du ou des échantillons les plus modulés (les plus « forts ») du fichier.

En numérique, ce niveau est au maximum de 0 dBFS, le « FS » voulant dire « Full Scale » (pleine échelle). Au delà, point de salut : le signal sera irrémédiablement écrêté.

Ce 0dBFS sert aussi, en général, de niveau de référence : dire que le niveau peak d’un fichier est de -12 dBFS, signifie que le passage le plus fort du morceau a un niveau inférieur de 12 dB au niveau maximum admissible, soit 0 dBFS.

Le niveau moyen.

Communément appelé RMS outre manche, il correspond à la moyenne calculée du niveau mesuré pour chaque échantillon, et s’exprime dans Xcfa en dBFS.
Il donne une indication sur le niveau ressenti à l’écoute : plus ce niveau sera proche du 0 dBFS et plus le morceau paraîtra « fort ».

  • Remarque 1 : deux morceaux qui ont le même niveau moyen, auront de fortes chances de donner une sensation de niveau similaire, même si leur niveau peak est différent.
  • Remarque 2 : le niveau moyen d’un fichier est un bon indicateur des taux de compression dynamique pratiqués lors des phases d’enregistrement/production. Plus il est proche du niveau max, donc plus la dynamique est faible, et plus ces taux sont importants.

Les fichiers fortement compressés ne nécessitent généralement pas de normalisation supplémentaire (ça a sûrement déjà été fait en production !).

La dynamique.

C’est, en gros, le rapport de niveau (en dB) entre les signaux les plus forts et les plus faibles du morceau.

La valeur théorique maximale possible dépend de la valeur de la quantification du fichier : pour un fichier quantifié sur 16 bits, elle est de 20xLog (2^16), soit à peu près 90 dB. En d’autres termes, cela signifie que le niveau minimum du signal ne pourra pas être inférieur à -90 dBFS.

Dans la réalité, on préfère parler de dynamique « utile », c’est à dire en prenant comme niveau minimum celui du bruit de fond, qui n’est pas considéré comme du signal utile. Des valeurs de -60 à -40 dB sont alors courantes.
Par exemple, un morceau sera ressenti comme très « dynamique » si l’écart entre les niveaux les plus forts et le bruit de fond est très élevé et si son niveau moyen se situe vers le milieu de la plage dynamique : c’est le genre de pièce qui peut faire très mal aux haut-parleurs si on y prend pas garde !

Pour limiter cette dynamique, on utilise un compresseur, ou un limiteur (qui est un compresseur particulier) de dynamique. C’est un appareil (ou un logiciel) qui abaisse les forts niveaux.

Les différents modes de normalisation.

Xcfa en propose deux.

La normalisation « peak ».

Elle consiste à augmenter le niveau global du signal de manière à amener son niveau peak à 0 dBFS, sans en changer la dynamique. Elle est donc dite linéaire.

Son seul inconvénient est de faire remonter d’autant le bruit de fond.

Sinon, outre le fait de permettre de remonter le niveau dans une plage plus confortable pour l’écoute, elle permet de faire travailler les convertisseurs numériques-analogiques (les CNA) dans des régions où ils sont plus « linéaires », plus à l’aise, quoi ! Et ce, sans modifier l’intégrité du morceau. C’est la raison pour laquelle on peut lire ici ou là que ce type de normalisation « améliore le son ».

On peut donc sans risque la conseiller dans presque tous les cas : si le niveau peak du signal d’origine est déjà à 0 dBFS, il n’y aura aucun changement.

La normalisation moyenne ou « RMS ».

Là, le niveau de référence n’est plus le niveau peak mais le niveau moyen et l’opération consiste à l’amener à une valeur supérieure (par exemple de -15 à -12 dBFS).

PNG - 3.7 ko

Remarque : la puissance de calcul pour mesurer le niveau moyen des fichiers étant plus importante que dans le cas du niveau maximum, Xcfa laisse à l’utilisateur le choix de réaliser cette mesure (grâce au bouton « Scan dBFS ») de manière à ne pas pénaliser ceux qui ne souhaitent pas utiliser cette fonction. Une fois le scan terminé, Xcfa affiche la valeur du niveau d’origine du fichier en vert. Un clic droit sur cette valeur affiche un menu contextuel où les valeurs inférieures sont en rouge / noir et les valeurs supérieures en jaune / orange.

PNG - 49.9 ko

  • Si après normalisation, le niveau max reste ≤ à 0 dBFS, alors l’effet produit sera similaire à celui d’une normalisation peak.
  • Si il devait être supérieur, l’algorithme compresse la dynamique pour éviter l’écrêtage. L’opération n’est plus linéaire, le signal est modifié.

PNG - 6.1 ko

Ce type de normalisation très efficace pour augmenter « le niveau apparent », est donc à utiliser avec parcimonie. En effet, le compresseur utilisé a des constantes de temps moyennes, c’est à dire trop longues pour traiter les hautes fréquences et trop courtes pour les basses fréquences. Il peut alors arriver que pour des forts taux de compression (c’est à dire des valeurs de normalisation très éloignées du niveau moyen d’origine), des effets de « pompage » du son ou des pertes aux extrémités de la bande passante, se fassent sentir.

Les « styles » de normalisation.

Xcfa en propose là aussi deux.

Le mode « Individuel ».

PNG - 4.3 ko Pour chaque fichier, la référence utilisée pour la normalisation, est son propre niveau peak ou moyen.
C’est le mode à utiliser si on a pas à se préoccuper de la corrélation entre les différents fichiers. Par contre, si on veut normaliser tous les fichiers d’un même projet (un même disque par exemple) l’autre mode est à préférer.

PNG - 9.8 ko PNG - 3.9 ko

Le mode « Groupe ».

Dans ce mode, la référence de niveau est calculée en tenant compte du niveau de chacun des fichiers sélectionnés.
En RMS/groupe, la valeur choisie correspondra à la moyenne des niveaux obtenus après normalisation. C’est un des grands atouts de Xcfa qui a privilégié l’option de la finesse : ce mode compresse dynamiquement les fichiers mais préserve une certaine cohérence en respectant les écarts de niveaux entre les morceaux. C’est l’arme absolue pour donner « un petit coup de compresse » à un album entier par exemple.

En mode peak/groupe, Xcfa est encore plus subtil, car il applique à l’ensemble des fichiers une amplification égale à celle nécessaire pour amener le niveau peak du fichier le plus modulé (le plus fort) au 0dBFS. C’est l’assurance d’une optimisation des différents niveaux, sans compression dynamique et en respectant les écarts de gain entre chaque morceaux. La transparence de ce mode est totale si bien qu’on peut le conseiller systématiquement lors du « rippage » d’un CD par exemple.

Remarque 1 : En mode RMS/groupe, la sélection d’une valeur pour un des fichiers modifie celle des autres fichiers du groupe. Un jeu de couleurs (jaune/vert/noir) donne une bonne indication visuelle du traitement appliqué sur chaque fichier. En jaune, le niveau est augmenté, en vert il reste inchangé et en noir, le niveau sera diminué.
Idéalement, pour ne pas trop perdre de qualité, on ne devrait voir que du jaune et du vert.

Remarque 2 : En mode Peak/groupe, si le niveau maximum d’un ou plusieurs fichiers est déjà à 0dBFS, le niveau de l’ensemble des fichiers sélectionné restera inchangé après normalisation. C’est la raison pour laquelle ce mode peut être utilisé sans risque presque systématiquement.

Quelques exemples d’utilisation.

Préparation d’un mixage.

Le contexte : Je souhaite sonoriser le film des dernières vacances en famille, à l’aide d’une voix off et de plusieurs musiques. Et je voudrais donc préparer les sons pour faciliter le mixage.

La réalisation : Tout d’abord on charge les différents éléments (voix, musiques) dans l’onglet fichier de Xcfa.

Lorsque j’ai enregistré ma propre voix j’ai veillé à « sous-moduler » d’une dixaine de dB pour éviter tout risque d’écrêtage. La première chose à faire est donc d’appliquer une normalisation peak au fichier « voix ».

Ensuite, je compare les niveaux moyen des fichiers musicaux entre eux ainsi que par rapport au fichier voix normalisé. Si ils sont tous à peu près du même ordre (à +/- 2 ou 3 dB près), c’est bon, j’ai gagné je n’ai rien d’autre à faire. Mais ce cas est assez rare...

En général, le niveau de la voix est (beaucoup) plus faible, que celui des musiques ; ce qui est embêtant car dans mon « mix », elle doit « passer devant » les musiques ! Je vais donc appliquer une normalisation RMS à chacun d’entre eux pour les faire rentrer dans mon gabarit. Sur la voix on pourra difficilement rajouter plus de 6 à 10 dB (écouter le résultat et vérifier qu’on entend pas de « pompages » sur les hauts niveaux). On risque donc de devoir baisser le niveau des musiques : c’est quelque chose qu’il ne faut en général pas faire sauf dans ce genre de cas particulier.

Finalement, on se retrouve avec des fichiers beaucoup plus faciles à mélanger pendant la phase de mixage.

Remarque : A la limite, avec cette méthode, au cas où on ne dispose pas de fonction de mixage dans notre logiciel vidéo, on peut, en sous modulant les musiques de 6 à 10 dB par rapport à la voix, obtenir des fichiers « empilables » tels quels...

Une compilation pour les longs trajets en voiture...

Quand on conduit, avoir une main en permanence sur le potentiomètre de volume pour "suivre" la musique en fonction de la dynamique des morceaux, n’est ni agréable ni conseillé. D’autant plus qu’on est déjà obligé d’ajuster le niveau pour couvrir le bruit en fonction du régime moteur...

Xcfa permet très simplement d’uniformiser le niveau moyen de l’ensemble des morceaux de notre compilation à l’aide du mode de normalisation RMS / individuelle :
Après avoir lancé le scan, on clique droit sur chaque fichier, puis on aligne la valeur sur celle du fichier dont le niveau moyen est le plus élevé. C’est tout !
Si le niveau le plus élevé est relativement faible, disons inférieur à -12 dB, rien ne vous empêche de choisir une valeur plus élevée... Surtout si vous devez faire 300 km d’autoroute à bord d’une 2CV !

Minimiser les pertes des encodeurs « lossly ».

On a toujours intérêt à appliquer une normalisation « peak » avant d’encoder ses fichiers linéaires dans un format avec pertes. En effet, les algorithmes de compression on tendance à considérer que les sons dont le niveau est très faible sont masqués par les autres, et donc à ne pas les encoder. Donc plus le niveau maximum sera élevé et moins la dynamique sera importante, et plus l’encodage sera facilité et moins les pertes audibles. Il peut même arriver qu’une légère normalisation RMS améliore le résultat final... À tester sur certains signaux très sensibles !
À noter que l’utilisation d’une normalisation peak sur un fichier dont le niveau maximum est déjà à 0dBFS est transparente : le fichier reste inchangé.

Redonner des couleurs à un album un peu « sous-mixé ».

La c’est le mode RMS/groupe qui est à privilégier : un clic droit sur un fichier pour choisir « RMS/GROUPE » dans « sélection verticale » puis en appelant une valeur de normalisation légèrement supérieure à la moyenne des valeurs RMS affichées à l’issue du scan, on redonne de la pêche à un album quelque peu anémique. Ne pas oublier de contrôler à l’oreille l’effet produit : une trop forte amplification peut générer des effets de pompage et/ou des pertes aux extrémités de la bande passante.


Commentaires  forum ferme

Logo de xens
samedi 7 juin 2008 à 08h39 - par  xens

Merci pour tes explications très claires !

Logo de zarer (Christophe Gallaire)
dimanche 11 mai 2008 à 10h59 - par  zarer (Christophe Gallaire)

Un grand merci dzef ! Je lis et relis ton article comme un usuel de référence !

Logo de dzef
dimanche 2 mars 2008 à 20h38 - par  dzef

Merci Shankarius, surtout, n’hésites pas à modifier/préciser si tu le juges nécessaire...

Logo de Shankarius
dimanche 2 mars 2008 à 18h55 - par  Shankarius

Whouaw !!!
Quelle petite perle, vraiment excellent ! ;)

Logo de dzef
vendredi 29 février 2008 à 11h58 - par  dzef

De rien Claude ! Disposer d’un soft aussi génial que Xcfa, donne envie d’en faire profiter tout le monde... Bravo à toi.

Logo de claude — b52
vendredi 29 février 2008 à 11h48 - par  claude — b52

Merci @Dzef ;)

Expliquée par un Pro. du son, la normalisation devient un sujet parfaitement audible :D

Brèves

9 mars 2007 - Musique !

Pour rester dans le même esprit que mon ami Zarer, laissez nous vous présenter un des sites de (...)