👉 Dans le monde de l’audio, la compression des données est l’une des mesures les plus importantes utilisées par les auditeurs, et les créateurs pour indiquer la qualité de leurs fichiers.
Le terme de compression peut faire référence à la compression de plage dynamique, où les caractéristiques d’amplitude d’un signal audio sont modifiées par le traitement du signal, ce qui peut se produire dans le domaine analogique ou numérique.
La réduction de la taille des fichiers sur votre ordinateur, que ce soit de l’audio, de la vidéo ou vos documents, est appelée compression (fichiers .zip par exemple).
Mais comment fonctionne cette fameuse compression des données audio numériques ? 🤔
➡️ La compression des données audio fonctionne via des algorithmes, qui suppriment des bits d’un fichier audio numérique afin de pouvoir réduire sa taille.
La compression avec perte supprime les détails non essentiels de manière irréversible (notamment le contenu fréquentiel).
La compression sans perte supprime les redondances statistiques, pour réduire la taille du fichier de manière, cette fois-ci, réversible sans affecter l’audio.
Pourquoi avons-nous besoin de compresser des fichiers audio numériques ?
👉 La compression des données audio numériques est un outil puissant pour réduire considérablement la taille des fichiers. Cela facilite grandement le partage et le stockage de musique et de fichiers sur Internet.
Sans compression audio numérique, le streaming n’existerait pas.
➡️ L’audio, qu’il soit analogique ou numérique, non compressé, compressé avec perte ou compressé sans perte, n’est qu’une représentation du son.
Un fichier numérique n’est qu’une chaîne de chiffres binaires (bits).
La compression audio a pour objectif de réduire le nombre de bits inutiles, impliqués dans la reproduction d’un son.
👉 Les fichiers audio non compressés peuvent parfois être beaucoup trop volumineux.
Par exemple, un fichier WAV de qualité CD (44,1 kHz, 16 bits) a une taille de fichier d’environ 10 Mo par minute. Les formats audio compressés avec perte, comme le MP3, permettent souvent de diviser cette taille par 5.
Lors du partage et de la diffusion de fichiers audio sur le Web, les fichiers non compressés occupent beaucoup de bande passante et d’espace disque, pour les utilisateurs finaux.
➡️ La bande passante coûte d’ailleurs très cher, car l’entreprise qui la fournit doit apporter l’Internet haut débit du FAI à votre appareil, installer des câbles dans le sol, embaucher une main-d’œuvre qualifiée pour entretenir le système, payer les factures d’électricité et gérer la mise à niveau du réseau, quand l’ISP atteint sa capacité.
📅 Les limitations technologiques de l’époque expliquent pourquoi le format MP3 compressé est devenu si populaire, pour le partage de musique en ligne au début des années 2000.
Compression = moins de données Internet utilisées
👉 Les codecs de compression audio numérique (MP3 , AAC ou encore FLAC) sont importants, pour les services de streaming en ligne modernes.
Contrairement à la compression de plage dynamique utilisée dans les studios d’enregistrement, les codecs de compression audio n’affectent pas le volume perçu.
📦 La compression du codage audio utilise des algorithmes, dans le but de réduire un fichier musical non compressé, en quelque chose de beaucoup moins volumineux.
✅ C’est une excellente nouvelle pour les forfaits de données, si vous utilisez beaucoup les services de streaming.
Comment fonctionne la compression audio ?
👉 Le fait de savoir comment fonctionne la compression des données audio numériques est important.
Qu’est-ce que ça signifie quand un fichier audio est sans perte ?
Comment cela se compare-t-il à une compression avec perte, ou à aucune compression du tout ?
La compression des données audio fonctionne en supprimant les bits, dont un fichier n’a pas besoin.
👉 Il existe 2 principaux types de compression audio. Sans perte et avec perte.
La compression audio sans perte
➡️ L’objectif de la compression audio sans perte est de réduire la taille du fichier, tout en laissant l’audio d’origine intact.
Le codec FLAC (Free Lossless Audio Codec) n’utilise aucune compression permanente, se concentrant plutôt sur des méthodes de compression de données entièrement réversibles.
Il utilise des techniques de compression sans perte, empruntées à des algorithmes de compression de fichiers comme ZIP, pour supprimer les données, tout en préservant l’intégrité du contenu.
👉 Il y a 2 codecs audio sans perte populaires, FLAC & Apple Lossless (ALAC). Ils utilisent tous les deux des schémas basés sur la compression ZIP.
Les autres formats audio sans perte incluent :
- WMA sans perte (Windows Media Audio sans perte),
- WavPack,
- Monkey’s Audio,
- SHN (Shorten).
✅ Se concentrer sur la compression des données permet de préserver de nombreux détails, que le MP3 avec perte effacerait.
La compression audio sans perte, un outil puissant
La compression sans perte n’est pas seulement bonne pour l’écoute.
👉 C’est également un excellent outil de stockage.
Les normes sans perte comme FLAC permettent de stocker l’audio, sans supprimer des données qui peuvent être précieuses. Ils facilitent également la remasterisation et la redistribution de l’audio, pour garantir la meilleure qualité possible.
La compression audio avec perte
➡️ La compression avec perte est une méthode de compression, qui supprime de manière irréversible certaines informations du fichier d’origine.
Le format avec perte le plus populaire est le MP3.
Les autres formats audio avec perte incluent :
- AAC (codec audio avancé),
- Vorbis,
- WMA avec perte (Windows Media Audio avec perte),
- Musepack,
- Opus.
Comment les méthodes de compression avec perte décident, quelles données doivent-être supprimées et conservées ? 🤔
👂 L’oreille humaine ne peut pas entendre l’intégralité du spectre sonore, et les processus de compression avec perte le savent. Ils suppriment donc tous les sons en dehors de notre plage d’audition.
Cette plage va de 20 Hz à 20 kHz.
Même si nous pouvons entendre des fréquences comprises entre 20 Hz et 20 000 Hz, nous sommes plus sensibles à une plage plus petite, généralement comprise entre 100 Hz et environ 6 kHz.
👉 Par conséquent, tout contenu silencieux dans le bas et le haut de gamme peut également être supprimé, sans impact notable sur la qualité sonore globale.
Voici les relations entre le débit binaire et les points de coupure de fréquence haut de gamme, pour les fichiers MP3. En supposant un son à 2 canaux/stéréo avec un taux d’échantillonnage de 44,1 kHz, et une profondeur de bits de 16 bits :
Débit binaire | Coupure de fréquence haut de gamme | Taille du fichier |
---|---|---|
320 kbit/s | ~20,5 kHz | 2,4 Mo/min |
256 kbit/s | ~20kHz | 1,92 Mo/min |
192 kbit/s | ~18kHz | 1,44 Mo/min |
160 kbit/s | ~17kHz | 1,2 Mo/min |
128 kbit/s | ~16kHz | 960 Ko/min |
96 kbit/s | ~15kHz | 720 Ko/min |
64 kbit/s | ~11kHz | 480 Ko/min |
32 kbit/s | ~5 kHz | 240 Ko/min |
Pour des raisons techniques liées à la bande de facteur d’échelle 21, du format de codage MP3, les fichiers MP3 ont tous un filtre passe-bas réglé à 16 kHz.
👉 Donc, même si le fichier peut théoriquement stocker des informations audio numériques à ces hautes fréquences, elles sont généralement quand même supprimées.
Les méthodes de compression avec perte utilisent un hack psychoacoustique soigné, appelé masquage auditif.
Le masquage auditif
➡️ Utilisé dans les codecs comme le MP3, le masquage auditif (ou masquage sonore) utilise le phénomène selon lequel les signaux sonores plus faibles sont imperceptibles, en présence de signaux sonores forts.
🎻 Dans la musique orchestrale, les instruments forts peuvent masquer des sons plus doux, et plus calmes dans le mixage.
Il est donc prudent de supprimer ces signaux sonores, par rapport au seuil de masquage.
C’est exactement ce que fait le format MP3, avec un algorithme qui trouve et supprime les informations masquées des données numériques, afin de libérer de l’espace.
Cependant, ce seuil est non linéaire et varie entre les individus, et en fonction de l’amplitude du son.
👉 Même avec un taux de compression de 6 pour 1, les auditeurs experts ne peuvent pas faire la distinction entre une piste MP3 compressée et leurs clips audio d’origine.
Des algorithmes de compression avec perte efficace & imperceptible
➡️ L’audio est le domaine où la compression avec perte est la plus efficace.
🎥 ❌ La plupart des méthodes de compression avec perte d’images et de vidéos, dégradent la qualité visuelle.
La compression avec perte est très inadaptée aux autres fichiers, où toutes les données doivent être conservées (comme une feuille de calcul Excel).
✅ En combinant des études intensives de la psychoacoustique et de l’informatique, les ingénieurs ont produit des algorithmes de compression avec perte efficace, et imperceptible.
Quel est l’effet du débit binaire sur la qualité audio ?
👉 Le débit binaire mesure la quantité de bits utilisés pour encoder 1 seule seconde d’audio.
Avec, par exemple, un codage de basse qualité à 8 kilobits par seconde (kbps), l’algorithme se limite à n’utiliser que 8 kilobits de données pour décrire chaque seconde d’audio.
📷 C’est comme essayer de décrire une photographie en couleur, avec seulement quelques centaines de pixels. Les grands traits apparaitront certainement, mais dans l’ensemble, l’image sera grandement dégradée.
Avec un débit binaire de meilleure qualité comme 192 kbps, il y a beaucoup de place pour couvrir des détails nuancés (les différentes lumières, obscurités et couleurs d’une image).
➡️ Un débit binaire élevé ne détermine pas à lui seul la qualité d’un enregistrement. Mais un débit binaire faible risque de considérablement limiter la qualité de la sortie.
Il n’est pas toujours possible de comparer la qualité audio, uniquement en fonction du débit binaire.
D’autres facteurs déterminent si certains débits binaires sont meilleurs que d’autres. Le premier est le type d’algorithme, et ce pour quoi il est conçu.
➡️ Les codecs psychoacoustiques hors ligne peuvent produire moins de données, et mieux sonner que les codecs en temps réel à faible latence.
Vient ensuite la qualité de l’algorithme et de l’encodeur utilisé.
Psychoacoustique
🧠 La psychoacoustique est la science qui explique la façon dont le cerveau comprend les sons.
En manipulant certains éléments liés à la perception du son, les algorithmes de compression suppriment intelligemment des détails, que la plupart des oreilles humaines ne peuvent pas entendre.
👉 L’objectif est de simplifier les informations, qui n’affecteront pas la qualité audio perçue d’une piste, en ne supprimant que les informations sans importance.
Par exemple, la gamme de l’audition humaine se situe entre 20 Hz et 20 kHz. Les sons en dehors de cette plage peuvent donc être supprimés. De plus, la gamme la plus détaillée de l’audition humaine se situe entre 100 Hz et 4 kHz, et la suppression des sons faibles, en dehors de ces gammes de fréquences, endommage le moins possible la qualité d’un enregistrement.
Si un son très fort et un son très faible sont joués en même temps, le son faible sera beaucoup plus difficile à percevoir. Les encodeurs profitent de ce masquage sonore pour supprimer le son silencieux, économisant ainsi des bits.
Comment la qualité se compare-t-elle sur les plateformes de streaming ?
Voici la qualité offerte par les plateformes de streaming les plus populaires :
Services de streaming | Qualité de diffusion maximale | Qualité de bureau maximale (kb/s) | Formats pris en charge |
---|---|---|---|
Qobuz
|
24 bits / 192 kHz
|
1 411
|
AIFF, ALAC, FLAC, WAV, WMA sans perte
|
24 bits / 192 kHz
|
3 730
|
FLAC
|
|
Deezer HIFI
|
16 bits / 44,1 kHz
|
1 411
|
FLAC
|
Google Play Music
|
320kbps
|
320
|
AAC, ALAC, FLAC, MP3, Ogg Vorbis, WMA
|
Deezer Premium
|
320kbps
|
320
|
MP3
|
Spotify Premium
|
320kbps
|
320
|
AAC, Ogg Vorbis
|
Apple Music
|
24 bits / 192 kHz
|
256
|
CAA
|
YouTube Music Premium
|
256kbps
|
256
|
CAA
|
SoundCloud Go+
|
256kbps
|
256
|
CAA
|
Spotify gratuit
|
160kbps
|
128
|
CAA
|
🎶 Il existe une similitude entre certains des services de streaming.
👉 AAC est le codec de compression avec perte le plus populaire, tandis que les bibliothèques Hi-Res proposent FLAC en standard.
Si vous avez une bonne connexion Internet, il est peu probable que vous remarquiez une grande différence entre la grande majorité de ces services.
À environ 192 kbps, AAC sonne très bien. Tout ce qui se trouve au-dessus, ce n’est que du bonus.
L’exception est Spotify qui, sur la plupart des appareils, utilise par défaut un paramètre automatique variable, et propose 4 niveaux de lecture fixes : 24 kbps (faible), 96 kbps (normal), 160 kbps (élevé) et 320 kbps (très élevé).
Dois-je utiliser de l’audio compressé pour mes projets ?
👉 Le fait d’utiliser la compression avec perte ou la compression sans perte (ou même non compressée), dépend de ce que vous comptez faire de vos fichiers audio.
La compression avec perte a ses inconvénients.
Comme certaines données sont détruites, les formats audio compressés avec perte, comme le MP3, ne conviennent pas à l’enregistrement de stems et de prises pour un master mix.
➡️ Si vous enregistrez des voix ou des instruments dans un format avec perte, et que cela est encodé en continu pendant que des modifications destructives sont effectuées, vous aller lentement réduire la qualité sonore de votre fichier.
🎶 Pendant la production, vous devez utiliser un son sans perte avec des codecs comme FLAC ou ALAC, ou un format audio non compressé.
👉 Le format le plus répandu pour la production est WAV, qui n’utilise aucune compression pendant l’encodage.
Si vous êtes sur le point de partager votre projet à quelqu’un, un MP3 de haute qualité est plus que correct.
⚠️ Encodez également en 320kbps, car des débits binaires faibles peuvent nuire à la qualité du son.