Chargement...
 
[Voir/Cacher menus de gauche]
[Voir/Cacher menus de droite]

Principes de base en audio-numérique

Avant propos : cet article explicatif des principes de l'audio-numérique provient d'un fil de discussion sur le forum de LinuxMAO.

Introduction

Depuis l'apparition des principes de l'informatique, il est vite apparu qu'il était intéressant d'utiliser ce nouvel outil dans le traitement du son. On peut dater l'apparition de ce principe le jour où le premier système informatique à poussé son premier BEEP.


Problématique : l'oreille humaine n'est sensible qu'à une vibration de l'atmosphère, de l'air quoi ! C'est un système très efficace mais qui a de fortes limitations ! Il ne fonctionne qu'entre 20Hz ( Hertz ), les sons très graves, et 20000Hz (20kHz), les sons très aigus. Elle ne peut pas percevoir les infra-basses qui sont les fréquences inférieures à 20 Hz ou les fameux ultrasons, au delà de 20 kHz alors que certains animaux le peuvent. L'ordinateur, lui, ne se soucie que des 0 et des 1 ; il n'a donc, en théorie, aucune limitation. Quant à l'enceinte acoustique, elle n'est qu'assez peu réceptive à ces sollicitations, et ne vibre que pour la fée électricité et ses douces ondulations. Il a donc été nécessaire de réussir à faire cohabiter ces 3 énergumènes. On appellera Analogique la vibration de l'air qui fait bouger les tympans, et les enceintes ; et Numérique l'afflux des saints octets et leurs armées de Bits qui inondent nos insatiables processeurs et disques durs.



Principe

Il a donc fallu réussir à transformer la douce vibration de l'air qui chatouille nos tympans en bits disciplinés défilant à la queue-leu-leu. Une mission où une interface chaise/clavier à été nécessaire, j'ai cité l'être humain et son cerveau fertile certes peu performant dans les phases de calculs bruts, mais doué d'une imagination sans limites. Il a donc été décidé qu'il faudrait trancher ! On s'est donc employé à faire trancher des signaux analogique aux ordinateurs.

Le signal analogique sous forme d'onde électrique est découpé en tranches régulières, on appelle ça l'échantillonnage. On appelle la fréquence d'échantillonnage le nombre de tranches qu'on découpera chaque secondes :

Par exemple : 44100 Hz = 44100 tranches par secondes. C'est par ailleurs la fréquence utilisée pour les CD Audio.

Ces tranches sont codées sur des octets composés de bits (0 ou 1). Plus le nombre de bits est élevé, plus le nombres de valeurs possible est élevé, il y aura donc moins d'approximations de conversion et une meilleure plage de dynamique. On appelle cela la résolution.

On considère une résolution de 16 Bits comme standard en audio-numérique car utilisée pour les CD Audio, mais cela est amené à changer dans le futur avec l'apparition de nouveaux supports. On préférera une résolution plus élevée lors des prises de son afin de permettre une conversion plus précise. Il est à noter que les logiciels de traitement de signal travaillent pour la plupart en interne avec une résolution de 32 Bits afin d'éviter les approximations pendant le traitement.



Les différentes fréquences d'échantillonnage.

À l'age de pierre numérique, on ne pouvait ni traiter ni stocker de grandes quantités d'information. On utilisait des fréquences d'échantillonnage et des résolutions faibles, comme par exemple :
  • 11250 Hz, 8 bits,
  • 22500 Hz, 8 bits,
  • 33750 Hz, 8 bits.
(notez comment les fréquences d'échantillonnage sont toutes des multiples !!!)

Au niveau du son, cela crée des distorsions.
Pour vous donner une idée, pensez à une gameboy ou au son qui sort de votre téléphone qui lui correspond à peu près à 8000 Hz 8 bits. Pas terrible pour écouter de la musique !!

...
puis est venue la résolution 16 bits
...

Pour finalement arriver à : 44100 Hz, 16 Bits (tiens, voila notre CD Audio)
Voir aussi
La norme audio définie pour le travail vidéo est de 48 kHz, aussi utilisée pour les DAT (Digital Audio Tape)


Ce qui nous fait rentrer dans l'ère moderne audio-numérique.

De manière générale il faut comprendre qu'enregistrer un signal réel en un signal numérique est un procédé qui abime le son. Un enregistrement audio-numérique ne sera jamais qu'une approximation du signal réel. Nous avons donc intérêt à travailler avec des valeurs supérieures afin d'être au plus proche du signal réel, quitte à ré-échantillonner plus tard à des fréquences et résolutions inférieures adaptées au support de diffusion utilisé (CD, DVD, Blue ray, SACD, DAT, MP3, ...). L'intérêt de telles pratiques est d'avoir un rendu précis et surtout, moins d'approximation de calcul dans les traitements de signaux numériques aussi appelés DSP.

Pour l'audio, on pourra utiliser un multiple de 44,1 kHz (généralement 88,2 kHz), afin de n'avoir qu'à diviser par un nombre entier lors des calculs de ré-échantillonnage finaux et éviter donc d'arrondir les résultats de calcul.

Pour la Vidéo, on pourra utiliser un multiple de 48kHz (généralement 96 kHz, voir 192 kHz), pour les même raisons.



Les convertisseurs


J'en vois un qui lève la main au fond à côté du radiateur ?

Concrètement, pour convertir un signal analogique en information numérique, on utilisera un bête composant électronique appelé convertisseur.

Il en existe 2 types :

  • Les CAN (Convertisseur Analogique/Numérique), ADC (Analogue to Digital Converter) en anglais, qui convertiront un signal analogique en informations numériques.
  • Les CNA (ai-je vraiment besoin d'écrire dans ces parenthèses ?), DAC en anglais, qui convertiront des informations numériques en un signal analogique.

Selon leurs caractéristiques, ils pourront atteindre des fréquences d'échantillonnage plus ou moins élevées.

Ces composants sont très sensibles à la qualité des composants externes qui sont nécessaires à leur fonctionnement ainsi qu'à la qualité de la fréquence d'horloge (parfois également appelé "cadencement") qui lui est imposée. On pourra ainsi retrouver les mêmes convertisseurs dans des matériels de différentes gammes et qui sonneront plus ou moins bien en fonction du soin apporté à ces paramètres.

On trouvera ces composants dans TOUS les appareils de technologie numérique qui produisent ou captent un son. De votre téléphone portable à votre ordinateur, en passant par votre lecteur MP3, jusqu'aux convertisseurs haute-gamme utilisés dans les plus grands studios.


Les formats


Il nous reste à parler d'une chose : les formats. On parle souvent de mp3, de flac, de ogg vorbis, d'aiff, de wav, etc... Il s'agit en fait du principe d'enregistrement du signal (aussi appelé codec ) dans un fichier informatique qui donne aux fichiers leur nom et leur extension (on dit "un mp3"). Ben oui, une fois qu'on a obtenu un signal audio-numérique, il faut bien pouvoir le stocker !

Le PCM, pour Pulse Code Modulation est le format de base qui est simplement une représentation du signal audio tel quel. Il est généralement très volumineux. Pour réduire cette place, on utilise la compression : on va chercher à faire rentrer un maximum d'informations dans un fichier le plus petit possible.

Il existe deux grands principes de compression :
  • la compression sans perte aussi appelée lossless : il s'agit d'une compression qui ne modifie pas le flux de données audio. Lorsque le fichier est décompressé, on retrouve le signal audio original. On conserve ainsi toute la qualité audio mais malheureusement au détriment de la place. Ce sont souvent des fichiers assez gros. Les formats principaux sont le FLAC, le WAVPACK, le WMA lossless, ...
  • la compression à perte ou destructrice aussi appelée lossy : ces codecs vont quant à eux modifier le signal audio afin de n'emporter que le minimum. On supprime donc de l'information qui n'est pas ou peu audible. Résultat, on atteint des taux de compression extrêmement élevé au détriment d'une qualité audio qui devient inférieure. Le codec de ce type le plus connu est le MP3 mais aussi le OGG VORBIS, le ATRAC 3, le WMA, ...

Il reste deux formats très connus mais que je n'ai pas encore cité : le WAV et l'AIFF. En fait, ce ne sont pas des formats à proprement parler car un WAV peut très bien être encodé en MP3, en WMA ou autre. Il s'agit en fait seulement d'un format conteneur utilisé sous Windows principalement et non pas d'un format de compression. Toutefois il est généralement associé au format PCM, tout comme l'AIFF qui est utilisé sous Mac.



Pour aller plus loin



principes de l'audionumerique
page suivante >


[+]

Documentation [Afficher / Cacher]

Connexion
[Afficher / Cacher]



Mégaphone [Afficher / Cacher]

zebassprophet, 10:26, mer. 26 Jul 2017: Nouveau montage video sur mugeek si vous aimez flashback et les jeux video;). si vous pouvez commenter c'est cool
sub26nico, 19:40, mar. 25 Jul 2017: Salut et bienvenue à onde sonnore :-)
sub26nico, 19:39, mar. 25 Jul 2017: Salut et bienvenue à dalud :-)
sub26nico, 23:15, dim. 23 Jul 2017: Salut et bienvenue à FiesarD21 :-)
syberia303, 16:19, sam. 22 Jul 2017: @Samuel, de rien. C'est surtout kvr que j'avais oublié de citer qu'il faut remercier! Erreur réparée ;)
Samuel, 16:36, ven. 21 Jul 2017: @syberia303, merci pour l'annonce, je ne connaissais pas
sub26nico, 11:42, ven. 21 Jul 2017: Salut et bienvenue à sardon :-)
zebassprophet, 00:56, ven. 21 Jul 2017: yo bluedid, je debarque chez les bretons fin de semaine pro et jusque mi aout ;) donc si t'es dans les parages :-D
syberia303, 15:45, jeu. 20 Jul 2017: Audio Blast, un éditeur linux friendly: [Lien] Au format vst natif, un looper et un clone de TB 303
sub26nico, 15:04, jeu. 20 Jul 2017: Salut et bienvenue à Amamnesia :-)
bluedid29, 15:17, mer. 19 Jul 2017: Et bonnes vacances à toutes les Linuxiennes et Linuxiens ! :-D
bluedid29, 15:16, mer. 19 Jul 2017: Il assure olinuxx ;-)