Table des matières
Introduction
Toutes les entrées et toutes les sorties d'un système audio sont > analogiques. Aujourd'hui le son est converti en signal électrique analogique. C'est sur ce signal que nous allons travailler afin de le convertir en signal numérique.Le monde numérique
Depuis l'apparition des principes de l'informatique, il est vite apparu qu'il était intéressant d'utiliser ce nouvel outil dans le traitement du son. On peut dater l'apparition de ce principe le jour où le premier système informatique à poussé son premier BEEP.Il existe plusieurs façons de traiter de l'audio numérique. Historiquement, les premiers studios digitaux aux USA utilisaient la Delta Modulation. C'est un système sur 1 bit avec une fréquence d'échantillonnage très élevée. Quand le bit est à 1, l'amplitude du signal audio d'entrée a augmenté par rapport à celle de l'échantillon précédent, quand le bit est à 0, l'amplitude a diminué. Ce système à l'avantage d'utiliser des convertisseurs extrêmement simples. Il n'était pas possible d'en fabriquer de meilleurs à cette époque. Le désavantage de ce système est que la fréquence d'échantillonnage est énorme, ce qui nécessite une bande passante énorme et donc des moyens informatiques coûteux pour faire du traitement de signal. Il fut donc vite abandonné dans les studios.
La Delta modulation subsiste encore dans les lecteurs CD car elle permet de réaliser des convertisseurs D/A très bon marchés pour la qualité sonore qu'ils offrent. Le signal digital est converti en delta modulation avant d'être envoyé sur les convertisseurs de sortie. Le sur-échantillonnage permet d'améliorer son rapport signal/bruit.
Le système utilisé aujourd'hui de façon universelle pour l'audio numérique est le PCM linéaire (Linear Post Code Modulation - modulation d'impulsions codées). Le nombre de bits fut augmenté à 8, puis 16 et 24, ce qui permit dés le début d'utiliser des fréquences d'échantillonnage beaucoup plus faibles et de diminuer considérablement la bande passante, et donc le prix des moyens informatiques nécessaires pour réaliser du traitement de signal. La description qui suit est donc celle du système PCM linéaire, la seule qui nous intéresse pour la MAO.
Le signal discret
L'ordinateur pose un problème! Cet outil ne comprend que 2 choses : 1 (le courant passe) et 0 (le courant le passe pas). Eh oui! Un microprocesseur (comme le reste d'un ordinateur) n'est rien d'autre qu'un regroupement de millions de petits interrupteurs qui s'ouvrent et se ferment ! Même les programmes ne sont que des suites de 1 et de 0 !Un signal analogique est un signal continu car il peut prendre toutes les valeurs de la source à tout moment. En revanche un signal numérique est un signal discret car il ne peut prendre que certaines valeurs autorisées et uniquement à certains instants (marqués par l'horloge interne du pc).
Le problème est le suivant : comment traduire un signal analogique continu en un signal numérique discret ?
La solution consiste à enregistrer les valeurs prises par le signal analogique avec suffisamment de précision et d'un manière régulière et suffisamment rapide. C'est le même principe qu'au cinéma. Pour enregistrer un film : inutile d'enregistrer en continu l'image, 25 images par seconde suffisent pour reproduire le mouvement sur l'écran !
Ces valeurs enregistrées sont appelées échantillons et ils portent assez bien leur nom !
Comment enregistrer avec une suite de 0 et de 1 des valeurs très grandes avec beaucoup de précision ? C'est ce dont nous allons parler ci-dessous, dans la résolution.
A quelle vitesse faut-il enregistrer les échantillons pour qu'on puisse correctement restituer le son ? Nous le verrons dans fréquence d'échantillonnage.
Et surtout : peut-on, en numérique, rester fidèle au signal analogique ?
La résolution
Comment enregistrer les échantillons avec beaucoup de précision alors qu'on ne dispose que des valeurs 0 et de 1 ?Si on utilise 1 bit, alors on ne peut enregistrer que 2 valeurs : 0 ou 1. Difficile d'être précis dans ces conditions...
Si on utilise 2 bits, on peut alors enregistrer 4 valeurs : 00, 01, 10, 11. C'est déjà plus précis !
Imaginons que notre signal analogique varie entre 0 et 2. Avec 1 bit, on va créer le code suivant :
si le signal est compris entre : | 0 et 1 | 1 et 2
| ||
on code : | 0 | 1 |
Avec 2 bits on crée le code suivant :
si le signal est compris entre : | 0 et 0,5 | 0,5 et 1 | 1et 1,5 | 1,5 et 2 |
on code : | 00 | 01 | 10 | 11 |
Vous avez compris le principe, l'idée va être de coder les échantillons sur des mots composés de plusieurs bits. Plus le nombre de bits est élevé, plus l'échantillon sera précis.
Avec plus de bits, il y aura donc moins d'approximations de conversion et une meilleure plage de dynamique. On appelle cela la résolution et elle s'exprime en nombre de bits.
Voici quelques valeurs usuelles :
nombre de bits : | 8 | 16 | 32
| |
nombre de valeurs codées : | 256 | 65536 | plus de 4 milliards |
Évidemment le défaut principal, c'est que tous ces échantillons mis bout à bout, ça commence à prendre de la place. Beaucoup de place ! Il faut donc choisir un compromis place/précision et il dépend surtout des capacités de la machine.
Dans un système numérique, le rapport signal/bruit dépend de la résolution. De plus, il n'y a pas de headroom (capacité d'un système sonore analogique à produire des pointes de signal d'une valeur supérieure à la valeur du signal constant maximum), ce manque de headroom provient du fait qu'une fois que tous les bits sont à 1, tout signal supérieur à cette valeur sera tronqué. En numérique, la dynamique totale est donc entièrement comprise dans le rapport signal/bruit.
Pour une résolution de 16 bits, le rapport signal/bruit maximum est de 98 dB. Il augmente de 6 dB pour chaque bit de résolution supplémentaire, soit 134 dB pour une résolution de 24 bits. Le rapport signal/bruit réel dépendra bien sur aussi de la qualité des convertisseurs. Pour mémoire, les meilleurs enregistreurs analogiques à bande offraient un rapport signal/bruit enregistrement + lecture d'environ 124 dB, ce qui correspondait au bruit de la bande sur les têtes magnétiques de l'enregistreur.
La fréquence d'échantillonnage
Il nous reste à aborder la problématique de la fréquence d'échantillonnage. A quelle vitesse doit-on enregistrer des échantillons pour qu'à la reconstruction le signal de sortie soit fidèle au signal d'entrée ?Je pense que tout le monde sera d'accord si je dis qu'avec une fréquence d'échantillonnage trop faible, on sera incapable de suivre les variations rapides du signal, c'est à dire les hautes fréquences. Forcément, on sera aussi incapable de les reconstruire. Imaginez si on devait enregistrer de la musique avec 1 échantillon par seconde…
Il existe une règle qui nous permet de connaître la fréquence d'échantillonnage à utiliser pour pouvoir reconstruire le signal de sortie de manière fidèle. Il s'agit du théorème d'échantillonnage de Nyquist-Shannon. En substance, ce théorème nous dit :
Pour reconstruire un signal de sortie de manière fidèle au signal d'entrée, il faut choisir une fréquence d'échantillonnage au moins 2 fois supérieure à la fréquence maximale contenue dans le signal d'entrée.
Autrement dit pour choisir une fréquence d'échantillonnage, on calcule, ou on mesure, la fréquence maximale contenue dans un signal et il suffit de prendre le double de cette valeur. Si on ne respecte pas cette règle, on verra apparaître des fréquences parasites qui ne correspondent à aucune fréquence enregistrée en entrée. Ce phénomène s'appelle le repliement spectral ou aliasing en anglais. Bien sûr il faut à tout prix éviter d'avoir du repliement spectral. Pour cela, une fois la fréquence d'échantillonnage choisie, on va annuler toutes les fréquences du signal d'entrée qui ne respectent pas la règle. |
Pour aller plus loin La justification du théorème d'échantillonnage se trouve dans l'analyse de Fourier. Cette théorie mathématiques est à la base de tous les traitements numériques du signal. Attention, c'est assez balèze ! |
Bilan sur l'échantillonnage
Pour conclure sur l'échantillonnage, on peut dire qu'il s'agit d'une opération qui dégrade le signal plus ou moins fortement selon les paramètres.- D'abord, les limitations donnée par la résolution, qui ne permettra jamais d'avoir une valeur exacte de l'échantillon, et par la fréquence d'échantillonnage, qui nous force à annuler des fréquences dans notre signal d'entrée, ne peuvent que dégrader le son.
- Ensuite, vous aurez pu noter sur les figures précédentes que c'est l'amplitude du signal qui est numérisée et que cette numérisation est linéaire. C'est à dire qu'il y a autant d'écart d'amplitude entre un échantillon codé 1 et un échantillon codé 2 qu'entre un échantillon codé 65534 et un échantillon codé 65535.
Or l'oreille humaine est un capteur... logarithmique ! C'est à dire que nous sommes sensibles au logarithme de l'amplitude. Ainsi, avec de "bonnes" oreilles exercées, nous pouvons entendre une différence entre un signal codé 1 et un signal codé 2, mais nous n'entendrons pas de différence entre un signal codé 65534 et un signal codé 65535 !
La précision du rendu est donc considérablement et bien inutilement plus forte pour des signaux à gain élevé que pour des signaux à gain faible. (A peu près 50.000 fois dans l'exemple extrême ci-dessus...) C'est ce défaut qui fait que les puristes dénient le qualificatif "Hi-Fi" aux enregistrements encodés sur 16 bits. C'est aussi la raison pour laquelle les CD audio ont une dynamique quasi-constante dans beaucoup de cas.
Toutefois il est possible de choisir des paramètres qui, bien qu'ils ne puissent pas réaliser de reconstruction parfaite, atteignent une qualité tout à fait satisfaisante. C'est le cas du CD audio par exemple. Les DVD utilisent un son avec une résolution de 24 bits en 48 kHz ce qui les rends plus vivants que les CD.
Les convertisseurs
A l'interface entre le monde analogique et le monde numérique vivent les convertisseurs. Leur unique objectif est donc d'échantillonner un signal ou de le reconstruire. Il s'agit d'un composant électronique qui se décline sous deux formes.Les CAN : Convertisseurs Analogique-Numérique
Un CAN est un convertisseur analogique/numérique (ADC pour "Analog to Digital Converter" ). Son rôle est de convertir un signal analogique en signal numérique. Certains convertisseurs permettent les paramétrages de la fréquence d'échantillonnage et la résolution comme sur certaines cartes son.Les CAN sont utilisés dans tous les appareils électroniques numériques qui prennent en entrée un signal analogique. En MAO, c'est assez important si l'on veut enregistrer.
Les CNA : Convertisseurs Numérique-Analogique
Un CNA est un convertisseur numérique/analogique (DAC pour "Digital to Analog Converter" ). Son rôle est l'exact opposé du CAN~hs: convertir un signal numérique en signal analogique. Il utilise comme paramètres pour reconstruire le signal analogique ceux de la source numérique. Par exemple un fichier MP3 contient les informations de résolution et de fréquence d'échantillonnage.Ci-dessous se trouve une représentation de ce qui se produit entre votre micro et votre enceinte ! En effet le codage et le décodage du signal électrique en binaire n'est pas instantané ! Ce temps participe à la latence.
La latence
Connue aussi dans le monde informatique sous le nom de "lag", la latence désigne le temps que mettra une information entre le moment où elle est envoyée et le moment où elle est reçue.En informatique musicale, celle-ci correspond à 3 choses :
- Le temps pour traduire un signal électrique en numérique (CAN)
- Le temps que mettra votre ordinateur à calculer les effets et autres modifications... (c'est le plus important!)
- Le temps pour traduire un signal numérique en analogique (CNA)
En MAO ce concept est fondamental ! Si elle est réglée trop haute tous les périphériques midi (claviers, surfaces de contrôle) et les effets temps-réels (pour votre guitare par exemple) deviennent simplement inutiles! Vous l'avez peut-être déjà expérimenté : vous appuyez sur une touche de votre clavier, et le son est joué légèrement trop tard....ça devient injouable ! Néanmoins, si elle est trop basse, votre ordinateur n'aura pas le temps de faire ses calculs et vous aurez un son qui saute....voire carrément votre système entier qui pédale dans la semoule.
Le chiffre magique pour la latence est 20 millisecondes. C'est grosso-modo la limite à partir de laquelle on commence à entendre un décalage. Pour avoir un ordre d'idée, ça équivaut à peu près au temps qu'il faut au son pour parcourir 7m.
En dessous de ce chiffre, vous n'entendrez absolument pas la différence ! Donc les latences de 2-4ms sont de la pure frime, cela ne correspond même pas au temps que met le son pour aller des enceintes à vos oreilles !
Limites
On trouvera ces composants dans TOUS les appareils de technologies numériques qui produisent ou captent un son. De votre téléphone portable à votre ordinateur, en passant par votre lecteur MP3, jusqu'aux convertisseurs haute gamme utilisés dans les plus grands studios.Il faut bien savoir que la fréquence d'échantillonnage et la résolution ne font pas tout dans la qualité d'un convertisseur! Si vous avez bien suivi, le signal numérique est un signal discontinu, haché... La différence entre un convertisseur à 100€ et un autre à 10 000€ sera sa capacité à reconstruire un signal continu le plus proche possible de la réalité, grâce à des composants dont les prix peuvent atteindre des sommes folles...
En effet les convertisseurs sont très sensibles à la qualité des composants électroniques qui sont nécessaires à leur fonctionnement ainsi qu'à la régularité et la précision de la fréquence d'horloge qui lui est imposée. On pourra ainsi retrouver les mêmes convertisseurs dans des matériels de différentes gammes et qui sonneront plus ou moins bien en fonction du soin apporté à ces paramètres.
La suite...
On a vu comment le son était enregistré en format numérique et les paramètres qui régissent sa qualité ou sa fidelité. Mais quels > paramètres va-t-on pouvoir utiliser ?★ Dossier - Le Son
< page précédente page suivante >
- Autre nom de cette page :
dossierSon_le_monde_numerique