Chargement...
 
Skip to main content

Historique: Formats audio

Aperçu de cette version: 34



Introduction


Il existe un grand nombre de formats audio, plus ou moins compressés et adaptés à divers usages, certains visant notamment à réduire la taille des fichiers. Certains sont dits "destructifs" (lossy), c'est à dire qu'il n'est pas possible de recréer l'original à partir du fichier compressé, et d'autres sont au contraire non destructifs (lossless).



Les formats non compressifs


Ces formats sont notamment utilisés par les stations de travail audio-numérique professionnelles comme Ardour.

Le format PCM et numérisation


Le PCM (Pulse Code Modulation ou Modulation d'impulsion codée), est une technique d'échantillonnage sans compression, utilisée notamment en MAO (CD-Audio, etc.)

Le son est une vibration matérielle. Pour pouvoir être manipulée à l'aide d'un ordinateur, cette vibration doit d'abord être convertie en signal électrique (par un microphone par exemple). Il faut ensuite convertir ce signal analogique en signal numérique, c'est à dire en une suite de "0" et de "1" : c'est la numérisation. Cette numérisation se fait en 2 temps :

1) L'échantillonnage.

Le signal analogique (variable continue) est découpé en intervalles réguliers (variable discrète) dont la fréquence s'exprime en Hertz (Hz). Par exemple, la fréquence d'échantillonnage est de 44100 Hz pour un CD audio. Cela signifie qu'une seconde de musique se compose en fait de 44100 échantillons successifs. Les cartes sons utilisées en MAO permettent l'acquisition de sources sonores à des fréquences d'échantillonnage plus importantes (48000 Hz, 96000 Hz). Évidemment, une fréquence d'échantillonnage supérieure permet une acquisition de meilleure qualité (avec une taille de fichier plus importante).

On considère en général que les parties du signal dont les fréquences sont supérieures à la moitié de la fréquence d'échantillonnage ne seront pas correctement retransmises et introduiront au contraire des parasites. Ainsi, pour une fréquence d'échantillonnage de 44100 Hz, les signaux de fréquence supérieure à 22050Hz devront être supprimés. Utilisez des filtres passe-bas pour éliminer ces fréquences.

Plus d'informations sur le site de wikipedia.

2) La quantification

Chaque valeur instantanée de chaque échantillon est "mesurée" et convertie en un nombre. Les différentes valeurs possibles de chaque échantillon dépendent de la profondeur d'enregistrement (ou résolution) exprimée en bits. Une résolution plus importante permettra de quantifier le signal au plus près de sa valeur réelle et augmentera la dynamique du signal (rapport entre le signal le plus faible et le signal le plus fort).

Ainsi les CD-Audio sont codés sur 16 bits, ce qui permet 65 536 valeurs différentes pour chaque échantillon et un rapport signal/bruit d'environ 96 dB.

Les cartes son utilisées en MAO offrent souvent un codage sur 24 bits, valeur augmentant la qualité du signal, la dynamique, et diminuant le bruit de quantification (16 777 216 valeurs possibles et dynamique théorique de 144 dB).

Quelques liens :
La page Enregistrement sonore sur wikipedia
La page PCM sur wikipedia

Le format WAV

Le format WAV (pour WAVEform audio format) est un format développé par Microsoft et IBM. Il s'agit d'un format conteneur et non pas d'un format d'encodage (il peut en effet contenir de l'audio au format PCM, WMA, etc.).
Cependant, étant le plus souvent utilisé pour contenir du format PCM, il est souvent considéré comme étant le format lossless (sans pertes) sous Windows.
Schématiquement, il se compose d'un en-tête suivi des données audio.
Ce format est devenu un standard, tant sous Windows que sous Linux.
  • une variante du wav, le BWF : "Le but de ce format est d'ajouter des méta-données pour faciliter l'échange de données son entre des plateformes informatiques ou des applications différentes. Parmi les méta-données stockés, le timecode permet de synchroniser l'audio avec d'autres éléments." http://fr.wikipedia.org/wiki/Broadcast_Wave_Format . En gros, le BWF, c'est pareil que le WAV avec des méta-données pour assurer l'interopérabilité. Exemple concret, sous Ardour, quand on enregistre un fichier en BWF, le placement temporel est assuré par les méta-données du format BWF (broadcast wave format). C'est la fonction, in french: "remettre à sa position d'origine" des pistes audios.

Le format AIFF

AIFF (Audio Interchange File Format) est un format de fichier audio développé par Apple et donc fréquent sous Macintosh. C'est un peu le pendant du format Wav.

Le format AU

Format audio conçu par Sun Microsystems.



Les formats de compression destructifs


Ces formats offrent le plus grand gain de place, mais au prix d'une inévitable perte de qualité. Il permettent d'accroître la portabilité des fichiers et seront utiles si vous souhaitez mettre vos fichiers en ligne sur internet, ou les écouter sur un lecteur portable etc...
D'une façon générale, ils permettent différents niveaux de compression, et il vous faudra faire un compromis entre un morceau plus petit ou de meilleure qualité. La compression VBR (variable bit rate) améliore la compression en adaptant le taux de compression en fonction de la richesse du signal, cependant il semblerait que des problèmes de lecture se pose avec certains « playeurs » (lecteurs); qu'ils soient logiciels ou matériels.

Le format MP3 (MPEG Audio Layer 3)


Faire un CD c'est bien, mais faire des MP3 c'est mieux 😊
Pour fabriquer des fichiers MP3 il existe un certain nombre de méthodes. En général on part de fichiers au format Wav.

Mais avant quelques petites remarques :

  • Le format Mp3 n'est pas un format libre (à la différence d'autres formats comme Ogg ou Flac).
  • Il est probablement mieux de faire des fichiers au format Ogg qui est un format plus intéressant (meilleure qualité à bit rate égal, support des sons multi-canaux type 5.1, format libre ...) mais comme il est moins connu, on fait encore des MP3. En particulier, certains lecteurs ne reconnaissent pas le format Ogg. La meilleure solution est de sauvegarder dans les trois formats (.mp3, .wav, .ogg) ainsi on augmente les chances de pouvoir écouter ses fichiers partout !
  • MP3 est un format de compression, donc vos fichiers seront compressés. Si vous avez produit des fichiers Wav, par exemple à partir d'Ardour, vous aurez probablement utilisé des compresseurs pour arranger un peu une voix ou une trompette. Si votre production était destinée à des fichiers Wav, vous perdrez un peu en qualité en passant ensuite en MP3, si votre production était directement destinée à faire du MP3, ne forcez pas trop les compressions dans votre mix.
  • L'encodeur Mp3 phare sous Linux s'appelle LAME (pour LAME Ain't an Mp3 Encoder !!). Il est disponible pour toutes les distributions. N'oubliez pas de l'installer.

Encodage en ligne de commande


La commande
lame fichier.wav fichier.mp3
produit simplement un mp3.

lame -V 0 fichier.wav
produit le mp3 en mode VBR (variable bit rate) et en qualité 0 (0 à 10). Attention "0" est la meilleure qualité, 10 la moins bonne. Le mode VBR permet d'avoir le meilleur compromis compression/qualité en fonction des passages musicaux.

lame -s 48000 fichier.wav
indique la fréquence d'échantillonage du fichier résultant.

lame --bitwidth 24 fichier.wav
indique la résolution de votre fichier mp3 (16 par défaut).

lame --cbr 192 fichier.wav
"cbr", pour constant bite rate, utile pour des fichiers dont l'objectif est le streaming.

Il existe encore de nombreuses options, pour une liste complète, lancez:
lame longhelp help
Remarquez les options
lowpass <freq>
et
lowpass-width <freq>
ainsi que leur pendant pour les hautes fréquences
highpass <freq>
et
--highpass-width <freq>
qui vous pemettent d'indiquer quelles fréquences seront "coupées" dans la compression. Cette option est importante pour les styles de musique qui jouent beaucoup sur les basses fréquences, sub et autres.

De plus les options suivantes
tt titredumorceau
ta artiste
--tl nomdelalbum
vous permettent d'indiquer les différentes informations Tag de votre fichier.


Encodage à l'aide d'un script bash

Le script suivant (bash) réalise l'opération précédente sur l'ensemble des fichiers wav d'un répertoire. Sauvegardez-le le sous le nom wav2mp3 (par exemple) dans un répertoire qui est dans votre chemin (PATH).

#!/bin/bash

# Pour executer ce script placez le dans un repertoire qui est dans
# votre PATH ou modifier votre PATH. Assurez vous que ce script est executable
# chmod +x wav2mp3

function usage(){

echo
echo "usage: wav2mp3 repertoire"
echo
echo "Ce script convertit tous les fichiers .wav d'un repertoire"
echo "en fichier .mp3 avec lame " ;

exit ;
}

if [ $# != 1 ]
then usage
fi

directory=$1
if [ ! -d $directory ]
then usage
fi

if [ ! -x `which lame` ]
then
echo "Est-ce-que lame est dans votre chemin (PATH)"
usage
fi

find $directory -name "*.wav" | while read file
do
base=`basename $file .wav`
basedir=`dirname $file`
echo "executing lame $file $basedir/$base.mp3"
lame "$file" "$basedir/$base.mp3"
done


Le format Ogg Vorbis

Le format Ogg Vorbis est un format de compression audio développé par la fondation Xiph.Org dont le but est de proposer à la communauté des formats et codec multimédias ouverts, libres et dégagés de tout brevet. C'est une alternative libre au format Mp3, cependant, moins populaire, certains lecteurs (auto-radio, etc.) ne le reconnaissent pas encore.
Pour compresser un fichier Wav en Ogg :
oggenc -q 8 fichier.wav

Compresse votre fichier en qualité "8" (de 1 à 10). A l'inverse de Lame ici "10" est la meilleure qualité. A mon sens la qualité "8" produit des fichiers très convenables. "7" est déjà un peu limite pour de la bonne musique. La compression Ogg Vorbis semble d'une manière générale atténuer un peu les aigus.


Le format Musepack

Moins connu que les deux précédents, il serait meilleur qu'eux pour des bit rates élevés, mais moins bon à des bit rates faibles.
Le site internet



Les formats de compression non-destructifs


Le choix indiscutable pour vos sauvegardes !

Le format Flac (Free Lossless Audio Codec)

Ce format libre a rejoint la bannière de la fondation Xiph.Org. Il vous permet de réduire d'environ 50% vos fichiers Wav.
Il existe une commande flac permettant d'encoder/décoder dans ce format lossless (sans perte). Finalement c'est très similaire à un outil de compression comme gzip mais les taux de compression sont un peu meilleurs.
D'autres points forts pour ce format : le décodage est rapide (l'encodage plus long) et la lecture est streamable.
Le site internet : http://flac.sourceforge.net
On peut lire directement les fichiers flac avec la commande flac123 ou avec xmms qui dispose d'un greffon (vérifier que celui-ci est installé et activé).

Le format WavPack

Format libre et ouvert (licence de type BSD) permettant 3 types de compression : sans perte, avec pertes et hybride (combinant les deux aspects).
Le site internet : http://www.wavpack.com



Logiciels


Sox - Sound eXchange

Véritable couteau suisse de la conversion audio. Il reconnaît un très grand nombre de formats audio et permet la lecture, l'enregistrement et la conversion des fichiers audio. Il permet également d'appliquer des effets lors de la conversion (chorus, volume, etc.). Il est disponible sous différentes systèmes (Linux bien entendu, mais aussi BeOS, Windows, Atari ST, etc.)
Consultez le site internet de Sox pour avoir la liste complète des formats et effets supportés.
Il fonctionne en ligne de commande, ce qui permet de créer facilement des scripts pour automatiser des tâches répétitives (vous trouverez quelques exemples ici : http://sox.sourceforge.net/Docs/Scripts )
Il existe également des frontends pour les "allergiques" à la ligne de commande : Studio par exemple (site : http://studio.sourceforge.net )


Éditeurs audio

Il est généralement possible d'utiliser des éditeurs audio pour exporter en mp3 ou en ogg (par exemple Audacity ou ReZound). Pour le mp3, vérifier que Lame est bien installé et indiquez son chemin d'accès dans les préférences de l'éditeur.
Inutile par contre de chercher le format mp3 dans Ardour : celui-ci ne reconnaît que les formats non-destructifs 😀

Konqueror

Et oui, si vous utilisez Konqueror, il peut aussi vous aider à convertir rapidement vos fichiers. Différents scripts vous permettront d'ajouter des options de conversion dans le menu contextuel affiché lorsque vous faites un clic droit sur un fichier audio :


X Convert File Audio (Xcfa)

Présentation

Front-end graphique permettant d'utiliser les différents outils habituellement accessibles en ligne de commande, il sait faire beaucoup de choses : extraction, conversion(s), mais aussi jaquettes de CD ! Il reconnaît les formats les plus courants : flac, wav, mp3, ogg et m4a. L'avantage de ce programme est qu'il te dit ce qui manque si ça marche pas.
Doc sur ubuntu fr : http://doc.ubuntu-fr.org/xcfa.

Le site

http://www.xcfa.tuxfamily.org/ (ancien : http://bulin.claude.neuf.fr/xcfa-presentation.html)

Installation

Debian / Ubuntu

Dans une console, taper
sudo gedit /etc/apt/sources.list

Ajoutez les lignes suivantes :
    1. xcfa
deb http://download.tuxfamily.org/xcfaudio/debian perso main

Capture d'écran

Image
Xfca en action lors de la conversion de plusieurs fichiers de type .wav en .ogg


Autres outils de conversion

Outre PAC et Audiokonverter cités juste au dessus, de très nombreux outils / scripts permettent des conversions en tous genres :

Éditeurs de Tag

La plupart des formats audio permettent d'inclure dans les fichiers des informations complémentaires (titre, auteur, etc.), on parle de Tag.
Les lecteurs audio et multimédia sont en général capables de lire et de modifier ces informations, mais il existe aussi quelques logiciels spécialisés qui vous seront utiles pour modifier les Tags d'un grand nombre de fichiers.

Extraction de pistes CD-Audio

De nombreuses solutions existent, souvent basées sur cdparanoia et cdda2wav. Citons par exemple :
  • Grip pour Gnome
  • KAudioCreator pour KDE
  • Mais si vous utilisez Konqueror, il y a plus simple encore : Placer votre CD, fermez le lecteur, et dans la barre d'adresses de Konqueror, saisissez simplement :
Copy to clipboard
audiocd:/
Et voici sous vos yeux ébahis le contenu de votre CD, proposé dans différents formats (flac, mp3, ogg, wav) avec les titres et références des artistes ... il ne vous reste plus qu'à "copier/coller" les fichiers souhaités où bon vous semble... difficile de faire plus simple ! La configuration de l'extraction s'effectue dans Kcontrol (=> "Son et multimédia" => "CD audio").


Historique

Avancé
Information Version
Sun 15 Apr 2018 21:25 r1 change soundconverter url 51
Afficher
Wed 24 mai 2017 13:30 Kausal drapeau site opus -> en 50
Afficher
Wed 24 mai 2017 13:19 olinuxx + ponctuations + drapeaux + majuscules 49
Afficher
Wed 24 mai 2017 12:26 Kausal 48
Afficher
Wed 24 mai 2017 12:24 Kausal ajout format Opus 47
Afficher
Tue 23 mai 2017 18:52 olinuxx rédaction 46
Afficher
Wed 17 mai 2017 08:06 utilisateur_anonyme2 45
Afficher
Fri 06 Nov 2015 14:29 olinuxx Recherche et remplacement en masse 44
Afficher
Thu 18 Jun 2015 11:21 Cywil petite faute de frappe 43
Afficher
Wed 05 Mar 2014 23:00 romain_bar Alias après renommage 42
Afficher
Wed 05 Mar 2014 22:56 romain_bar Renvoi vers le glossaire pour les définitions 41
Afficher
Mon 04 Nov 2013 17:11 anonymous wiki_up conversion 40
Afficher
Thu 28 Feb 2013 08:18 utilisateur_anonyme2 39
Afficher
Sat 23 Feb 2013 13:43 Admin temporaire 38
Afficher
Wed 15 Dec 2010 20:31 olinuxx BOX-ification 37
Afficher
Sat 04 Sep 2010 03:00 olinuxx 36
Afficher
Sat 04 Sep 2010 02:57 olinuxx 35
Afficher
Sat 04 Sep 2010 02:57 olinuxx 34
Afficher
Sat 04 Sep 2010 02:55 olinuxx 33
Afficher
Fri 19 Feb 2010 17:22 yanshee 32
Afficher
Mon 26 Oct 2009 12:09 olinuxx (mode stylo rouge) 31
Afficher
Mon 26 Oct 2009 12:09 olinuxx ajout info BWF 30
Afficher
Mon 27 Aug 2007 00:01 bluedid29 29
Afficher
Sun 26 Aug 2007 23:46 bluedid29 28
Afficher
Sun 26 Aug 2007 23:30 bluedid29 27
Afficher
Sat 18 Aug 2007 15:14 kolt + lame/ligne de comande 26
Afficher
Mon 02 Jul 2007 23:45 Trinine + Multimedia Converter 25
Afficher