Historique: Formats audio
Aperçu de cette version: 34
Table des matières
Introduction
Il existe un grand nombre de formats audio, plus ou moins compressés et adaptés à divers usages, certains visant notamment à réduire la taille des fichiers. Certains sont dits "destructifs" (lossy), c'est à dire qu'il n'est pas possible de recréer l'original à partir du fichier compressé, et d'autres sont au contraire non destructifs (lossless).
Les formats non compressifs
Ces formats sont notamment utilisés par les stations de travail audio-numérique professionnelles comme Ardour.
Le format PCM et numérisation
Le PCM (Pulse Code Modulation ou Modulation d'impulsion codée), est une technique d'échantillonnage sans compression, utilisée notamment en MAO (CD-Audio, etc.)
Le son est une vibration matérielle. Pour pouvoir être manipulée à l'aide d'un ordinateur, cette vibration doit d'abord être convertie en signal électrique (par un microphone par exemple). Il faut ensuite convertir ce signal analogique en signal numérique, c'est à dire en une suite de "0" et de "1" : c'est la numérisation. Cette numérisation se fait en 2 temps :
1) L'échantillonnage.
Le signal analogique (variable continue) est découpé en intervalles réguliers (variable discrète) dont la fréquence s'exprime en Hertz (Hz). Par exemple, la fréquence d'échantillonnage est de 44100 Hz pour un CD audio. Cela signifie qu'une seconde de musique se compose en fait de 44100 échantillons successifs. Les cartes sons utilisées en MAO permettent l'acquisition de sources sonores à des fréquences d'échantillonnage plus importantes (48000 Hz, 96000 Hz). Évidemment, une fréquence d'échantillonnage supérieure permet une acquisition de meilleure qualité (avec une taille de fichier plus importante).On considère en général que les parties du signal dont les fréquences sont supérieures à la moitié de la fréquence d'échantillonnage ne seront pas correctement retransmises et introduiront au contraire des parasites. Ainsi, pour une fréquence d'échantillonnage de 44100 Hz, les signaux de fréquence supérieure à 22050Hz devront être supprimés. Utilisez des filtres passe-bas pour éliminer ces fréquences.
Plus d'informations sur le site de wikipedia.
2) La quantification
Chaque valeur instantanée de chaque échantillon est "mesurée" et convertie en un nombre. Les différentes valeurs possibles de chaque échantillon dépendent de la profondeur d'enregistrement (ou résolution) exprimée en bits. Une résolution plus importante permettra de quantifier le signal au plus près de sa valeur réelle et augmentera la dynamique du signal (rapport entre le signal le plus faible et le signal le plus fort).Ainsi les CD-Audio sont codés sur 16 bits, ce qui permet 65 536 valeurs différentes pour chaque échantillon et un rapport signal/bruit d'environ 96 dB.
Les cartes son utilisées en MAO offrent souvent un codage sur 24 bits, valeur augmentant la qualité du signal, la dynamique, et diminuant le bruit de quantification (16 777 216 valeurs possibles et dynamique théorique de 144 dB).
Quelques liens :
La page Enregistrement sonore sur wikipedia
La page PCM sur wikipedia
Le format WAV
Le format WAV (pour WAVEform audio format) est un format développé par Microsoft et IBM. Il s'agit d'un format conteneur et non pas d'un format d'encodage (il peut en effet contenir de l'audio au format PCM, WMA, etc.).Cependant, étant le plus souvent utilisé pour contenir du format PCM, il est souvent considéré comme étant le format lossless (sans pertes) sous Windows.
Schématiquement, il se compose d'un en-tête suivi des données audio.
Ce format est devenu un standard, tant sous Windows que sous Linux.
- une variante du wav, le BWF : "Le but de ce format est d'ajouter des méta-données pour faciliter l'échange de données son entre des plateformes informatiques ou des applications différentes. Parmi les méta-données stockés, le timecode permet de synchroniser l'audio avec d'autres éléments." http://fr.wikipedia.org/wiki/Broadcast_Wave_Format . En gros, le BWF, c'est pareil que le WAV avec des méta-données pour assurer l'interopérabilité. Exemple concret, sous Ardour, quand on enregistre un fichier en BWF, le placement temporel est assuré par les méta-données du format BWF (broadcast wave format). C'est la fonction, in french: "remettre à sa position d'origine" des pistes audios.
Le format AIFF
AIFF (Audio Interchange File Format) est un format de fichier audio développé par Apple et donc fréquent sous Macintosh. C'est un peu le pendant du format Wav.Le format AU
Format audio conçu par Sun Microsystems.Les formats de compression destructifs
Ces formats offrent le plus grand gain de place, mais au prix d'une inévitable perte de qualité. Il permettent d'accroître la portabilité des fichiers et seront utiles si vous souhaitez mettre vos fichiers en ligne sur internet, ou les écouter sur un lecteur portable etc...
D'une façon générale, ils permettent différents niveaux de compression, et il vous faudra faire un compromis entre un morceau plus petit ou de meilleure qualité. La compression VBR (variable bit rate) améliore la compression en adaptant le taux de compression en fonction de la richesse du signal, cependant il semblerait que des problèmes de lecture se pose avec certains « playeurs » (lecteurs); qu'ils soient logiciels ou matériels.
Le format MP3 (MPEG Audio Layer 3)
Faire un CD c'est bien, mais faire des MP3 c'est mieux 😊
Pour fabriquer des fichiers MP3 il existe un certain nombre de méthodes. En général on part de fichiers au format Wav.
Mais avant quelques petites remarques :
- Le format Mp3 n'est pas un format libre (à la différence d'autres formats comme Ogg ou Flac).
- Il est probablement mieux de faire des fichiers au format Ogg qui est un format plus intéressant (meilleure qualité à bit rate égal, support des sons multi-canaux type 5.1, format libre ...) mais comme il est moins connu, on fait encore des MP3. En particulier, certains lecteurs ne reconnaissent pas le format Ogg. La meilleure solution est de sauvegarder dans les trois formats (.mp3, .wav, .ogg) ainsi on augmente les chances de pouvoir écouter ses fichiers partout !
- MP3 est un format de compression, donc vos fichiers seront compressés. Si vous avez produit des fichiers Wav, par exemple à partir d'Ardour, vous aurez probablement utilisé des compresseurs pour arranger un peu une voix ou une trompette. Si votre production était destinée à des fichiers Wav, vous perdrez un peu en qualité en passant ensuite en MP3, si votre production était directement destinée à faire du MP3, ne forcez pas trop les compressions dans votre mix.
- L'encodeur Mp3 phare sous Linux s'appelle LAME (pour LAME Ain't an Mp3 Encoder !!). Il est disponible pour toutes les distributions. N'oubliez pas de l'installer.
Encodage en ligne de commande
La commande
lame fichier.wav fichier.mp3
lame -V 0 fichier.wav
lame -s 48000 fichier.wav
lame --bitwidth 24 fichier.wav
lame --cbr 192 fichier.wav
Il existe encore de nombreuses options, pour une liste complète, lancez:
lame longhelp help
lowpass <freq>
highpass <freq>
--highpass-width <freq>
De plus les options suivantes
ta artiste
--tl nomdelalbum
Encodage à l'aide d'un script bash
Le script suivant (bash) réalise l'opération précédente sur l'ensemble des fichiers wav d'un répertoire. Sauvegardez-le le sous le nom wav2mp3 (par exemple) dans un répertoire qui est dans votre chemin (PATH).
#!/bin/bash
# Pour executer ce script placez le dans un repertoire qui est dans
# votre PATH ou modifier votre PATH. Assurez vous que ce script est executable
# chmod +x wav2mp3
function usage(){
echo
echo "usage: wav2mp3 repertoire"
echo
echo "Ce script convertit tous les fichiers .wav d'un repertoire"
echo "en fichier .mp3 avec lame " ;
exit ;
}
if [ $# != 1 ]
then usage
fi
directory=$1
if [ ! -d $directory ]
then usage
fi
if [ ! -x `which lame` ]
then
echo "Est-ce-que lame est dans votre chemin (PATH)"
usage
fi
find $directory -name "*.wav" | while read file
do
base=`basename $file .wav`
basedir=`dirname $file`
echo "executing lame $file $basedir/$base.mp3"
lame "$file" "$basedir/$base.mp3"
done
Le format Ogg Vorbis
Le format Ogg Vorbis est un format de compression audio développé par la fondation Xiph.Org dont le but est de proposer à la communauté des formats et codec multimédias ouverts, libres et dégagés de tout brevet. C'est une alternative libre au format Mp3, cependant, moins populaire, certains lecteurs (auto-radio, etc.) ne le reconnaissent pas encore.Pour compresser un fichier Wav en Ogg :
oggenc -q 8 fichier.wav
Compresse votre fichier en qualité "8" (de 1 à 10). A l'inverse de Lame ici "10" est la meilleure qualité. A mon sens la qualité "8" produit des fichiers très convenables. "7" est déjà un peu limite pour de la bonne musique. La compression Ogg Vorbis semble d'une manière générale atténuer un peu les aigus.
Le format Musepack
Moins connu que les deux précédents, il serait meilleur qu'eux pour des bit rates élevés, mais moins bon à des bit rates faibles.Le site internet
Les formats de compression non-destructifs
Le choix indiscutable pour vos sauvegardes !
Le format Flac (Free Lossless Audio Codec)
Ce format libre a rejoint la bannière de la fondation Xiph.Org. Il vous permet de réduire d'environ 50% vos fichiers Wav.Il existe une commande flac permettant d'encoder/décoder dans ce format lossless (sans perte). Finalement c'est très similaire à un outil de compression comme gzip mais les taux de compression sont un peu meilleurs.
D'autres points forts pour ce format : le décodage est rapide (l'encodage plus long) et la lecture est streamable.
Le site internet : http://flac.sourceforge.net
On peut lire directement les fichiers flac avec la commande flac123 ou avec xmms qui dispose d'un greffon (vérifier que celui-ci est installé et activé).
Le format WavPack
Format libre et ouvert (licence de type BSD) permettant 3 types de compression : sans perte, avec pertes et hybride (combinant les deux aspects).Le site internet : http://www.wavpack.com
Logiciels
Sox - Sound eXchange
Véritable couteau suisse de la conversion audio. Il reconnaît un très grand nombre de formats audio et permet la lecture, l'enregistrement et la conversion des fichiers audio. Il permet également d'appliquer des effets lors de la conversion (chorus, volume, etc.). Il est disponible sous différentes systèmes (Linux bien entendu, mais aussi BeOS, Windows, Atari ST, etc.)Consultez le site internet de Sox pour avoir la liste complète des formats et effets supportés.
Il fonctionne en ligne de commande, ce qui permet de créer facilement des scripts pour automatiser des tâches répétitives (vous trouverez quelques exemples ici : http://sox.sourceforge.net/Docs/Scripts )
Il existe également des frontends pour les "allergiques" à la ligne de commande : Studio par exemple (site : http://studio.sourceforge.net )
Éditeurs audio
Il est généralement possible d'utiliser des éditeurs audio pour exporter en mp3 ou en ogg (par exemple Audacity ou ReZound). Pour le mp3, vérifier que Lame est bien installé et indiquez son chemin d'accès dans les préférences de l'éditeur.Inutile par contre de chercher le format mp3 dans Ardour : celui-ci ne reconnaît que les formats non-destructifs 😀
Konqueror
Et oui, si vous utilisez Konqueror, il peut aussi vous aider à convertir rapidement vos fichiers. Différents scripts vous permettront d'ajouter des options de conversion dans le menu contextuel affiché lorsque vous faites un clic droit sur un fichier audio :- Perl Audio Converter (PAC). Utilisable aussi en ligne de commande (commande "pac"). Présentation sur le site kde-apps.org.
- Audiokonverter Présentation sur le site kde-apps.org.
X Convert File Audio (Xcfa)
Présentation
Front-end graphique permettant d'utiliser les différents outils habituellement accessibles en ligne de commande, il sait faire beaucoup de choses : extraction, conversion(s), mais aussi jaquettes de CD ! Il reconnaît les formats les plus courants : flac, wav, mp3, ogg et m4a. L'avantage de ce programme est qu'il te dit ce qui manque si ça marche pas.Doc sur ubuntu fr : http://doc.ubuntu-fr.org/xcfa.
Le site
http://www.xcfa.tuxfamily.org/ (ancien : http://bulin.claude.neuf.fr/xcfa-presentation.html)Installation
Debian / Ubuntu
Dans une console, tapersudo gedit /etc/apt/sources.list
Ajoutez les lignes suivantes :
- xcfa
Capture d'écran
Xfca en action lors de la conversion de plusieurs fichiers de type .wav en .ogg
Autres outils de conversion
Outre PAC et Audiokonverter cités juste au dessus, de très nombreux outils / scripts permettent des conversions en tous genres :- TransKode : http://kde-apps.org/content/show.php?content=37669
- soundKonverter : http://kde-apps.org/content/show.php?content=29024
- Multimedia Converter, un script kommander pour convertir fichiers vidéo et audio dans différents formats utilisant mplayer et ffmpeg : http://www.kde-apps.org/content/show.php/Multimedia+Converter?content=61463
- soundconverter : http://soundconverter.berlios.de/.
Éditeurs de Tag
La plupart des formats audio permettent d'inclure dans les fichiers des informations complémentaires (titre, auteur, etc.), on parle de Tag.Les lecteurs audio et multimédia sont en général capables de lire et de modifier ces informations, mais il existe aussi quelques logiciels spécialisés qui vous seront utiles pour modifier les Tags d'un grand nombre de fichiers.
- EasyTAG. Excellent éditeur de Tags doté d'une interface graphique basée sur GTK. Le site internet d'EasyTAG.
- Audio Tag Tool. Le site internet.
Extraction de pistes CD-Audio
De nombreuses solutions existent, souvent basées sur cdparanoia et cdda2wav. Citons par exemple :- Grip pour Gnome
- KAudioCreator pour KDE
- Mais si vous utilisez Konqueror, il y a plus simple encore : Placer votre CD, fermez le lecteur, et dans la barre d'adresses de Konqueror, saisissez simplement :
Copy to clipboard
audiocd:/