Table des matières
Préambule
Ce tutoriel a été créé à partir de tests et de la traduction de la spécification soundfont SF2. cette norme est destinée à fournir un format d'échange universel, portable et extensible pour les synthétiseur à base d'échantillons; Elle est portable et universelle grace à l'utilisation d'une définition précise des paramètres indépendants du matériel, ainsi que par des pratiques spécifiques conçues pour être supportées par un large éventail de technologies.
Dans ce mémo, j'ai utilisé le langage de programmation C++ ( QT4 ) pour illustrer les exemples. J'ai créé un fichier soundfont SF2 avec Swami sur un seul échantillon stéréo (un signal LA de 1 seconde), un seul intrument, et un seul preset.
info
le terme énumérateur peut-être compris dans le sens désignation.
les termes générateur et modulateur peuvent être compris comme terme de paramètrage.
Voir terminologie en annexe A.
Le format du fichier SF2
Un fichier SF2 est stocké en format RIFF (Resource Interchange File Format) qui est une structure de fichier balisé, développée pour les fichiers de ressources multimédia. La structure de fichier balisé est intéressante car elle permet d'éviter les problèmes de compatibilité qui pourraient se produire dans des changements de définition de fichier au fil du temps, par le fait que chaque élément de données du fichier est identifié par un entête standard, une application qui ne reconnaîtrait pas un de ces éléments de données peut éluder cette information inconnue.
Un fichier RIFF est construit à partir de blocs et sous-blocs stratifiés en niveaux, la lecture doit se faire séquentiellement, bloc par bloc, afin de récupérer la taille de ces blocs et de pouvoir lire les données "en paquet" d'octets ou par une structure de donnée (struct), ou passer au bloc suivant.
Principe des blocs
Les blocs sont "balisés" par des chaines de 4 octets ( ex: snbk, INAM, ifil, LIST ... ), la spécification n'impose pas si ces caractères doivent être majuscules, minuscules ou les deux.
La valeur "taille" du bloc est écrite sur 4 octets le premier est celui de poids faible, le quatrième de poids fort, ce qui implique que le calcul de cette valeur s'effectuera après la lecture des octets de la façon suivante :
octet1 + octet2*256 + octet3*(256²) + octet4*(256³) etc...
ex : 44 F1 02 00 => 192836
Les informations concernant d'autres données techniques sont en annexe A .
Le premier bloc
Dans ce bloc, nous récupérons le type de structure, la taille du bloc de données et le type de fichier RIFF. Il a une taille invariable de 12 octets
struct entete{ DWORD typestructure;// RIFF = #52494646 DWORD taillefichier; DWORD typefichier;//sfbk = #7366626b };
Ce premier bloc est commun à tous les fichier RIFF, il fournit les informations sur le fichier à traiter, dans notre cas, nous avons à faire avec un fichier RIFF de type soundfont. Quant à la donnée taillefichier, elle renseigne sur la taille du bloc de donnée, c'est à dire que sa valeur = (taille réelle du fichier) - 8 octets (RIFF et taillefichier).
Les blocs suivants
Ces blocs peuvent être organisés dans le RIFF dans n'importe quel ordre, puisqu'il commence toujours par des balises pour les décrire. De plus, ces blocs ne sont pas obligatoirement prèsents, ainsi que certaines de leurs données peuvent être absentes. Il est aussi possible que des blocs écrits dans le fichier ou des données ne soient pas utilisable dans le logiciel. C'est ce qui fait la souplesse et fiabilité dans le temps des fichier RIFF (sous réserve que le logiciel qui les utilise soit doté des contrôles nécessaires).
Mais, il est plus judicieux de se conformer à une organisation "standard" lors de la création d'un fichier RIFF ( c'est à dire, l'ordre dans lequel la spécification décrit ces blocs ).
Un bloc commence toujours par la balise LIST suivie de la taille du bloc et des quatre octets décrivant le nom du bloc, ce qui permet (si le bloc n'est pas traitable par le logiciel) d'aller immédiatement au bloc suivant en utilisant la valeur taille_du_bloc (ici des exemples de sauts de bloc).
struct baliseLIST{ DWORD balise;// LIST DWORD taille_du_bloc_qui_suit; DWORD nom_balise_bloc;//INFO };
Chaque donnée contenue dans une balise_bloc à une structure simple, elle est composée d'un nom, d'une taille et de la valeur de la donnée.
struct balise_donnee{ DWORD nom_de_balise;// ex: ifil -> N° de version de la norme SF2 utilisée DWORD taille_de_la_donnee;// ex: 04 00 00 00 ......... //valeur = octet*taille_de_la_donnée };
Pour récupérer la valeur de la donnée il suffit d'utiliser "taille_de_la_donnee".
On procéde de cette façon jusqu'à la limite finale du bloc donnée par "taille_du_bloc". Après quoi, un nouveau bloc, commençant par une balise LIST commence.
Description des blocs et de leurs données
Les données de type chaines de caractères ASCII finissent par un ou deux octets à 0, de manière à obtenir éventuellement, la longueur de la chaine ; Donc la taille concernant ces chaines (taille_de_la_donnee) comprend les valeurs 0 finales. Les caractères ASCII doivent être considérés comme sensible à la casse, en d'autres termes "abc" n'est pas la même chose que "ABC". Les chaines acceptées sont de 256 octets ou moins, sauf indication contraires. Dans le cas des chaines dont la longueur est fixée (ex : noms des preset 20cars ), les octets non-utilisés doivent être mis à 0.
Le bloc INFO
Il contient les données générales de la soundfont : 11 balises de données sont actuellement définies :
balise | type | présence | description |
---|---|---|---|
ifil | numérique | obligatoire | identificateur de la version de la spécification de la SoundFont. Sa taille est toujours de 4 octets et contient des données en fonction de la structure: struct Version { WORD termegauche; valeur à gauche de la virgule WORD termedroite; valeur à droite de la virgule };ex : 69 66 69 6c balise : ifil 04 00 00 00 taille du bloc ifil ( 4 ) 02 00 01 00 donnée de la version SF2 (ici 2.1) Ces valeurs doivent être utilisées par les applications qui lisent des fichiers compatibles SoundFont pour déterminer si le format du fichier est utilisable l'application. En général, elle doit accepter le fichier soit, comme utilisable (éventuellement avec une transposition appropriée), soit elle le rejetera ou avertira l'utilisateur qu'il peut y avoir des données non-traitables dans le fichier. |
isng | chaine | obligatoire | C'est une valeur identifiant le moteur sonore pour lequel le fichier a été optimisé. Par défaut la valeur est de huit octets représentant "EMU8000" suivi par un octet nul. Cette valeur peut être utilisée par les pilotes de puce pour modifier leurs algorithmes de synthèse afin d'émuler le moteur sonore. |
INAM | chaine | obligatoire | Indique le nom de la banque de son, elle est généralement utilisé pour l'identification de la banque pour la dissocier du nom de fichier qui lui peut être modifié. |
IROM | chaine | option | Elle identifie une ROM de sons à laquelle les échantillons se référent.. Une donnée typique de IROM serait "1MGM" de deux octets nuls. Cette valeur est utilisée par les pilotes pour vérifier que les données en ROM et référencées par le fichier SF2 sont disponibles pour le moteur de son. |
VER | numérique | option | C'est une valeur de même type que ifil. Elle est utilisée par les pilotes pour vérifier que les données référencées dans la ROM, par le fichier, sont dans la bonne version. |
ICRD | chaine | option | C'est une chaine optionnelle. Elle indique la date de création de la banque et sa taille possible de 256 octets, ne devrait jamais dépasser 32. Cette chaine est fournie pour la gestion. |
IENG | chaine | option | Contient le ou les noms des sound designers ou ingénieurs responsables de la banque. Elle est fournie pour la gestion. |
IPRD | chaine | option | Identificateur d'un produit spécifique auquel la banque serait destinée. Ex : un champ de 8 octets représentant "SBAWE32" + un octet nul. Cette valeur est fournie pour la gestion. |
ICOP | chaine | option | Indique le type de licence qui règit la banque. ATTENTION Si cette valeur est manquante la banque n'est par forcèment libre de droit. |
ICMT | chaine | option | Contient les commentaires associés à la banque, avec 65.536 octets maximum. |
ISFT | chaine | option | Elle indique l'outil compatible SoundFont le plus récemment utilisé pour créer et modifier la banque. ex "libInstPatch v1.0.0:libInstPatch 1.0.0" : par convention, le nom de l'outil et le numéro de révision sont inclus, la première partie est l'outil de création et la deuxième celui de la modification la plus récente. Les deux chaînes sont séparées par un ":" . |
Le bloc des presets et instruments : pdta
Les données d'articulation au sein d'un fichier compatible SF2 sont décrites dans 9 sous-blocs obligatoires. La structure a été conçue à des fins d'échange et n'est pas optimisé que ce soit pour une synthèse d'exécution ou une édition on-the-fly.
Bien faire la différence entre le terme preset et instrument : le preset est l'élément utilisé et dont le nom est visible dans les patches par les séquenceurs et synthétiseurs, alors que l'instrument est un élément paramètré, intermédiaire entre le preset et le sample.
- Un preset est généralement constitué de plusieurs instruments superposés et/ou adjacents, avec des réglages différents, pour générer les notes tout le long du clavier.
- Un instrument peut être constitué d'une série de samples différents et/ou identiques.
- Un sample, peut-être utilisé par plusieurs instruments réglés différemment pour obtenir des variations dans le jeu du sample.
- balisephdr
- un enregistrement pour chaque Preset.
- un enregistrement final vide pour terminer la liste.
struct sfEntetePreset { CHAR NomDuPreset[20]; // contient le nom du preset en ASCII WORD NumSelectMidi; // numéro de présélection MIDI WORD NumBanque; // numéro de banque MIDI qui s appliquent à cette présélection WORD IdxPbag; // indice de la liste de zone du préréglage dans le sous-bloc pbag /*Les trois valeurs suivantes sont reservées pour la mise en œuvre future d une fonction de gestion de la bibliothèque de presets ellse doivent exister et être = 0 */ DWORD Librairie; DWORD Genre; DWORD Morpho; };
{FANCYTABLE(head="nom|description", sortable=n)}
NomDuPreset | Les caractères du champ ASCII inutilisés doivent être mis à 0. Les noms prédéfinis sont sensibles à la casse. Un nom unique doit toujours être attribué à chaque preset pour permettre l'identification. Toutefois, si une banque contient des noms identiques, les presets doivent être soit conservés comme lisible ou de préférence renommés avec un nom unique.
Notez que les presets ne sont pas ordonnés dans la banque, ils doivent avoir un ensemble unique de numéros NumSelectMidi et NumBanque. Toutefois, si deux presets ont ces deux valeurs identiques, le premier de ces presets se connectant dans le bloc phdr devient le preset actif ; Tous les autres avec des valeurs identiques seront maintenus afin qu'ils puissent être renumérotés et utilisés ultérieurement. Le cas particulier de la banque de percussion General MIDI est traitée de manière classique par une valeur NumBanque=128.
IdxPbag | Comme la liste de la zone preset est dans le même ordre que la liste phdr, les pbag seront réguliers et croissants suivant l'incrémentation des phdr.
Le dernier enregistrement sfEntetePreset ne doit jamais être accessible (ou être lu), et n'existe que pour fournir un IdxPbag final permettant de terminer le nombre de zones du dernier Preset. Toutes les autres valeurs de cet enregistrement final sont mises à 0, à l'exception de NomDuPreset, qui peut éventuellement être "EOP" indiquant la fin des Presets.
- balisepbag
struct sfPresetBag { WORD IdxGen; // indice dans la liste de zone presets des générateurs dans le sous-bloc pgen WORD IdxMod; // indice dans la liste des modulateurs dans le sous-bloc pmod. };
La première zone de donnée pour un Preset est située à l'indice IdxPbag dans la zone de données pbag. Le nombre de zones de ce Preset est déterminé par la différence entre le IdxPbag du Preset en cours et le IdxPbag du Preset suivant.
Comme les listes de génerateurs et modulateurs sont dans le même ordre que le phdr les indices IdxGen et IdxMod seront incrémenter de façon régulière avec l'augmentation des zones de Preset.
- balisepmod
struct sfModList { SFModulator SfModSrcOper; // valeur de l une des énumérations SFModulator SFGenerator sfModDestOper; // indique la destination du modulateur. SHORT modAmount; // valeur signée indiquant le degré auquel la source module la destination. SFModulator sfModAmtSrcOper; // valeur de l une des énumérations SFModulator SFTransform sfModTransOper; // valeur de l une des énumérations SFTransform } ;
Le IdxMod de sfPresetBag pointe vers le premier modulateur pour le Preset, et le nombre de modulateurs présents pour un Preset est déterminé par la différence entre la IdxMod du Preset suivant et le IdxMod du Preset en cours. Une différence égale à 0 indique qu'il n'y a pas de modulateurs pour ce Preset. Tous les éléments de cette structure sont de 2 octets.
- SfModSrcOper : Cette valeur indique la source de données pour le modulateur. Les valeurs inconnues ou indéfinies seront ignorées. Les Modulateurs avec sfModAmtSrcOper fixés par un «lien» qui n'aboutit pas sont ignorés.
- sfModDestOper : la destination est soit une valeur du type d'énumération SFGenerator , soit un lien vers le sfModSrcOper d'un autre bloc modulateur. Celle-ci est indiquée par le bit haut du champ sfModDestOper, les 15 autres bits désigne la valeur de l'indice du modulateur dont la source doit être la sortie du modulateur en cours par rapport au premier modulateur dans la zone instrument. Les valeurs inconnues ou indéfinies sont ignorées. Des modulateurs avec des liens qui pointent vers un indice modulateur qui dépasse le nombre total de modulateurs pour une zone donnée sont ignorées. Des modulateurs liés qui font partie de liens circulaires sont ignorés.
- modAmount : Une valeur de zéro indique qu'il n'y a pas de modulation fixée.
- sfModAmtSrcOper : Cette valeur qui indique le degré auquel la source module la destination doit être commandé par la source de modulation spécifié. les valeurs inconnues ou indéfinies sont ignorées. Des modulateurs avec sfModAmtSrcOper fixé à un «lien» sont ignorés.
- sfModTransOper : Cette valeur indique qu'une transformée du type spécifié est appliqué à la source de modulation avant l'application sur le modulateur. Les valeurs inconnues ou indéfinies sont ignorées.
Un modulateur est défini par son sfModSrcOper, son sfModDestOper, et son sfModSrcAmtOper.
Des modulateurs du sous-bloc pmod peuvent être utilisés comme modulateurs additionnels en respectant ceux du sous-bloc imod. En d'autres termes, un modulateur pmod peut augmenter ou diminuer l'action d'un modulateur de imod.
En SoundFont 2.00, aucun modulateurs n'a encore été défini, et le sous-bloc pmod sera toujours composé de 10 octets de valeur 0.
- balisepgen
typedef struct { BYTE byLo, byHi; } rangesType; typedef union { rangesType ranges; SHORT shAmount; WORD wAmount; } genAmountType; struct sfGenList { SFGenerator sfGenOper; // une des valeurs de type énumération SFGenerator genAmountType genAmount; // valeur à attribuer au Generator spécifié };
- sfGenOper
- genAmount
- Certains générateurs spécifient une plage de numéros de clé MIDI de vélocité MIDI, avec une valeur minimum et maximum.
- D'autres générateurs spécifient une valeur WORD non signé.
- Mais la plupart des générateurs, spécifient une valeur WORD 16 bits signé.
Sauf si la zone est une zone globale : le dernier générateur de la liste est un générateur Instrument, dont la valeur est un pointeur vers le générateur associé à cette zone.
- Si un générateur key range existe pour un preset, il est toujours le premier générateur dans la liste pour ce preset.
- Si un générateur velocity range existe pour un preset, il devra n'être précédé que par un générateur de «keyrange ».
Les générateurs dans le sous-bloc pgen sont appliqués par rapport aux générateurs dans le sous-bloc igen d'une manière additionnelle. En d'autres termes : les générateurs pgen augmentent ou diminuent la valeur d'un générateur igen.
- baliseinst
struct sfInst { CHAR NomInstrument[20]; // contient le nom de l instrument exprimé en ASCII WORD IdxIbag; // indice de la liste de la zone de l instrument dans ibag };
nom | description |
---|---|
NomInstrument | Les caractères inutilisés sont mis à 0. Les noms d'instruments sont sensibles à la casse. Un nom unique doit toujours être attribué à chaque instrument pour permettre l'identification. Toutefois, si plusieurs noms identiques sont trouvés, les instruments doivent être renommés avec un nom unique. |
IdxIbag | Comme la liste des zones instrument est dans le même ordre que la liste des instruments, les indices IdxIbag de instrument bag sera incrémentée régulièrement avec l'accroissement de la liste des instruments. |
L'enregistrement sfInst de cloture ne doit jamais être accessible, et n'existe que pour fournir un IdxIbag de fin permettant de déterminer le nombre de zones dans le dernier instrument. Toutes les autres valeurs sont par convention à 0, à l'exception de NomInstrument, qui devrait être "EOI" indiquant la fin des instruments.
Tous les instruments présents dans le sous-bloc inst sont généralement référencés par au moins un Preset. Toutefois, un fichier ne contenant que des instruments «orphelins» peut être traité.
- baliseibag
struct sfInstBag { WORD wInstGenNdx; // indice de la liste des zone de générateurs igen WORD wInstModNdx; // indice de la liste des zonez de modulateurs imod };
La première zone, dans un instrument donné est placée à l'indice IdxIbag de cet instrument. Le nombre de zones de cet instrument est déterminé par la différence entre le IdxIbag de l'instrument suivant et le IdxIbag courant.
Comme les listes de générateurs et les listes de modulateurs sont dans le même ordre que les listes d'instrument et de zone, ces indices wInstGenNdx et wInstModNdx seront incrémenter régulièrement avec l'ajout de zones.
- baliseimod
struct sfModList { SFModulator sfModSrcOper; // valeur du type d énumérateur SFModulator SFGenerator sfModDestOper; // indique la destination du modulateur. SHORT modAmount; // valeur signée indiquant le degré avec lequel la source module la destination SFModulator sfModAmtSrcOper; // valeur du type d énumérateur SFModulator SFTransform sfModTransOper; // valeur du type d énumérateur SFTransform };
L'index WInstModNdx pointe sur le premier modulateur de cette zone, et le nombre de modulateurs présents pour une zone est déterminée par la différence entre la wInstModNdx de la zone suivante et le wModNdx de la zone courante. Un résultat à zéro indique qu'il n'y a pas de modulateurs dans la zone. Notez que ces énumérateurs sont de 2 octets.
nom | description |
---|---|
sfModSrcOper | indique la source de données pour le modulateur. |
sfModDestOper | soit une valeur du type énumérateur SFGenerator, soit un «lien» vers la sfModSrcOper d'un autre bloc modulateur. Cette destination est indiquée par le bit haut du champ de sfModDestOper, les 15 autres bits désignent la valeur de l'indice du modulateur dont la source doit être la sortie du modulateur courant par rapport au premier modulateur dans la zone instrument. |
modAmount | Une valeur à zéro indique qu'il n'y a pas de valeur fixée. |
sfModAmtSrcOper | indique avec quel degré de modulation la destination doit être commandée par la source de modulation spécifiée. |
sfModTransOper | indique qu'une transformée du type spécifié est appliquée à la source de modulation avant l'application sur le modulateur. |
info
En SoundFont 2.00, aucun modulateurs n'a encore été défini, et le sous-bloc imod sera toujours composé de 10 octets de valeur 0.
Par convention, l'enregistrement de cloture contient 0 dans tous ses champs, et est toujours ignoré.
Un modulateur est défini par ses sfModSrcOper, sfModDestOper, et sfModSrcAmtOper. Tous les modulateurs dans une zone doivent disposer d'un ensemble unique de ces trois énumérateurs. Si un second modulateur est rencontré avec les trois mêmes énumérateurs comme modulateur précédent dans cette même zone, le premier modulateur sera ignoré.
Des modulateurs du sous-bloc imod sont absolus, cela signifie qu'un modulateur de imod remplace, plutôt que de s'ajouter, à un modulateur par défaut. Toutefois, l'effet d'un modulateur sur un générateur est additif, à savoir la sortie d'un modulateur s'ajoute à une valeur de générateur.
- baliseigen
structure où les types sont définis comme dans la zone pgen ci-dessus. struct sfInstGenList { SFGenerator sfGenOper; // genAmountType genAmount; // valeur à attribuer au Generator spécifiée };
genAmount peut être de trois formats
- générateur qui spécifie une plage de numéros de key MIDI, de vélocité MIDI, avec une valeur minimum et maximum.
- générateur qui spécifie une valeur WORD non signé.
- cependant la plupart des générateurs spécifie une valeur 16 bits signé.
A part le cas où la zone est une zone globale, le dernier générateur de la liste est un générateur sampleID, dont la valeur est un pointeur vers le sample associé à cette zone. Si un générateur "key range" existe pour la zone, il est toujours le premier générateur dans la liste de cette zone. Si un générateur "velocity range" existe pour la zone, il ne sera précédé que par un générateur de « key range ». Si des générateurs suivent un générateur sampleID, ils seront ignorés.
Un générateur est défini par sa sfGenOper. Tous les générateurs dans une zone doivent avoir un énumérateur de sfGenOper unique. Si un second générateur est rencontré avec le même énumérateur sfGenOper comme un des générateurs précédent dans la même zone, le premier générateur sera ignoré.
Des générateurs du sous-bloc igen sont absolus. Cela signifie qu'un générateur igen remplace, plutôt que s'ajoute, à la valeur par défaut du générateur.
- baliseshdr
struct sfSample { CHAR NomDuSample[20]; // contient le nom de l échantillon DWORD dwStart; DWORD dwEnd; DWORD dwStartloop; DWORD dwEndloop; DWORD dwSampleRate; BYTE byOriginalPitch; CHAR chPitchCorrection; WORD wSampleLink; SFSampleLink sfSampleType; };
nom | description |
---|---|
NomDuSample | Les caractères inutilisés du champ sont mis à 0. les noms des échantillons sont sensibles à la casse. Un nom unique doit toujours être attribué à chaque échantillon pour permettre l'identification. Toutefois, si une banque est lue et contient des échantillons avec des noms identiques, ils doivent être soit conservés comme lisible ou, de préférence, renommés avec un nom unique. |
dwStart | index du datapoint à partir du début du champ de données de l'échantillon jusqu'au premier point de cet échantillon de données. |
dwEnd | index du datapoint à partir du début du champ de données de l'échantillon jusque la première de la série de 46 datapoints à zéro qui suivent cet échantillon. |
dwStartloop | index du datapoint depuis le début du champ de données de l'échantillon jusqu'au premier datapoint de sa boucle. |
dwEndloop | index du datapoint depuis le début du champ de données de l'échantillon jusqu'au premier datapoint de fin sa boucle. Notez que dwEndloop est le datapoint "équivalent" au premier datapoint de boucle, et que pour produire une boucle librement portablee, les 8 datapoints contigus entourant à la fois la Startloop et Endloop doivent être identiques. |
dwSampleRate | fréquence d'échantillonnage en hertz, lors de l'enregistrement de l'échantillon où de sa plus récente conversion. Des valeurs supérieures à 50000 ou inférieur à 400 peuvent ne pas être reproduites par certain matériels et doivent être évités. La valeur 0 ne doit pas être utilisée. |
byOriginalPitch | Valeur de la touche du pitch nominal de l'échantillon. Exemple : l'enregistrement d'un instrument qui joue au centre C (261.62 Hz) doit recevoir une valeur de 60. Cette valeur est utilisée comme la touche root par défaut de l'échantillon, de sorte qu'une commande clavier MIDI pour le numéro de note 60 devrait reproduire le son à sa hauteur d'origine. Pour les sons sons indéterminés, une valeur conventionnelle de 255 doit être utilisé. Les valeurs comprises entre 128 et 254 sont interdites. |
chPitchCorrection | Correction de hauteur en cents qui doit être appliquée pour la lecture de l'échantillon. Le but de ce champ est de compenser les erreurs de pitch intervenues pendant l'enregistrement de l'échantillon. Ex : si le son est trop haut de 4 cents, une correction diminuant de 4 cents est nécessaire; la valeur doit être -4. |
wSampleLink | Le type d'échantillon lié n'est pas encore pleinement défini dans la spécification SF2, mais devrait définir une liste circulaire d'échantillons liés en utilisant wSampleLink. Notez que cette énumération est de 2 octets. |
sfSampleType | Une valeur d'énumérateur entre les 8 valeurs suivantes : monoSample=1 rightSample =2 leftSample=4 linkedSample=8 RomMonoSample=32769 RomRightSample=32770 RomLeftSample =32772 RomLinkedSample=32776 On peut voir que les valeurs énumérées de sfSampleType sont codées de telle sorte que le bit 15 est activé si l'échantillon est dans la ROM, et remis à 0 si elle est incluse dans la banque compatible SoundFont. Les quatre bits LS du WORD sont alors exclusivement mis en indiquant mono, gauche, droite, ou liés. |
dwStart,dwEnd,dwStartloop et dwEndloop doivent avoir une valeur dans l'intervalle du champs de données de l'échantillon inclu dans la banque compatible SoundFont ou référencés dans la ROM. Aussi, pour permettre à une variété de plates-formes matérielles de reproduire ces données, les échantillons auront une longueur minimale de 48 datapoints, une taille minimale de boucle de 32 datapoints et un minimum de 8 points valides avant dwStartloop et après dwEndloop. Ainsi dwStart doit être inférieure à dwStartloop-7, dwStartloop doit être inférieure à dwEndloop-31, et dwEndloop doit être inférieure à dwEnd-7. Si ces contraintes ne sont pas remplies, le son peut éventuellement ne pas être lisible si le matériel ne prend pas en charge la lecture concernant les paramètres indiqués.
L'enregistrement de cloture n'est jamais référencé, et est entièrement mis à 0, à l'exception de NomDuSample, qui devrait être "EOS" indiquant la fin des échantillons.
Tous les échantillons présents dans le sous-bloc smpl sont généralement référencés par un instrument, mais un fichier contenant des échantillons «orphelins» ne doit pas être rejeté. Des applications compatibles SoundFont pouvant éventuellement ignorer ou filtrer ces orphelins selon les choix de l'utilisateur.
Le bloc LIST des échantillons : sdta
Les échantillons stockés dans la SF2 peuvent être du format 16 bits OU 24 bits, c'est le créateur de la banque qui définit le format de stockage des échantillons suivant le format des fichiers échantillonés à stocker.
Le bloc sdta contient un seul sous-bloc optionnel : smpl. Celui-ci contient toutes les données de sons 16 bits qui seront placées en mémoire et liées à la banque. Sa taille est variable, et contient obligatoirement un nombre pair d'octets. Quant au sous-bloc sm24, si les données stockées sont au format 24 bits, il fait exactement la moitié de la taille du smpl, plus 1 octet, si nécessaire pour satisfaire l'alignement sur 16 bits (nombre pair d'octets).
Si le bloc sdta est absent ça signifie que soit il n'y a pas de sons joués, soit la banque fait référence aux échantillons d'une ROM.
struct bloc_sdta{ smpl;// bloc d échantillon 16 bits sm24;// bloc d échantillons 24 bits };
Le bloc smpl
S'il est présent, il contient un ou plusieurs «échantillons» de l'information audio numérique sous la forme d'un code seize bits, signés, little endian (octet le moins significatif en premier). Chaque échantillon est suivi d'un minimum de 46 datapoints égaux à 0 qui sont nécessaires pour garantir la possibilité de faire une boucle sur des données 0 à la fin du son avec des valeurs raisonnables de pitch en une interpolation raisonnable.
Le bloc sm24
S'il est présent, il contient les octets les moins significatifs correspondants à chacun des data_points contenu dans le bloc smpl. Notez que cela signifie pour chaque paire d'octets dans le smpl il y a obligatoirement un octet supplèmentaire dans le sm24.
Ces points de forme d'onde de l'échantillon doivent être combinées avec les points de forme d'onde des échantillons correspondants smpl, pour créer ensemble un seul pool de données de l'échantillon avec une résolution de 24 bits.
- Si la version ifil du format est inférieur à la version 2.04 la SM24 doit être ignorée.
L'utilisation des boucles dans les échantillons
Au sein de chaque échantillon, une ou plusieurs paires de points de boucles peuvent exister. Les emplacements de ces points sont définis dans le bloc pdta, mais dans les échantillons, les data_points doivent se conformer à certains critères pour que la boucle soit compatible sur de multiples plateformes.
Les boucles sont définies par des «points équivalents» dans l'échantillon. Cela signifie qu'il y a deux data_points qui sont logiquement équivalents, et une boucle se produit lorsqu'un de ces points est raccordé à l'autre. En théorie, le point de fin de boucle n'est jamais joué au cours du bouclage ; A la place, le point de départ de la boucle suit le point juste avant le point de fin de boucle. Une boucle doit montrée des données pratiquement identiques autour des 2 points équivalents pour avoir la meilleure transition possible.
En réalité, à cause des divers algorithmes d'interpolation utilisés par des synthétiseurs d'échantillons, les données entourant à la fois le début de la boucle et les points d'extrémité peuvent affecter le son de la boucle. Ainsi les points à la fois le début et la fin de la boucle doivent être entourés par des données audio continue. Par exemple : même si le son est programmé pour continuer à boucler pendant le decay, les data_points doivent être fournis au-delà du point de fin de boucle. Ces données seront généralement identiques aux données au début de la boucle. Un minimum de 8 points de données valides doivent être présents avant le début de la boucle et après la fin de la boucle.
Ces huit points de données (quatre de chaque côté) entourant les deux points équivalents doivent être équivalents si possible.
En forçant les données à être identiques, tous les algorithmes d'interpolation garantissent la reproduction correcte d'une boucle sans articulations. Voir notions de boucle dans Swami - créer une banque SF2 pour plus de détails.
Les énumérateurs
Les générateurs et modulateur destinataire.
Un générateur et un modulator destinataire sont deux termes signifiant la même chose, des paramètres de synthétiseurs. le générateur est utilisé dans les listes igen et pgen, et le modulateur destinataire est utilisé dans les listes imod et pmod.
Cinq types d'énumérateurs de générateur existent :
- Index Generators : c'est un index de générateur dans une structure de données. il y a deux index de générateur
- Instrument : définition d'un instrument dans la zone instrument
- sampleID : définition d'un échantillon dans la zone sample.
- Range Generators : définit un intervalle où les note-on extérieures à cette zone sont ignorées. Il y a deux générateurs actuellement définis :
- keyRange : la plage de touche qui produiront un son quand elle seront appuyées.
- velRange : la plage de vélocité (force d'appui sur une touche) dans laquelle la touche produira un son si la force d'appui est dans l'intervalle.
- Substitution Generators : ce sont des générateurs qui remplacent une valeur pour un note-on. 2 Generateurs sont actuellement définis :
- overridingKeyNumber
- overridingVelocity.
- Sample Generators : ces générateurs affectent directement les propriètés d'un échantillon. Ils ne sont pas définissables au niveau du preset.
- générateur : sampleMode
- générateur : Overriding Root Key
- générateur : Exclusive Class
- Value Generators : ce sont des générateurs qui affectent directement un paramètre de traitement du signal. La plupart des générateurs font partie de ce type. Les modulateur-destinataires font aussi partie de la liste Value Generators.
Définition des énumateurs de générateur.
Ce qui suit est une liste exhaustive des générateurs de la SoundFont 2.00 et leurs définitions.
Voir tableau annexe A pour la terminologie des unités utilisées.
Voir tableau annexe A pour la terminologie des éléments de synthése sonore utilisés.
Les énumérateurs manquants sont des énumérateurs utilisés en interne ou en attente d'affectation.
énumé rateur |
mnémonique - - - description |
---|---|
0 | startAddrsOffset |
Décalage de datapoint au-delà du datapoint début de l'échantillon pour pointer le premier datapoint à jouer de cet instrument. Ex : si le datapoint début = 7 et startAddrOffset = 2, le premier datapoint d'échantillon joué sera 9. |
|
1 | endAddrsOffset |
Décalage de datapoint en deçà du datapoint de fin de l'échantillon pour pointer le dernier datapoint à jouer de cet instrument. Ex : si le datapoint fin = 17 et endAddrOffset = -2, le dernier datapoint joué sera 15. |
|
2 | startloopAddrsOffset |
Décalage de datapoint dans l'échantillon au-delà de la valeur de STARTLOOP pour pointer le premier datapoint qui sera répété pour reprendre le bouclage de l'instrument. Ex : si Startloop = 10 et startloopAddrsOffset = -1, le départ de la boucle sera au datapoint 9. |
|
3 | endloopAddrsOffset |
Décalage de datapoint au delà de ENDLOOP pour fixer le datapoint considéré comme fin de bouclage et reprendre au début de cette boucle. Ex : si ENDLOOP = 15 et endloopAddrsOffset = 2, le datapoint 17 sera considéré comme équivalent au datapoint STARTLOOP, et donc le datapoint 16 précédera efficacement STARTLOOP pendant le bouclage de l'échantillon. |
|
4 | startAddrsCoarseOffset |
Décalage, par pas de 32768 datapoints au-delà du début de l'échantillon et du décalage startAddrsOffset, pour pointer le premier datapoint à jouer de l'instrument. Ce paramètre est ajoutée au paramètre de startAddrsOffset. Ex : si le début=5, startAddrsOffset=3 et startAddrsCoarseOffset=2, le premier datapoint joué sera le datapoint 65544 (32768*2 + 5 + 3). |
|
5 | modLfoToPitch |
Cest la valeur en cents, pour laquelle la modulation LFO va influencer le pitch. Une valeur positive indique une augmentation LFO du pas, une valeur négative indique une diminution du pas.L'écart est en cents de demi-tons et octaves. Ex : une valeur de 100 indique que le pitch va d'abord augmenter de 1 demi-ton, puis diminuer de 1 demi-ton. |
|
6 | vibLfoToPitch |
Cest la valeur en cents, pour laquelle le Vibrato LFO va influencer le pitch. Une valeur positive augmente, une valeur négative diminue pas. L'écart est en cents de demi-tons et octaves. Ex : une valeur de 100 indique que le pitch va d'abord augmenter de 1 demi-ton, puis diminuer de 1 demi-ton. |
|
7 | modEnvToPitch |
Valeur en cents, pour laquelle l'enveloppe de modulation va influencer le pitch. Une valeur positive indique une augmentation de la hauteur, une valeur négative indique une diminution de la hauteur. L'écart est en cents de demi-tons et octaves. Ex : une valeur de 100 indique que la hauteur augmente de 1 demi-ton au sommet de l'enveloppe. |
|
8 | initialFilterFc |
C'est la coupure et de la fréquence de résonance du filtre passe-bas en unités de cents positifs. Le filtre passe-bas est défini comme secondaire de la paire de pôles de résonance dont la fréquence en Hz est définie par le paramètre Initial Filter Cutoff. Lorsque la fréquence de coupure > 20 kHz et le Q (résonance) du filtre = 0, le filtre n'affecte pas le signal. | |
9 | initialFilterQ |
Valeur en centibels de la hauteur, au-dessus du gain, qui expose la résonance du filtre, à la fréquence de coupure. Une valeur zéro ou négative indique que le filtre n'est pas résonant; le gain à la fréquence de coupure peut être inférieur à zéro quand zéro est spécifié. Le gain du filtre DC est également affectée par ce paramètre de telle sorte que le gain DC est réduit de la moitié du gain spécifié. Ex : pour une valeur de 100, le gain du filtre DC serait 5 dB en dessous du gain unitaire, et la hauteur du pic de résonance serait de 10 dB au-dessus du gain DC, ou au-dessus de 5 dB gain unitaire. On notera également que si initialFilterQ =< 0, t la fréquence de coupure > 20 kHz, alors la réponse du filtre est plat et de gain unitaire. |
|
10 | modLfoToFilterFc |
Valeur en cents pour laquelle la modulation LFO va influencer la fréquence de coupure du filtre. Un nombre positif augmente la fréquence de coupure LFO, un nombre négatif diminue la fréquence de coupure. L'écart est en cents de demi-tons et octaves. Ex : une valeur de 1200 indique que la fréquence de coupure va d'abord augmenter de 1 octave, puis baisser d'une octave. |
|
11 | modEnvToFilterFc |
Valeur en cents, pour laquelle l'enveloppe de modulation va influencer la fréquence de coupure du filtre. Un nombre positif augmente la fréquence de coupure, un nombre négatif la diminue. L'écart est en cents de demi-tons et octaves. Ex : une valeur de 1200 indique que la fréquence de coupure augmente d'une octave à la pointe d'attaque de l'enveloppe. |
|
12 | endAddrsCoarseOffset |
Décalage, par pas de 32768 datapoints au-delà du début de l'échantillon et du décalage endAddrsOffset, pour pointer le dernier datapoint à jouer de l'instrument. Ce paramètre est ajoutée au paramètre de endAddrsOffset. Ex : si la fin=65536, endAddrsOffset=-3 et endAddrsCoarseOffset=-1, le dernier datapoint joué sera le datapoint 32765 (65536 - 32768 - 3). |
|
13 | modLfoToVolume |
Valeur en centibels, pour laquelle la modulation LFO va influencer le volume. Un nombre positif augmente le volume LFO, un nombre négatif diminue ce volume. Ex : une valeur de 100 indique que le volume va d'abord augmenter de 10 dB, puis diminuer de 10 dB. |
|
15 | chorusEffectsSend |
Valeur en unités de 0,1% pour laquelle la sortie audio de la note est envoyée au processeur d'effets de chorus. Une valeur de 0% ou négative indique qu'aucun signal n'est envoyé à partir de cette note ; une valeur égale ou supérieure à 100% indique que la note est envoyée au niveau maximal. Notez que ce paramètre n'a aucun effet sur le niveau de ce signal envoyé à la partie «sèche» ou non transformés de la sortie. Ex : une valeur de 250 indique que le signal est envoyé à 25% du niveau maximal (atténuation de 12 dB du niveau total) pour le processeur d'effets de chorus. |
|
16 | reverbEffectsSend |
Valeur en unités de 0,1% pour laquelle la sortie audio de la note est envoyée au processeur d'effets de réverbération. Une valeur de 0% ou négative indique qu'aucun signal n'est envoyé à partir de cette note ; une valeur égale ou supérieure à 100% indique que la note est envoyée au niveau maximal. Notez que ce paramètre n'a aucun effet sur le niveau de ce signal envoyé à la partie «sèche» ou non transformés de la sortie. Ex : une valeur de 250 indique que le signal est envoyé à 25% du niveau maximal (atténuation de 12 dB du niveau total) pour le processeur d'effets de réverbération. |
|
17 | pan |
Valeur en unités de 0,1% pour positionné la sortie audio de la note entre la sortie gauche et droite. Une valeur <= -50% indique que le signal est envoyé vers la sortie gauche; une valeur >= à +50% indique que la note est envoyée vers la droite. Une valeur de zéro indique un centrage de la note. Ex : une valeur de -250 indique que le signal est envoyé à 75% du niveau maximal vers la gauche et à 25% vers la droite. |
|
21 | delayModLFO |
Valeur du delay en unités timecents absolu, à partir du note-on jusqu'au commencement de la montée de la modulation LFO en démarrant à 0. Une valeur de 0 indique un retard de 1 seconde. Une valeur négative indique un retard inférieur à 1 seconde et une valeur positive d'un retard de plus d'une seconde. Le nombre le plus négatif (-32768) indique conventionnellement aucun retard. Ex : un retard de 10 ms serait 1200log2 (.01) = -7973. |
|
22 | freqModLFO |
C'est la fréquence, en cents absolu, de la période triangulaire de la modulation LFO. Une valeur de zéro indique une fréquence de 8.176 Hz. Une valeur négative indique une fréquence inférieure à 8.176 Hz, une valeur positive supérieure à une fréquence de 8.176 Hz. Ex : une fréquence de 10 MHz serait 1200log2 (.01/8.176) = -11610. |
|
23 | delayVibLFO |
Valeur du retard en unités timecents absolu, à partir du note-on jusqu'à ce que le Vibrato LFO soit activé. La valeur 0 indique 1 seconde de retard. Une valeur négative indique un retard inférieur à une seconde, une valeur positive un retard de plus d'une seconde. Le nombre le plus négatif (-32768) indique conventionnellement aucun retard. Ex : un retard de 10 ms serait 1200log2 (.01) = -7973. |
|
24 | freqVibLFO |
C'est la fréquence, en cents absolu, de la période triangulaire du Vibrato LFO. Une valeur de zéro indique une fréquence de 8.176 Hz. Une valeur négative indique une fréquence inférieure à 8.176 Hz, une valeur positive supérieure à une fréquence de 8,176 Hz. Ex : une fréquence de 10 MHz serait 1200log2 (.01/8.176) = -11610. |
|
25 | delayModEnv |
Durée de temporisation, en timecents absolu, entre le note-on et le début de la phase d'attaque de l'enveloppe de modulation. Une valeur 0 indique 1 seconde de retard. Une valeur négative indique un retard inférieur à une seconde, une valeur positive un retard de plus d'une seconde. Le nombre le plus négatif (-32768) indique conventionnellement pas de retard. Ex : un retard de 10 ms serait 1200log2 (.01) = -7973. |
|
26 | attackModEnv |
En timecents absolu, C'est le temps, depuis la fin du delayModEnv jusqu'au point où la valeur de l'enveloppe de modulation atteint son apogée. Notez que l'attaque est «convexe», la courbe est nominalement de telle sorte que lorsqu'il est appliqué à un paramètre de décibels ou demi-ton, le résultat est linéaire en amplitude ou Hz respectivement. Une valeur de 0 indique une 1 seconde de durée d'attaque. Une valeur négative indique un temps inférieur à une seconde, une valeur positive un temps supérieur à une seconde. Le nombre le plus négatif (-32768) indique conventionnellement attaque instantanée. Ex : un temps d'attaque de 10 ms serait 1200log2 (.01) = -7973. |
|
27 | holdModEnv |
C'est le temps, en timecents absolu, à partir de la fin de la phase d'attaque jusqu'à l'entrée en phase de décroissance, au cours de laquelle la valeur de l'enveloppe est maintenue à son apogée. Une valeur de 0 indique une 1 seconde de temps d'attente. Une valeur négative indique un temps inférieur à une seconde, une valeur positive un temps supérieur à une seconde. Le nombre le plus négatif (-32768) indique pas de phase de maintien. Ex : un temps de maintien de 10 ms serait 1200log2 (.01) = -7973. |
|
28 | decayModEnv |
C'est le temps, en timecents absolu, pour une variation de 100% de la valeur de l'enveloppe de modulation pendant la phase de décroissance. La phase de décroissance de l'enveloppe de modulation est linéaire jusqu'au niveau de maintien. Si le niveau de sustain = 0, le temps de decayModEnv devient le temps de décroissance. Une valeur de 0 indique une 1 seconde de temps de décroissance pour un sustain = 0. Une valeur négative indique un temps inférieur à une seconde, une valeur positive un temps supérieur à une seconde. Ex : un temps de décroissance de 10 msec serait 1200log2 (.01) = -7973. |
|
29 | sustainModEnv |
C'est la diminution du niveau, exprimée en unités de 0,1%, pour laquelle l'enveloppe de modulation diminue au cours de la phase de décroissance. Pour l'enveloppe de modulation, le niveau de sustain est exprimé en pourcentage sur la totalité. Parce que le volume du niveau de sustain de l'enveloppe est exprimé comme une atténuation de la totalité, le niveau de sustain est de même exprimée par une diminution sur la totalité. Une valeur de 0 indique que le niveau de sustain est à niveau complet, ce qui implique une durée 0 de la phase de décroissance, indépendamment du temps de décroissance. Une valeur positive indique une décroissance au niveau correspondant. Les valeurs < 0 doivent être interprétés comme 0, les valeurs > 1000 doivent être interprétés comme 1000. Ex : un niveau de soutien qui correspond à une valeur absolue de 40% du pic serait de 600. |
|
30 | releaseModEnv |
C'est la durée, en timecents absolu, pour une variation de 100% de la valeur de l'enveloppe de modulation durant la phase de libération (release). Pour l'enveloppe de modulation, la phase de libération décroît linéairement vers zéro par rapport au niveau actuel. Si le niveau actuel est maximum, la durée de libération sera le temps de la phase de libération jusqu'à ce que la valeur zéro soit atteinte. Une valeur de 0 correspond à une durée de 1 seconde de décroissance pour terminer depuis un niveau complet. Une valeur négative indique un temps inférieur à une seconde, une valeur positive un temps supérieur à une seconde. Ex : un temps de sortie de 10 msec serait 1200log2 (.01) = -7973. |
|
31 | keynumToModEnvHold |
C'est la mesure, en timecents pour une unités de keynumber, où la durée de maintien (hold) de l'enveloppe de modulation est diminuée par l'accroissement du MIDI keynumber. Le temps de maintien à la touche 60 reste invariable. L'unité d'échelle est telle que la valeur 100 donne une durée d'attente d'une octave vers l'aigu provoque une durée de maintien réduite de moitié. Ex : si releaseModEnv = -7973 (10 ms) et le keynumToModEnvHold = 50 quand le keynumber 36 est joué, la durée d'attente sera de 20 msec. |
|
32 | keynumToModEnvDecay |
C'est la mesure, en timecents pour une unités de keynumber, où la durée de décroissance (decay) de l'enveloppe de modulation est diminuée par l'accroissement du MIDI keynumber. Le temps de décroissance à la touche 60 reste invariable. Ex : si releaseModEnv = -7973 (10 ms) et le keynumToModEnvDecay = 50 quand le keynumber 36 est joué, la durée de décroissance sera de 20 msec. |
|
33 | delayVolEnv |
C'est le retard, en timecents absolu, entre note-on et le début de la phase d'attaque de l'enveloppe de volume. Une valeur de 0 indique 1 seconde retard. Une valeur négative indique un retard inférieur à une seconde, une valeur positive un retard de plus d'une seconde. Le nombre le plus négatif (-32768) indique conventionnellement aucun retard. Ex : un retard de 10 ms serait 1200log2 (.01) = -7973. |
|
34 | attackVolEnv |
En timecents absolu, c'est la durée, depuis la fin du délai de l'enveloppe de volume jusqu'au point où la valeur de l'enveloppe de volume atteint son apogée. Une valeur de 0 indique 1 seconde. Une valeur négative indique un temps inférieur à une seconde, une valeur positive un temps supérieur à une seconde. Le nombre le plus négatif (-32768) indique conventionnellement une attaque instantanée. Ex : un temps d'attaque de 10 ms serait 1200log2 (.01) = -7973. |
|
35 | holdVolEnv |
En timecents absolu, c'est le temps entre la fin de l'attaque et l'entrée en décroissance, au cours de laquelle la valeur de l'enveloppe de volume est maintenu à son apogée. Une valeur de 0 indique une 1 seconde. Une valeur négative indique un temps inférieur à une seconde, une valeur positive un temps supérieur à une seconde. Le nombre le plus négatif (-32768) indique aucune phase de maintien. Ex : un temps de maintien de 10 ms serait 1200log2 (.01) = -7973. |
|
36 | decayVolEnv |
C'est le temps, en timecents absolus, pour une variation de 100% de la valeur de l'enveloppe du volume pendant la phase de décroissance. Pour l'enveloppe de volume, la décroissance tend linéairement vers le niveau de maintien, ce qui provoque un changement de dB constant pour chaque unité de temps. Si le niveau de maintien = -100dB, le temps de décroissance de l'enveloppe de volume = temps de la phase de décroissance. Une valeur de 0 indique 1 seconde de temps de décroissance pour un niveau zéro. Une valeur négative indique un temps inférieur à une seconde, une valeur positive un temps supérieur à une seconde. Ex : un temps de décroissance de 10 msec serait 1200log2 (.01) = -7973. |
|
37 | sustainVolEnv |
C'est le taux de la diminution, exprimé en centibels, pour laquelle l'enveloppe de volume décroît au cours de la phase de décroissance. Pour l'enveloppe de volume, le niveau d'atténuation du sustain est mieux exprimé en centibels. Une valeur de 0 indique que le niveau est maximum. Une valeur positive indique une décroissance au niveau correspondant. Les valeurs inférieures à zéro doivent être interprétés comme zéro; conventionnellement 1000 indique une atténuation complète. Ex : un niveau de soutien qui correspond à une valeur absolue de 12 dB en dessous du pic serait 120. |
|
38 | releaseVolEnv |
C'est la durée, en timecents absolu, pour une variation de 100% de la valeur de l'enveloppe du volume pendant la phase de libération (release). Pour l'enveloppe de volume, la phase de libération tend linéairement vers zéro depuis la niveau en cours, ce qui provoque un changement en dB constant pour chaque unité de temps. Si le niveau actuel est maximum, la durée du release de l'enveloppe de volume sera le temps de libération jusqu'à ce que 100 dB d'atténuation soit atteint. Une valeur de 0 indique 1 seconde de temps de décroissance pour finir complètement. Une valeur négative indique un temps inférieur à une seconde, une valeur positive un temps de plus d'une seconde. Ex : un temps de libération de 10 msec serait 1200log2 (.01) = -7973. |
|
39 | keynumToVolEnvHold |
C'est la mesure, en timecents par unités de KeyNumber, pour laquelle la durée de maintien de l'enveloppe de volume est diminué par le nombre croissant de la touche MIDI. La mise en échelle de l'unité est telle que la valeur 100 donne une durée de maintien qui permet de couvrir le clavier ; Une octave vers les aigus provoque une durée de maintien diminuée de moitié. Le temps de maintien de la touche 60 est invariable. Ex : si le holdVolEnv = -7973 (10 ms) et le keynumToVolEnvHold = 50, si le KeyNumber 36 est joué, la durée de maintien sera de 20 msec. |
|
40 | keynumToVolEnvDecay |
C'est la mesure, en timecents par unités de KeyNumber, pour laquelle la durée de décroissance de l'enveloppe de volume est diminué par le nombre croissant de la touche MIDI. La mise en échelle de l'unité est telle que la valeur 100 donne une durée de décroissance qui permet de couvrir le clavier ; Une octave vers les aigus provoque une durée de décroissance diminuée de moitié. Le temps de décroissance de la touche 60 est invariable. Ex : si le holdVolEnv = -7973 (10 ms) et le keynumToVolEnvDecay = 50, si le KeyNumber 36 est joué, la durée de maintien sera de 20 msec. |
|
41 | instrument |
C'est l'index dans le sous-bloc INST fournissant l'instrument qui doit être utilisé pour la 'preset zone en cours. Une valeur de zéro indique le premier instrument de la liste. La valeur ne doit jamais dépasser le nombre de la liste d'instrument - 2. L'énumérateur instrument est le dernier générateur des zones PGEN. En tant que tel, il ne doit apparaître que dans le sous-bloc PGEN, et il doit apparaître comme le dernier énumérateur générateur de tous, sauf dans la zone prédéfinie globale. | |
43 | keyRange |
Ce sont des valeurs numériques minimale et maximale de touches MIDI pour lesquelles la preset zone ou la instrument zone, sont actives. L'octet LS indique latouche la plus haute et l'octet MS la plus basse. L'énumératuer keyRange est facultatif, mais quand il existe, il doit être le premier générateur de la liste de générateur de la zone. | |
44 | velRange |
Ce sont les valeurs de la vitesse minimale et maximale MIDI pour lesquelles la preset zone ou la instrument zone sont actives. L'octet LS indique la vitesse la plus grande et l'octet MS la plus basse. L'énumérateur velRange est facultatif, mais quand il existe, il ne doit être précédé que par keyRange dans la liste de générateur de la zone. | |
45 | startloopAddrsCoarseOffset |
Décalage par pas de 32768 datapoints au-delà du paramètre Startloop pour redéfinir le début de la boucle pour cet instrument. Ce paramètre est ajouté au paramètre de startloopAddrsOffset. Ex : si Startloop = 5, startloopAddrsOffset = 3 et startAddrsCoarseOffset = 2 : le premier datapoint de la boucle sera 65544 (5+3+2*32768). |
|
46 | KeyNum |
Cet énumérateur force la valeur du numéro de touche MIDI. Ce générateur apparaît uniquement au niveau de instrument. Sa valeurs doit être comprise entre 0 et 127. | |
47 | velocity |
Ce paramètre force la vélocité MIDI. Ce générateur n'apparaît seulement qu'au niveau de instrument. Les valeurs valides sont comprises entre 0 et 127. | |
48 | initialAttenuation |
C'est l'atténuation, en centibels, pour laquelle une note est atténuée en dessous de la valeur maximum prévue. Si = 0, il n'y a aucune atténuation, la note sera jouée au maximum prévu. Ex : 60 indique que la note sera jouée à 6 dB en-dessous du maximum prévu pour la note. |
|
50 | endloopAddrsCoarseOffset |
Décalage par pas de 32768 datapoints au-delà du paramètre Endloop pour redéfinir la fin de la boucle qui doit être considéré comme un datapoint de valeur équivalente au datapoint Startloop pour cet instrument. Ce paramètre est ajouté au paramètre de endloopAddrsOffset. Ex : si Startloop = 5, endloopAddrsOffset = 3 et endAddrsCoarseOffset = 2 : le datapoint en 65544 (5+3+2*32768) sera considéré comme équivalent au datapoint Startloop et donc, le datapoint 65543 précédera le datapoint Startloop pour le reprise de la boucle. |
|
51 | coarseTune |
Décalage de la hauteur en demi-tons, qui sera appliqué à la note. Une valeur positive indique que le son est reproduit à une hauteur plus élevée, une valeur négative indique une hauteur inférieure. Ex : une valeur Coarse = -4 provoquera un son joué quatre demi-tons plus bas. |
|
52 | Finetune |
Décalage de la hauteur, en cents, qui sera appliqué à la note. Il est additionnel à coarseTune. Une valeur positive indique que le son est reproduit à une hauteur plus élevée, une valeur négative indique une hauteur inférieure. Ex : une valeur finetune = -5 provoquera un son joué cinq cents plus bas. |
|
53 | sampleID |
C'est l'index dans le sous-bloc SHDR pour accèder à l'échantillon utilisé dans la zone en cours. La valeur 0 pointe sur le premier échantillon de la liste. La valeur ne doit jamais dépasser le nombre d'échantillons-2. L'énumérateur sampleID est le dernier générateur de la zone IGEN. En tant que tel, il ne doit apparaître que dans le sous-bloc IGEN, et doit être le dernier générateur énuméré, sauf dans la zone globale. | |
54 | sampleModes |
Cet énumérateur indique une valeur constituée de drapeaux booléens décrivant l'échantillon de la zone en cours. Le sampleMode n'existe que dans le sous-bloc IGEN, et ne devraient pas apparaître dans la zone globale. Les deux bits LS indiquent le type de boucle dans l'échantillon : - 0 : indique un son reproduit sans boucle - 1 : indique un son qui tourne en boucle - 2 : est inutilisé : il indique l'absence de boucle - 3 : indique un son dont la boucle au moment de la durée du note-off lit le reste de l'échantillon. |
|
56 | scaleTuning |
Ce paramètre représente la mesure par laquelle le keyNumber MIDI influe sur le pitch. Une valeur à 0 ne provoque aucun effet sur la hauteur; Une valeur 100 représente la gamme de demi-ton temporisé habituelle. | |
57 | exclusiveClass |
Ce paramètre donne la possibilité à une note-on pour un instrument donné de finir le jeu des autres instruments. C'est particulièrement utile aux instruments de percussion comme la cymbale hit-hat. La valeur 0 ne provoque aucun effet. Toute autre valeur indique que, lorsque cette note est lancée, toute les autres note en cours d'exécution avec la même valeur de classe seront instantanément stoppées. Le générateur exclusiveClass ne doit figuré qu'au niveau instrument. La portée de exclusiveClass est le preset. En d'autres termes, une autre zone instrument dans le même preset contenant un exclusiveClass correspondant sera stoppé. | |
58 | overridingRootKey |
Ce paramètre représente le keyNumber MIDI pour lequel l'échantillon doit être lu à sa fréquence d'échantillonnage d'origine. S'il est absent ou = -1, alors l'échantillon overridingRootKey est utilisé à sa place. S'il est présent dans l'intervalle 0 à 127, le keyNumber indiqué démarrera la partie début de l'échantillon qui doit être lue. Ex : si l'échantillon est un enregistrement de note C de piano (en touche centrale = 60) avec une fréquence d'échantillonnage de 22,050 kHz, et Root Key = 69 ; L'appui de la touche MIDI 69 (le C au dessus du mileu) provoquera le son d'une note de piano de pitch de milieu C (touche centrale). |
Paramètres et modèle de synthèse
La norme SoundFont2 a été créé avec l'intention de fournir un soutien à une base croissante de modèles de synthètiseur basé sur l'échantillonage. Le modèle utilisé par la spécification SoundFont2 est produit par la puce EMU8000. La description qui suit du modèle de synthèse sous-jacent et des paramètres associés sont prévus pour permettre de greffer ce modèle de synthèse sur d'autres plates-formes matérielles.
Modèle de synthèse
La spécification du modèle de synthèse comprend un oscillateur-échantilloneur, un filtre passe-bas dynamique, un amplificateur d'enveloppe, une sortie paramètrable stéréophonique, et des unités d'effets de chorus et réverbération. Un moteur à modulation sous-jacent comprend deux oscillateurs basse fréquence (LFO) et les deux générateurs d'enveloppe avec leurs amplificateurs d'acheminement appropriés.Oscillateur échantilloneur
Le modèle de l'oscillateur échantilloneur SF2 est capable de jouer un sample à un taux d'échantillonnage quelconque avec un pitch-shift quelconque.Dans la pratique, l'élévation du pitch sera limité à une valeur maximale d'au moins deux octaves.
Le pitch est décrit en termes d'un pitch initial qui est basé sur :
- le taux d'échantillonage
- la root key' (touche de base) sur laquelle l'échantillon est calé sur le clavier
- les coarse, fine, et correction tuning.
- la touche key number MIDI effective,
- le facteur d'échelle du clavier.
Boucle d'échantillon
L'oscillateur joue un échantillon numérique qui est décrit par un point de départ, point final, et deux points décrivant une loop. Le son peut être marquée comme non-bouclé (unlooped), dans ce cas, les points de boucle sont ignorés.Si le son est bouclé, il peut être lu de deux façons.
- boucle "during release " : le son est joué à partir du point de départ de la boucle, et bouclé jusqu'à ce que la note devienne inaudible.
- le son est joué à partir du point de départ de la boucle, et bouclé jusqu'à ce que la touche soit relâchée ; Dans ce cas, si le point de fin de boucle n'est pas atteint au relachement, le son se poursuit jusqu'au le point de fin de boucle et joue jusqu'à ce que le point final soit atteint pour terminer le son.
Filtre passe-bas
Le modèle de synthèse contient un filtre passe-bas à résonance, qui est caractérisé par une fréquence de coupure dynamique et une résonance fixe (Q).Le filtre est initialisé à la résonance 0 comme ayant une bande passante plate à la fréquence de coupure, puis une pente de diminution à 6 dB par octave au-dessus de cette fréquence.La résonance, si différente de 0, comprenant un pic à la fréquence de coupure, superposée à la réaction ci-dessus. La résonance est mesurée en tant que rapport en dB du pic de résonance pour le gain DC. Le gain en courant continu à une résonance correspond à la moitié de la valeur de résonance en dessous du gain en courant continu à résonance nul, d'où la hauteur de pic est la moitié de la valeur de résonance au-dessus le gain en courant continu à résonance zéro.Toutes les modulations de fréquence de coupure sont en octaves, demi-tons, et en cents.
Amplificateur de gain final
L'amplificateur final de gain agit sur la sortie du filtre, il est ajouté à l'enveloppe de volume. Une modulation supplémentaire peut également être ajouté. Le gain est toujours spécifié en dB.
Acheminement des Effets
La sortie del'amplificateur de gain final peut être acheminé vers l'unité d'effets. Cette unité implique que le son soit dans un contexte stéréo, et qu'un effet de réverbération et de chorus puissent être ajoutés. Le panoramique est spécifiée en termes de pourcentage de gauche et de droite, qui pourrait également être considéré comme un angle d'azimut. Les valeurs de réverbération et chorus sont exprimées en pourcentage appliqués sur l'amplitude du signal reçu par ces unités de 0% à 100%.
Oscillateurs basse fréquence LFO
Le modèle de synthèse prévoit deux oscillateurs basse fréquence (LFO) pour moduler le pitch, filtre cutoff, et l'amplitude.
- Le vibrato LFO qui module le pitch.
- La modulation LFO qui module l'un de ces trois paramètres.
Chaque paramètre peut être modulé de diverses valeurs, quelles soient positives ou négatives, par le LFO associé. Les modulations de pitch et cutoff sont en octaves, demi-tons, et en cents, tandis que les modulations d'amplitude sont en dB. La valeur de modulation LFO est exprimé en cents ou dB positif pour la totalité de la montée.
Générateurs d'enveloppe.
Le modèle de synthèse prévoit deux générateurs d'enveloppe :
- Le générateur d'enveloppe de volume qui contrôle l'amplificateur final de gain et par conséquent détermine le contour de volume du son.
- La modulation d'enveloppe qui peut contrôler le pitch et/ou le filtre cutoff.
- une période de retard commence au cours de laquelle la valeur d'enveloppe est égale à zéro.
- L'enveloppe s'élève alors en une courbe convexe par rapport à une valeur 1 au cours de la phase d'attaque.
- Lorsque la valeur 1 est atteinte, l'enveloppe entre dans une phase de maintien au cours de laquelle elle reste à 1.
- Lorsque la phase d'attente se termine, l'enveloppe entre dans une phase de décroissance au cours de laquelle sa valeur diminue de manière linéaire à un niveau de maintien.
- Lorsque le niveau de maintien est atteint, l'enveloppe entre en soutien de la phase au cours de laquelle l'enveloppe reste au niveau de maintien.
Les modulation de pitch et de filtre cutoff sont en octaves, demi-tons, et en cents. Ces paramètres peuvent être modulés à des degrés divers en positif ou négatif, par l'enveloppe de modulation. Le degré de modulation est exprimé en cents pour la totalité de l'échelle du pic d'attaque.
L'enveloppe de volume fonctionne en dB, avec un pic d'attaque fournissant une sortie à pleine échelle, adapté de manière appropriée par le volume initial. La valeur zéro, cependant, est en fait un gain nul. La mise en œuvre du EMU8000 prévoit 96 dB de commande d'amplitude. Lorsque 96 dB d'atténuation est atteint dans le dernier amplificateur de gain, un saut brusque à zéro le gain (dB d'atténuation infinie) se produit. Dans un système 16-bit, ce saut est inaudible.
Résumé de l'interconnexion des modulateurs
Le schéma suivant montre l'interconnexion exprimé dans la spécification du modèle de synthèse SoundFont2:
Fonctions MIDI
La réponse à certaines commandes MIDI est définie dans la norme MIDI, et n'est donc pas considérée comme faisant partie de la spécification SF2. Ces commandes MIDI ne peuvent pas être utilisés comme sources pour la mise en œuvre de modulateur.
Par souci d'exhaustivité, des réponses sont donnés ici pour la spécification version 2.00b :
- Pitch key number MIDI : dans la version 2.00a de cette spécification, c'est le paramètre "Scale Tune" dans la liste de générateur, est également considéré comme un véritable modulateur et est donc retiré de cette liste.
- MIDI Pitch Bend : dans la version 2.00a de cette spécification, il est considéré comme un véritable modulateur et est donc éliminé de cette liste.
code MIDI | libellé | description | RPN NRPN |
---|---|---|---|
0 | Bank Select | Le changement de programme suivant devrait sélectionner le programme MIDI de cette valeur de la banque à la place de la banque par défaut de 0. | RPN |
6 | Data Entry MSB | La valeur réceptionnée doit être envoyée soit au RPN ou NRPN selon le code précédent. | |
32 | Bank Select LSB | Peut se comporter en conjonction avec le code 0 Bank select pour fournir un total de 16384 programme de banques MIDI possibles. | RPN |
38 | données Entry LSB | Après réception, la valeur doit être envoyée soit au RPN ou NRPN selon la code précédent. | |
64 | Sustain | Actif lorsque supérieur ou égal à 64. Lorsque la fonction de sustain est activée, toutes les notes persistent même si un key-off est envoyé. Les commandes key-off sont stockées, et lorsque le sustain devient inactif, toutes les commandes key-off stockées sont exécutées. | RPN |
66 | soft | Actif lorsque supérieur ou égal à 64. Lorsqu'il est activé, toutes les key-on sont modulées de manière à rendre le son de la note plus doux. Touchant l'atténuation initiale et le filtre de coupure. | RPN |
67 | Sostenuto | Actif lorsque supérieur ou égal à 64. Quand il devient actif, toutes les key-on persistent dans leur état jusqu'à ce que le sostenuto deviennent inactif. Toutes les autres notes se comportent normalement. Notez que le maintien par sostenuto de key-on persiste même si un sustain est activé puis éteint, pendant sa durée. | RPN |
98 | NRPN LSB | A sa réception, le synthétiseur se met en attente de données pour traitement spécifique | NRPN |
99 | NRPN MSB | A sa réception, le synthétiseur se met en attente de données pour traitement spécifique | NRPN |
100 | RPN LSB | A sa réception, le synthétiseur se met en attente de données pour traitement | RPN |
101 | RPN MSB | A sa réception, le synthétiseur se met en attente de données pour traitement | RPN |
120 | All Sound Off | A la réception de cette valeur : toutes les notes en cours doivent s'arrêter, quelles que soient les positions sustain ou sostenuto. | RPN |
121 | Reset All Controllers | Agit tel que défini par la norme MIDI. Ce code réinitialise les valeurs des contrôleurs MIDI à l'état par défaut ou à leur valeur initiale. | RPN |
123 | All Notes Off | A la réception de cette valeur : toutes les notes key-on en cours entre immédiatement dans la phase de release, en tenant compte de leur statut de sustain ou sostenuto. | RPN |
Le modèle de générateur SoundFont
Voir la terminologie et les unités utilisées en annexe A.
Cinq types d'énumérateur de générateurs existent:
- Index Generators
- Range Generators
- Substitution Generators
- Sample Generators
- Value Generators.
- Un ensemble de générateurs ou de compensateurs de la valeur d'une destination ou d'un paramètre de synthèse. Dans des cas exceptionnels : il définit les plages (Range Generators), ou fixe des valeurs et jamais de valeurs de décalages (Index Generators, Sample Generators, et Substitution Generators).
- Un générateur est défini comme étant identique à un autre générateur si son opérateur générateur est le même dans les deux générateurs.
- Un générateur dans une global instrument zone qui est identique au générateur par défaut remplace le générateur par défaut.
- Un générateur dans une locale instrument zone qui est un générateur par défaut ou identique à un générateur dans une global instrument zone remplace ce générateur.
- Un générateur du niveau Preset s'ajoute à un générateur du niveau Instrument si les deux générateurs sont identiques.
- Un générateur dans une global Preset Zone" qui est un générateur par défaut ou identique à un générateur dans instrument'' s'ajoute à ce générateur.
- Un générateur dans une global Preset Zone qui n'est pas identique à un Value Generators par défaut et n'est pas identique à un générateur dans instrument ajoute son effet au paramètre de synthèse proposé.
- Un générateur dans une locale Preset Zone qui est identique à un générateur dans une global Preset Zone remplace le générateur de la global Preset Zone. Ce générateur ajoute ses effets au nœud de sommation-destination de toutes les zones de l'instrument donné.
- Un générateur dans une locale Preset Zone qui n'est pas identique à un générateur par défaut ou à un générateur global Preset Zone, ajoute ses effets au noeud de sommation-destination de toutes les zones de l'instrument donné.
- Si le générateur en opération est un Range Generator , les valeurs du générateur ne sont pas ajoutés à ceux du niveau instrument ; Ils servent plutôt comme un filtre intersection aux key number ou velocity ranges dans l'instrument qui est utilisé dans la Preset Zone.
- Si le générateur en opération est un Substitution Generator ou un Sample Generator , ils sont illégaux au niveau Preset. Le seul Index Generator légal à ce niveau est instrumentID, alors que le seul Index Generator légal au niveau Instrument est sampleID.
Le modèle de contrôle de modulateur Soundfont
Les modulateurs sont utilisés pour permettre le contrôle en temps réel sur le son suivant le concepteur du son programmé. Chaque instance d'une structure de modulateur SoundFont définit un effet en temps réel additionnable à appliquer à une destination donnée ou un paramètre de synthétiseur. Pour information : le schéma suivant montre la fonction générale du modèle de contrôleur SoundFont.
Le modèle de commande de modulateur SoundFont est un mécanisme polyvalent destiné à permettre un contrôle souple et complexe en temps réel sur les paramètres de synthèse fournis. Alors que SoundFont 2.00 fournit un mécanisme pour fixer les conditions initiales pour une grande variété de paramètres de synthèse ou des générateurs à plusieurs niveaux de la hiérarchie (niveau de l'instrument, les zones global/local, Preset etc...), l'ajout du contrôleur de modulateur SoundFont fournit un mécanisme pour permettre en temps réel de contrôler ces mêmes paramètres sur les mêmes niveaux de la hiérarchie.
Le modèle de commande de modulateur SoundFont est nécessaire pour transformer le modèle de synthèse à base de générateurs plutôt simplistes dans un modèle de synthèse plus complexe et beaucoup plus intéressant.
La spécification décrit en détail les interactions et le fonctionnement de ces modulateurs.
Annexe A :
Dans les exemples de codes qui suivent, tous les contrôles de validité ont été éludés pour faciliter la lecture.
type de données
Types de données utilisés dans ces exemples :
typedef unsigned char BYTE; // 1 oct 0 à 255 typedef char CHAR; // 1 oct -128 à +127 typedef unsigned int DWORD; // 4 oct 0 à 4.294.967.295 typedef short SHORT; // 2 oct -32.768 à +32.767. typedef unsigned short WORD;// 2 oct 0 à 65.535
Terminologie utilisée
Structures de données
nom | description |
---|---|
bag | Un élément de structure de données SoundFont contenant une liste de zones presets ou des zones d'instruments |
global zone globale | une zone dont les générateurs et modulateurs affectent toutes les autres zones à l'intérieur de l'objet. |
instrument | Dans la norme SoundFont, une collection de zones qui représente le son d'un instrument de musique unique ou réglage d'effet sonore. |
instrument zone | Le sous-ensemble d'un instrument contenant une référence au sample et les données de articulation associées, définies pour jouer sur certaines touches et leur vitesse. |
orphan | Il s'agit d'un instrument qui n'est pas référencé par une preset zone, ou un échantillon qui n'est pas référencée par un "instrument zone". |
preset | La collecte des échantillons et des données d'articulation, associée à un Numéro de présélection MIDI particulier . |
preset zone | Le sous-ensemble d'un preset contenant une référence à un instrument et les données d'articulation associées, définis pour jouer certaines touches avec leur vélocité. |
zone | Un objet et des données d'articulation associées, définis pour jouer certaines touches avec leur vélocité. |
Synthétiseur
nom | description |
---|---|
articulation | Le processus de modulation d'amplitude, hauteur et timbre pour produire une note musicale expressive. |
artefact | Un (généralement indésirable) événement sonore qui est reconnaissable comme n'étant pas présent dans le son original. |
attack | Phase, d'une enveloppe ou d'un son, au cours de laquelle l'amplitude augmente de zéro à une valeur de crête. |
attenuation | Une diminution du volume ou de l'amplitude d'un signal. |
balance | Une forme de commande de volume stéréo dans les canaux gauche et droit sont au maximum lorsque le contrôle est centré, et qui atténue uniquement le canal opposé lorsqu'il est pris à deux extrêmes. |
chorus | Un algorithme de traitement d'effets qui implique le déplacement cyclique de la hauteur d'un signal et le remixage avec elle-même pour produire un temps variant de filtre en peigne, donnant une impression de mouvement et la plénitude du son qui en résulte. |
cutoff | La fréquence d'une fonction de filtrage à l'atténuation qui atteint une valeur spécifiée. |
datapoints | points de données : les valeurs individuelles formant un échantillon. Parfois aussi appelés points d'échantillonnage. |
decay | La partie d'une enveloppe ou son pendant laquelle l'amplitude diminue d'une valeur crête à l'état d'équilibre. |
delay | retard : La partie d'une enveloppe ou d'une fonction LFO qui s'écoule d'un key-on (appui d'une touche) jusqu'à ce que l'amplitude différe de zéro. |
DC gain | Degré d'amplification ou d'atténuation d'un système présente une fréquence, un signal statique ou zéro. |
audio numérique | signal audio représenté comme une séquence de valeurs quantifiées régulièrement espacées dans le temps. Les valeurs sont appelées «sample data points». |
enveloppe | Un signal variable dans le temps qui commande généralement la hauteur, le volume et/ou la fréquence de coupure du filtre d'une note, et comprend plusieurs phases incluant Attack, Decay, Sustain, puis release. |
interpolateur | Un circuit ou un algorithme qui calcule les points intermédiaires entre les points de données échantillons existants. Il s'agit de utilisation particulière dans l'opération de pitch shifting d'un synthétiseur à table d'onde, dans lequel ces points intermédiaires représentent les échantillons de sortie de la forme d'onde à la transposition de la hauteur souhaitée. |
LFO | Acronyme pour Low Frequency Oscillator. Une source de modulation périodique lente. |
Loop | boucle : une partie d'un échantillon qui est répété plusieurs fois pour augmenter la durée du son résultant. |
loop points | points de boucle : les datapoints de l'échantillons au cours de laquelle une boucle commence et finit. |
note-on | (key-on) MIDI : début de la séquence d'appui sur une touche. |
note-off | (key-off) MIDI : fin de la séquence d'appui de la touche. |
pôle | Un terme mathématique utilisé dans le filtre d'analyse de transformation. Traditionnellement, en synthèse, un pôle est assimilée à une atténuation de 6dB par octave, et l'atténuation d'un filtre est spécifié en "pôle". |
preset | Collecte des échantillons et des données d'articulation associé à un numéro particulier de présélection MIDI. |
release | La partie d'une enveloppe ou son, pendant laquelle l'amplitude diminue à partir d'un état d'équilibre vers la valeur zéro. |
résonance | décrit l'aspect d'un filtre dans lequel les fréquences particulières sont données avec beaucoup plus de gain que les autres. La résonance peut être mesurée en dB au-dessus du gain DC. |
fréquence de résonance | La fréquence à laquelle la résonance atteint son maximum. |
réverb | raccourci pour réverbération. En synthèse, un processus de signal synthétique qui ajoute l'espace artificiel et l'ambiance pour un son. |
sample | échantillon : Ce terme est souvent utilisé à la fois pour indiquer un "sample data points" et pour indiquer une collection de tels points comprenant une forme d'onde audio numérique. Ce dernier sens est exclusivement utilisé dans cette spécification. |
unpitched | Se dit d'un son qui n'est pas caractérisé par une fréquence perçue. |
velocity | vitesse : En synthèse, la rapidité avec laquelle une touche du clavier est enfoncée, généralement proportionnelle à l'impact donné par le musicien. |
wavetable | table d'onde : Une technique de synthèse de la musique où les sons musicaux sont enregistrés ou calculée mathématiquement et stockée dans un mémoire, puis lues à un taux variable afin de produire la hauteur désirée. Ajustements de timbre supplémentaires sont souvent faites pour le son ainsi produit en utilisant des amplificateurs, les filtres et le traitement des effets tels que la réverbération et de chorus. |
Paramètres
Unités utilisées :
nom | description |
---|---|
absolu | Décrit un paramètre qui donne une valeur définitive. Contrairement au relatif. |
Additif | décrit un paramètre qui doit être numériquement ajouté à un autre paramètre. |
atténuation | Une diminution du volume ou de l'amplitude d'un signal. |
bipolaire | se dit d'un dispositif de commande qui a une valeur minimum de -1 et une valeur maximale de +1. |
cent | Unité de rapport de pas correspondant à la racine douze centièmes de deux, ou un centième de demi-ton, environ 1,000577790. |
centibel | Unité de rapport d'amplitude correspondant à la racine deux centième de dix, soit un dixième de décibel, environ 1,011579454. |
cutoff | fréquence de coupure : la fréquence d'une fonction de filtrage à l'atténuation qui atteint une valeur spécifiée. |
décibel | Unité de rapport d'amplitude correspondant à la racine vingtième de dix, environ 1,122018454. |
octave | un facteur de deux dans un rapport, généralement appliquée à la hauteur ou la fréquence. |
pitch | Valeur audible de la fréquence. Peut être utilisé de façon interchangeable avec la fréquence. |
Pitch Shift | Un changement de pitch. La Synthèse à échantillon repose sur des interpolations de pitch dans un échantillon pour produire les notes de la gamme. |
relatif | Décrit un paramètre qui indique simplement une valeur de décalage d'une valeur déjà établie. Contraire de absolu. |
fréquence d'échantillonnage | La fréquence, en Hertz, où les datapoints d'échantillons sont prélevés lors de l'enregistrement d'un échantillon. |
demi-ton | Unité de rapport de pas correspondant à la racine douzième de deux, ou un douzième d'une octave, environ 1,059463094. |
Sharp | Se dit d'un ton qui est plus aigu en tonalité qu'un autre de même référence. |
timecent | Unité de ratio de durée correspondant à la période de douze racine centième de deux, ou de douze centième d'une octave, environ 1,000577790. |
unipolaire | Se dit d'un contrôleur qui a une valeur minimale de 0 et une valeur maximale de +1. Contraire de «bipolaire» |
Unités des paramètres de générateur
Les unités avec lesquelles les générateurs SoundFont sont décrits sont strictement définies.
ABSOLUTE SAMPLE DATA POINTS | un index numérique de 16 bits type du data points de l'échantillon tel qu'il est stocké dans la mémoire ROM ou fournie dans le smpl. |
RELATIVE SAMPLE DATA POINTS | un déplacement de 16 bits basé sur une référence en data point absolu. Une valeur négative indique déplacement vers le début des données. |
ABSOLUTE SEMITONES | Demi-tons absolu : une mesure logarithmique absolue de fréquence basée sur une référence de MIDI key number. Un demi-ton est 1/12 d'une octave, et la valeur 69 est de 440 Hz (A-440). Les valeurs négatives et des valeurs supérieures à 127 sont autorisées. |
RELATIVE SEMITONES | Une mesure logarithmique relative du taux de fréquence basée sur les unités de 1/12 d'octave, qui est la racine douzième de deux, environ 1,059463094. |
ABSOLUTE CENTS | une mesure logarithmique absolue de fréquence basée sur une référence de MIDI key number échelonnée jusque 100. Un cent est de 1/1200 sur une octave, et la valeur 6900 est de 440 Hz (A-440). Les valeurs négatives et des valeurs supérieures à 12700 sont autorisés. |
RELATIVE CENTS | Une mesure logarithmique relative du taux de fréquence basé sur des unités de 1/1200 sur une octave, qui est la racine douze centièmes de deux, environ 1,000577790. |
ABSOLUTE CENTIBELS | une mesure absolue de l'atténuation d'un signal, basé sur une référence à zéro sans atténuation. Un centibel est un dixième de décibel, ou un rapport de l'amplitude du signal de la racine deux centième de 10, approximativement 1,011579454. |
RELATIVE CENTIBELS | une mesure relative de l'atténuation d'un signal. Un centibel est un dixième de décibel, ou un rapport de l'amplitude du signal de la racine deux centième de 10, approximativement 1,011579454. |
ABSOLUTE TIMECENTS | Une mesure absolue de temps, basé sur une référence de zéro et représentant une seconde. Un timecent représente un ratio dans le temps de la racine douze centième de deux, environ 1,011579454. |
RELATIVE TIMECENTS | Une mesure relative du ratio de temps, basée sur la taille de l'unité de ma racine douze centième de deux, environ 1,011579454. |
ABSOLUTE PERCENT | Une mesure absolue du gain, basé sur une référence de l'unité. En SF2, elle est donnée en unités de 0,1%, donc une valeur de zéro est 0% et une valeur de 1000 donne 100%. |
RELATIVE PERCENT | Pourcentage relatif, une mesure relative de la différence de gain. En SF2, elle est donnée en unités de 0,1%. Lorsque le gain devient négatif, il est supposé = 0; lorsque le gain est supérieur à 100%, la valeur 100% est utilisée. |
Annexe B
exemples
lecture d'un bloc de fichier RIFF.
struct enrg_de_bloc{ DWORD A,B,C;};// taille enrg : 12 octets enrg_de_bloc donnee; QFile fichierRIFF( "banqueson.sf2" ); fichierRIFF.open( QIODevice::ReadOnly ); int nb_octet_retourne = fichierRIFF.read( (char *) &donnee, 12 ); fichierRIFF.close();
Décryptage d'un fichier SF2
[+]Exemple de lecture d'un fichier SF2
[+]Liens et commentaires
La version anglaise des spécifications techniques de la soundfont 2.04 se trouvent ici