gspeech
Dans le cadre de la distribution Primtux (mais la vocation est plus large), je maintiens et améliore sporadiquement le logiciel gSpeech.
C'est une GUI qui se base sur la synthèse vocale Pico SVOX.
J'ai migré le soft vers python3, ajouté un mode cli et j'essai d'ajouter un peu d'intelligence pour que la lecture en français soit plus fluide et compréhensible.
Ce dernier point me donne un peu de fil à retordre car une modif peut facilement entraîner des régressions.
J'ai donc commencé à mettre en place de l'intégration continue CI avec des tests automatisés.
Je souhaitais, dans l'idéal, vérifier des empreintes de fichiers sons produits.
En local, ça fonctionne pas si mal.
En revanche, en utilisant des outils tel que travis-CI, je me rend compte que les fichiers générés peuvent changer d'une machine à l'autre (j'ai réussi à avoir un fichier différent avec virtualbox mais pas avec docker) sans savoir exactement pourquoi.
Les fichiers wav produisent sont (à l'oreil) sensiblement les mêmes et on se retrouve avec des données assez proches :
même taille du fichier, même bit rate, même encoding, sample rate, duration.
Si je fais un hexdump des 2 fichiers, les diffs sont trop importantes pour que j'en dire une quelconque conclusion.
Ma question : existe-il des outils (lib ou cli) permettant soit :
1. fournir un hash sur les principales composantes d'un fichier son
2. comparer 2 fichiers sons avec un seuil de tolérance
Merci d'avance de votre aide !
C'est une GUI qui se base sur la synthèse vocale Pico SVOX.
J'ai migré le soft vers python3, ajouté un mode cli et j'essai d'ajouter un peu d'intelligence pour que la lecture en français soit plus fluide et compréhensible.
Ce dernier point me donne un peu de fil à retordre car une modif peut facilement entraîner des régressions.
J'ai donc commencé à mettre en place de l'intégration continue CI avec des tests automatisés.
Je souhaitais, dans l'idéal, vérifier des empreintes de fichiers sons produits.
En local, ça fonctionne pas si mal.
En revanche, en utilisant des outils tel que travis-CI, je me rend compte que les fichiers générés peuvent changer d'une machine à l'autre (j'ai réussi à avoir un fichier différent avec virtualbox mais pas avec docker) sans savoir exactement pourquoi.
Les fichiers wav produisent sont (à l'oreil) sensiblement les mêmes et on se retrouve avec des données assez proches :
même taille du fichier, même bit rate, même encoding, sample rate, duration.
Si je fais un hexdump des 2 fichiers, les diffs sont trop importantes pour que j'en dire une quelconque conclusion.
Ma question : existe-il des outils (lib ou cli) permettant soit :
1. fournir un hash sur les principales composantes d'un fichier son
2. comparer 2 fichiers sons avec un seuil de tolérance
Merci d'avance de votre aide !