Ircam AudioPrint : Calcul des Empreintes Sonores et Choix des Paramètres
Abstract
Dans le contexte de l’indexation audio, le travail présenté par ce document concerne le calcul de nouvelles empreintes sonores. L’objectif est d’une part la robustesse naturelle à certains types de dégradations sonores, et d’autre part de contenir de l’information musicale pertinente, contrairement à d’autres approches de la littérature. En effet, nous verrons que les données obtenues renseignent d’une certaine manière sur la variation temporelle du timbre. Même si l’application visée est ici l’identification audio, notons que ces nouvelles empreintes sonores peuvent être utilisées comme descripteurs audio pour d’autres tâches. Dans ce rapport, la méthode de calcul est présentée en détail, ainsi que les différentes propriétés de robustesse à certaines altérations ciblées. La liste des paramètres est aussi donnée et leurs valeurs seront déterminées par une procédure d’évaluation de la robustesse.
Domains
Signal and Image Processing
Fichier principal
Mignot-2016_-_IRCAM_rapport-AudioPrints_-_HD_audio_keys.pdf (845.1 Ko)
Télécharger le fichier
Origin | Files produced by the author(s) |
---|