Modèles de déformation de processus stochastiques généralisés. Application à l'estimation des non-stationnarités dans les signaux audio. - TEL - Thèses en ligne
Nothing Special   »   [go: up one dir, main page]

Thèse Année : 2015
Deformation models of generalized stochastic processes. Application to the estimation of nonstationarities in audio signals. Modèles de déformation de processus stochastiques généralisés. Application à l'estimation des non-stationnarités dans les signaux audio.
1 LATP - Laboratoire d'Analyse, Topologie, Probabilités (39 rue Joliot-Curie 13453 Marseille Cedex 13 - France)
"> LATP - Laboratoire d'Analyse, Topologie, Probabilités
Harold Omer
  • Fonction : Auteur
  • PersonId : 941247

Résumé

Generalized stochastic processes, nonstationarity model , time-warping, frequency modulation, audio signal processing, tempered distribution, Time-frequency, Time-scale
This manuscript deals with the modeling and estimation of certain non-stationarities in audio signals. We are particularly interested in a sound class models which we call dynamic*timbre in which a stationary signal, associated with the physical phenomenon causing the sound, is deformed over time by a linear unitary operator, called deformation operator, associated with the temporal evolution of the characteristics of this physical phenomenon. Audio signals are modeled as generalized Gaussian processes. We give first a set of mathematical tools that extend some classical notions used in signal processing in case of generalized stochastic processes. We then introduce the two deformations operators studied in this manuscript. The frequency modulation operator is the multiplication operator by a complex-valued function of unit module and the time-warping operator is the unit version of the composition operator by a bijective function. When these operators act on generalized stationary processes, deformed process are non-stationary generalized process which locally have stationarity properties and deformation operators can be approximated by translation operators in the time-frequency plans and time-scale. We give accurate versions of these approximations, as well as bounds for the corresponding approximation errors. Based on these approximations, we develop an approximated maximum likelihood estimator of the warping and modulation functions. The proposed algorithm is tested and validated on synthetic signals. Its application to natural sounds confirm the validity of the timbre*dynamic model in this context
Cette thèse porte sur la modélisation et l'estimation de certaines non-stationnarités dans les signaux audio. Nous nous intéressons particulièrement à une classe de modèles de sons que nous nommons timbre -dynamique dans lesquels un signal stationnaire, associé au phénomène physique à l'origine du son, est déformé au cours du temps par un opérateur linéaire unitaire, appelé opérateur de déformation, associé à l'évolution temporelle des caractéristiques de ce phénomène physique. Le timbre du son est alors caractérisé par le spectre du processus stationnaire initial tandis que la composante dynamique du son est complètement caractérisée par l'opérateur de déformation. Les signaux audio sont modélisés comme des processus gaussiens généralisés et nous donnons dans un premier temps un ensemble d'outils mathématiques qui étendent certaines notions classiques utilisées en traitement du signal (transformation de Fourier, transformation de Mellin, signal analytique...) au cas des processus stochastiques généralisés. Nous introduisons ensuite les deux opérateurs de déformations étudiés dans ce manuscrit (modulation de fréquence et changement d'horloge et nous donnons des conditions suffisantes pour que ces opérateurs soient des endomorphismes sur l'espace des distributions tempérées. L'opérateur de modulation fréquentielle est l'opérateur de multiplication par une fonction à valeurs complexes de module unité, et l'opérateur de changement d'horloge est la version unitaire de l'opérateur de composition par une fonction bijective. Lorsque ces opérateurs agissent sur des processus stationnaires généralisés, les processus déformés sont des processus généralisés non-stationnaires, qui possèdent localement des propriétés de stationnarité lorsque les déformations varient lentement. Les transformées temps-fréquence et temps-échelle permettent alors d'exploiter ces propriétés de stationnarité locale, car sous certaines conditions, ils peuvent être approximés par des opérateurs de translation dans les plans temps-fréquence et temps-échelle, respectivement. Nous donnons des versions précises de ces approximations, ainsi que des bornes pour les erreurs d'approximation correspondantes. Plus précisément, certains théorèmes portent sur l'approximation des champs stochastiques non stationnaires eux mêmes tandis que d'autres portent sur l’approximation de leurs fonctions de covariances. Dans ce dernier cas, nous montrons que la déformation se ramène à une translation le long des diagonales des covariances des transformée temps-fréquence et temps-échelle des processus déformés. En nous basant sur ces approximations, nous développons un estimateur de maximum de vraisemblance approché des fonctions de dilatation et de modulation, ainsi que des caractéristiques du processus stationnaire sous-jacent. Appliqué à des signaux audio non stationnaires, cet algorithme fournit une estimation conjointe des composantes timbre et dynamique du son. L'algorithme proposé est testé et validé sur des signaux synthétiques. Son application à des sons naturels permet de confirmer la validité du modèle timbre-dynamique dans ce contexte.
Fichier principal
Vignette du fichier
These_OMER.pdf (3.4 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-01218644 , version 1 (21-10-2015)
Identifiants
  • HAL Id : tel-01218644 , version 1

Citer

Harold Omer. Modèles de déformation de processus stochastiques généralisés. Application à l'estimation des non-stationnarités dans les signaux audio.. Traitement du signal et de l'image [eess.SP]. Université d'Aix Marseille, 2015. Français. ⟨NNT : ⟩. ⟨tel-01218644⟩
192 Consultations
153 Téléchargements

Partager

More