analyse_signal.tex
15.5 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
\section{Méthodes de décomposition du signal}
Les composantes du signal de PIC peuvent être isolées au moyen de méthodes de différentes méthodes de décomposition. Dans la littérature, deux grandes familles d'algorithmes sont identifiables. La première correspond aux décompositions linéaires issues de la transformée de Fourier ; la seconde, plus récente, regroupe la décomposition en modes empiriques (\textit{Empirical Mode Decomposition}, EMD) et ses dérivés. Pour la suite, on considère un signal $s \in L^{2}({\mathbb{R})}$.
\subsection{Décompositions linéaires}
\subsubsection{Transformée de Fourier}
\subsubsection{Ondelettes}
\subsection{Décompositions en modes}
Les algorithmes de décomposition en modes (ADM) regroupent une vaste famille d'algorithmes dérivés de la publication originale de Huang \textit{et al.} introduisant la décomposition en modes empiriques (\textit{Empirical Mode Decomposition}, EMD)\cite{}. L'idée proposée est de décomposer un signal donné en oscillations élémentaires qui ne soient pas issus d'une base vectorielle prédéfinie \textit{a priori}, comme dans le cas de la transformée de Fourier et de ses différentes généralisations. Ce changement de paradigme a pour objectif de développer un outil adapté à l'étude de signaux non-stationnaires (c'est-à-dire, d'espérance et de variance variables dans le temps) et/ou résultant de la combinaison non-linéaire de différentes composantes. Ainsi, ces algorithmes extraient de façon itérative des fonctions de mode intrinsèques (\textit{intrinsic mode functions}, IMFs) du signal de base, oscillations élémentaires spécifiques à un signal respectant les propriétés suivantes :
\begin{enumerate}
\item Le nombre d'extrema et le nombre de traversées de l'axe des abscisses doivent différer au plus de 1 (ou, par équivalence : tous les maxima locaux doivent être strictement positifs et tous les minima locaux doivent être strictement négatifs).
\item En tout point, la moyenne de l'enveloppe définie par les maxima locaux et les minima locaux être égale à 0.
\end{enumerate}
Dans la pratique, une IMF est donc une fonction pseudo-périodique localement symétrique par rapport à l'axe des abscisses, dont la durée et l'amplitude des oscillations peuvent varier au cours du temps. En gardant à l'esprit que les ADMs sont conçus pour l'étude de signaux non-stationnaires, ces propriétés sont utiles par la suite pour définir les notions d'amplitude et de fréquences locales, voire instantanées, que les définitions classiques ne peuvent couvrir du fait du principe d'indétermination temps-fréquence. Cependant, cette flexibilité implique la perte de certaines propriétés des méthodes linéaires. Dans le cas général, pour deux signaux $s$ et $z$ et un $ADM$ quelconque, $ADM(s + z) \neq ADM(s) + ADM(z)$. L'unicité de la décomposition en IMFs n'est pas non plus assurée : plusieurs décompositions valides peuvent être obtenues à partir d'un même signal. Enfin, l'orthogonalité des IMFs extraites et la conservation de l'énergie du signal initial dépendent des ADMs.
\subsubsection{Décomposition en modes empiriques}
\paragraph{Formulation.} En 1998, Huang \textit{et al.} proposent l'EMD pour extraire itérativement les IMFS d'un signal~\cite{huang1998empirical}. Celle-ci repose sur le calcul d'enveloppes du signal, qui correspondent à une interpolation cubique entre les différents maxima (minima) locaux. La méthode d'extraction des IMFs est décrite dans l'algorithme~\ref{algo:EMD}.
\begin{algorithm}[h!]
\label{algo:EMD}
\caption{Décomposition en modes empiriques (EMD)}
\Entree{signal \textit{s}}
\Sortie{ensemble d'IMFs}
IMFs = \{\}\;
\Tq{le nombre d'extrema de $s \leq 2$}{
{
$e_{+} \leftarrow$ enveloppe supérieure de $s$\;
$e_{-} \leftarrow$ enveloppe inférieure de $s$\;
$ m \leftarrow (e_{-} + e_{+} )/ 2 $\;
\Tq{$m$ n'est pas accepté comme IMF}{
$e_{+} \leftarrow$ enveloppe supérieure de $s - m$\;
$e_{-} \leftarrow$ enveloppe inférieure de $s - m$\;
$ m \leftarrow (e_{-} + e_{+} ) / 2 $\;
}
$ IMFs \leftarrow IMFs \cup \{m\} $\;
$ s \leftarrow s - m $\;
}
}
\end{algorithm}
Bien que jamais mise en défaut en pratique, la convergence de la procédure d'extraction d'une IMF n'a jamais pu être démontrée, limitant de fait l'étude des propriétés mathématiques de l'EMD (). Ces travaux précurseurs ont cependant donné lieu à de très nombreuses extensions, notamment dans les domaines complexes, multivariés et multidimensionnels (). L'EMD a été adoptée dans différents domaines d'application impliquant des signaux non-stationnaires et/ou des systèmes non-linéaires, de la sismologie () à l'étude d'électroencéphalogrammes (). En ce qui concerne l'analyse du signal de PIC, l'EMD a principalement été utilisée en tant que pré-traitement pour la suppression d'irrégularités ponctuelles ()(). Certaines évolutions de l'algorithme original visent à contourner des limitations de l'EMD bien identifiées dans la littérature, publication originale comprise. Parmi les problématiques les plus saillantes~\cite{de2022survey}, il convient de citer:
\begin{itemize}
\item Le mélange des modes (\textit{mode mixing}) : ce problème correspond aux situations où deux composantes de fréquences distinctes sont contenues dans une même IMF. Rilling et Flandrin () ont étudié formellement le problème pour deux composantes sinusoïdales en faisant varier les ratios d'amplitude et de fréquences. Pour ce modèle en particulier, en notant $a$ le ratio des amplitudes et $f$ le ratio des fréquences, la capacité de séparation de l'EMD est limitée à des couples d'oscillations pour lesquelles $f$ < ~0.6 et $a < 1/f$. Différentes corrections ont été proposées pour limiter ce problème de façon empirique. En particulier, l'EMD d'ensemble (\textit{Ensemble EMD}, E-EMD) consiste à répéter plusieurs fois l'algorithme de $sift$ en perturbant légèrement le signal initial au moyen d'un bruit aléatoire, et de prendre les IMFs médianes des différentes décompositions obtenues.
\item Le fractionnement des modes (\textit{mode splitting}) : une même composante fréquentielle peut être fractionnée sur plusieurs IMFs adjacentes si les conditions d'acceptation d'une IMF sont trop contraignantes (). De nombreux critères ont été proposés dans la littérature, comme la distance euclidienne entre les résultats de deux itérations consécutives (), la différence dans le nombre d'extrema () ou encore l'orthogonalité avec le signal avant extraction(). Cependant, comme l'existence d'une limite explicite vers laquelle tendrait le processus d'extraction n'a pas été prouvée, il reste peu aisé d'exhiber un critère d'arrêt optimal.
\item Les effets des extrémités : le calcul des enveloppes, basé sur une interpolation entre les différents extrema, est perturbé au début et à la fin du signal. L'erreur introduite, difficile à quantifier, dépend des implémentations du calcul des enveloppes. Les différentes solutions proposées consistent globalement à étendre le signal à ses extrémités de manière plus ou moins complexe ()()().
\end{itemize}
\paragraph{Fréquences instantanées.} Les propriétés vérifiées par les IMFs ont été choisies de façon à définir des fréquences instantanées par le biais de la transformée de Hilbert, s'affranchissant ainsi du principe d'incertitude temps-fréquence inhérent à l'analyse de Fourier et ses dérivés. La transformée de Hilbert $H$ est définie telle que :
\begin{equation}
\mathcal{H}(s)(x) = \frac{1}{\pi} v.p. \int_{\mathbb{R}} \frac{s(\tau)}{x-\tau}\, d\tau
\end{equation}
où $v.p.$ désigne la valeur principale de Cauchy. La transformée de Hilbert est plus facilement calculée dans le domaine fréquentiel, celle-ci revient à multiplier par $i$ les termes de fréquences négative et $-i$ les termes de fréquences positive:
\begin{equation}
\widehat{\mathcal{H}(s)}(\xi) = -i\text{ sign}(\xi)\cdot \hat{s}({\xi})
\end{equation}
La transformée de Hilbert prolonge un signal réel $X$ en un signal analytique $Z$ dans le plan complexe tel que $\mathcal{H}(X) = Z : t \rightarrow X(t) + iY(t) = a(t)e^{i\phi(t)}$. En considérant la forme exponentielle du signal analytique $Z(t) = a(t)e^{i\phi(t)}$, l'amplitude instantanée est correspond au terme $a(t)$, la phase instantanée au terme $\phi(t)$ et la fréquence instantanée $\omega(t)$ à la dérivée $\frac{d\phi(t)}{dt}$. Les propriétés des IMFs permettent de conserver certaines caractéristiques de la définition classique de la fréquence, par exemple d'obtenir une fréquence instantanée constante pour une IMF parfaitement sinusoïdale.
\paragraph{Spectre de Hilbert.} En appliquant la transformée de Hilbert à chacune des $n$ IMFs extraites d'un signal $s$, on obtient la relation
\begin{equation}
s(t) = \text{Re}{\sum_{k=1}^{n}a_{k}(t)e^{i\phi(t)}}
\end{equation}
où Re désigne la fonction partie réelle. Par analogie avec la transformée de Fourier, il est possible de définir un spectre bivarié temps-fréquence, ou spectre de Hilbert tel que pour une temps $t$ et une fréquence $\omega$ :
\begin{equation}
H(\omega, t) = \sum_{k=1}^{n}a_{k}(t)e^{i\int\omega_{k}(t)\,dt}
\end{equation}
En divisant le plan (temps, fréquences) en rectangles de dimensions $\delta t, \delta \xi$, la densité spectrale $S$ est définie pour le rectangle de coordonnées $a,b$ par:
\begin{equation}
S_{a,b} = \frac{1}{\Delta t \times \Delta \omega} ( \sum a_k^2(t) : t \in ( t_a - \frac{\Delta t}{2}, t_a + \frac{\Delta t}{2}), \omega \in ( \omega_b - \frac{\Delta \omega}{2}, \omega_b + \frac{\Delta \omega}{2}))
\end{equation}
Les graphiques obtenus à partir du spectre de Hilbert permettent ainsi de suivre l'évolution du contenu fréquentiel d'un signal non-stationnaire.
\subsubsection{Filtrage itératif}
\paragraph{Formulation.} Pour pallier aux différents manquements théoriques de l'EMD, la méthode du filtrage itératif (\textit{Iterative Filtering}, IF) a été proposée en 2009 (). Cette décomposition reprend le principe de construction itérative d'IMFs, en utilisant cette fois des moyennes glissantes à la place des enveloppes pour le processus d'extraction. L'algorithme est présenté ici dans sa version rapide (\textit{Fast Iterative Filtering}, FIF, voir algorithme~\ref{algo:FIF}), accélérée en effectuant les opérations de convolution dans le domaine fréquentiel. Le processus de FIF est d'une complexité en temps comparable à l'EMD, en $O(nlog(n))$, où $n$ est la taille du signal décomposé, contre $O(n^{2})$ pour la version IF.
\begin{algorithm}[h!]
\label{algo:FIF}
\caption{Filtrage itératif rapide (FIF)}
\Entree{signal \textit{s}}
\Sortie{ensemble d'IMFs}
IMFs = \{\}\;
\Tq{le nombre d'extrema de $s \leq 2$}{
{
Déterminer un filtre $w$ de taille $L$;
$\hat{s} \leftarrow dft(s)$\;
$\hat{w} \leftarrow dft(w)$\;
$m \leftarrow 1$\;
$\hat{s}_{m} \leftarrow \hat{s}$\;
\Tq{$s_{m}$ n'est pas accepté comme IMF}{
$\hat{s}_{m} = I - \text{diag}(\hat{w})^{m}\hat{s}$\;
$ m \leftarrow m+ 1 $\;
}
$ IMFs \leftarrow IMFs \cup \{s_{m}\} $\;
$ s \leftarrow s - idft(s_{m}) $\;
}
}
\end{algorithm}
Le processus de (F)IF peut être adapté au signal étudié en jouant sur les coefficients des moyennes glissantes -c'est à dire les filtres- utilisés. Une analyse théorique poussée du processus de (F)IF est rendue possible par l'existence d'une limite explicite au processus d'extraction $\mathcal{M}$ de la première IMF:
\begin{equation}
\label{eq:IMF}
IMF_{1} = \underset{n \rightarrow \infty}{M^{n}}(s)(x) =
\int_{\mathbb{R}} \hat{s}(\xi)\chi_{\{\hat{w}(\xi=0)\}}e^{i2\pi\xi x} \,d\xi
\end{equation}
où $\hat{s}$ désigne la transformée de Fourier du signal $s$ et $\hat{w}$ la transformée de Fourier du filtre $w$. La limite décrite dans l'équation \ref{eq:IMF} est garantie pour un filtre pair, positif, à support compact dans $\mathbb{R}$ et de somme 1. La décomposition est rendue non-linéaire par la définition d'un nouveau filtre à chaque début d'extraction d'une IMF. Si le choix des coefficients et de la taille du filtre revient à l'utilisateur, les auteurs recommandent de calculer la taille $L$ d'un filtre à partir de l'espacement moyen entre deux extrema consécutifs selon la formule : $L = 2\lfloor \nu \frac{\text{taille du signal}}{\text{nombre d'extrema}} \rfloor$, où $\nu$ est un paramètre à déterminer, généralement entre 1 et 2 (). Différentes propriétés du processus de (F)IF ont pu être étudiées théoriquement. En particulier:
\begin{itemize}
\item Séparation des fréquences : pourvu que la taille du filtre soit choisie de façon appropriée, le procédure de FIF peut séparer deux signaux sinusoïdaux purs de fréquences aussi proches que souhaité tant que $f < 1 - \frac{1}{n}$, où $f$ est le ratio des fréquences et $n$ la longueur des signaux en nombre de périodes.
\item Conservation de l'énergie : la transformée de Fourier vérifie, dans le cas discret, la propriété $\sum_{n=0}^{N-1} \|s(n)\|^{2} = \frac{1}{N}\sum_{\xi} \|\hat{s}(\xi)\|^{2}$ (Théorème de Parseval-Plancherel). En comparaison, la procédure de (F)IF conserve l'énergie de Fourier de norme 1: $E_{1}(s) = \sum_{\xi}\hat{s}(\xi)$ ().
\item Orthogonalité des IMFs : comme pour l'EMD et ses dérivées, l'exacte orthogonalité ne peut pas être garantie dans le cas général, les IMFs n'étant pas générées dans un espace vectoriel prédéfini. Différentes analyses numériques montrent cependant qu'en pratique, les IMFs extraites par EMD comme par IMFs sont quasi-orthogonales, le choix du paramètre $\nu$ pouvant même faire l'objet d'une optimisation à ce sujet ()().
\item Effets des extrémités : la procédure de FIF suppose une périodicité du signal à ses extrémités (). Dans le cas contraire, des artefacts de calcul apparaissent de façon quantifiable () aux bornes des IMFs extraites, en particulier dans les basses fréquences. Les auteurs préconisent d'étendre le signal à ses extrémités en jouant sur des symétries de façon à introduire une périodicité aux bornes du signal traité ().
\end{itemize}
\paragraph{IMFogramme.}
Les méthodes de calcul de fréquences instantanées basées sur la transformée de Hilbert peuvent également s'appliquer aux IMFs extraites par (F)IF, les auteurs proposent une autre représentation temps-fréquence n'impliquant pas de prolongation du signal dans le plan complexe (). Celle-ci suppose cependant l'absence de modulation du signal à l'échelle d'une période.
\begin{itemize}
\item amplitude instantanée : soit $g$ une interpolation (linéaire par exemple) des maxima locaux de la valeur absolue d'une IMF. L'amplitude instantanée de cette IMF est alors définie telle que $A : t \rightarrow max(g(t), IMF(t))$.
\item fréquence instantanée : soient $(z_{k})_{k=1}^{p}$ les positions des $p$ croisements d'une IMF avec l'axe des abscisses. On note $y_{k} = \frac{1}{z_{k+1}}$ l'inverse de la durée de la $k$-ème demi-oscillation. La fréquence instantanée de cette IMF de taille N est définie par l'interpolation (linéaire par exemple) de la fonction $f : k \rightarrow 2y_{k}$ sur l'intervalle $[z_{0}, z_{p-1}]$. La fréquence instantanée peut être prolongée sur l'ensemble de l'IMF en posant $z_{0} = 1$ et $z_{p+1} = N$.
\end{itemize}
L'IMFogramme (\textit{Imfrogram}) est une représentation obtenue sur le plan (temps, fréquences) séparé en rectangles de dimensions $\Delta t \times \Delta f$. La valeur de chaque rectangle correspond à la somme des amplitudes moyennes de chacune des IMFs sur ce rectangle.