FRAMATOME : DÉTECTION NON-SUPERVISÉE D'ANOMALIES DANS LES SÉRIES TEMPORELLES, REVUE ET COMPARAISON D'ALGORITHMES (F/H)

Poste
Stage (6 mois)
Niveau d'étude
Bac+5 (Master / Ingénieur)
Univers
Nucléaire, Energie
Localisation
Chatou (78, Yvelines)

Inscrivez-vous !

En vous inscrivant sur Engagement Jeunes, recevez les offres qui vous correspondent et rendez vous visible des recruteurs.

Missions

Avec le développement des technologies numériques (dont l’internet des objets et les architectures de données Big Data) et l’explosion des capacités de stockage des données informatiques, les larges collections de séries temporelles deviennent une réalité dans un grand nombre de domaines, comme la finance, les sciences de l’environnement, la médecine, les métiers du numérique, l’ingénierie ou l’industrie. Il y a donc un intérêt et un besoin croissants de développer des techniques efficaces pour traiter et analyser ce type de données.

Dans le contexte de la surveillance et de la maintenance des matériels industriels, la détection précoce d’anomalies dans les séries temporelles est cruciale pour prévenir les dysfonctionnements. Pour cela, les algorithmes non-supervisés semblent prometteurs car ils ne nécessitent pas d’annotations préalables des anomalies, ce qui est avantageux pour la découverte de nouveaux défauts encore non rencontrés.

L’analyse des séries temporelles fait l’objet de travaux de recherche intensifs ces dernières années. Il est donc essentiel d’assurer une veille bibliographique continue et d’identifier, parmi toute la production scientifique, les développements les plus prometteurs, pour ensuite les tester et évaluer leurs performances sur des jeux de données de référence. Le stage s’inscrit dans cet objectif de veille active et de benchmark.

À cette fin, il s’articulera selon plusieurs phases :

1) Recherche de bases de données annotées (simulées ou réelles) mises à disposition de la communauté, comme Exathlon, ODDS ou TSB-UAD.

2) Revue de littérature des algorithmes de détection non-supervisée d’anomalies dans les séries temporelles (préférentiellement multivariées, c’est-à-dire sur plusieurs dimensions, comme des mesures issues de multiples capteurs installés sur différents équipements) et construction d’une taxonomie tenant compte, entre autres, des deux critères suivants : principe de l’approche (par densité, par distance, par reconstruction…) et capacité à gérer des flux continus.

3) Récupération des codes existants et/ou implémentation informatique des algorithmes identifiés comme à fort potentiel suite à l’état de l’art réalisé à l’étape 2) , puis mise en œuvre et évaluation de leurs performances à partir des données annotées recensées lors de la phase 1) .

4) Comparaison, analyse critique et synthèse des résultats obtenus.

5) Rédaction du rapport de stage.

À noter qu’en perspective un sujet de thèse pourrait être ouvert à la suite du stage. Il élargira son périmètre dans l’objectif de lever les limites des algorithmes actuels, en particulier dans un objectif de détection non-supervisée d’anomalies dans des flux continus de séries temporelles multivariées.

Profil recherché

Étudiant.e de M2 (mathématiques appliquées / probabilités-statistiques-machine learning) ou d’écoles d’ingénieur.e.s (généralistes avec majeure en mathématiques appliquées / probabilités-statistiques-machine learning) .

Compétences requises :

  • Solides compétences en probabilités, statistiques, machine learning et analyse numérique
  • Goût pour la programmation (Python, R)
  • Aisance dans la communication, orale et écrite, en français et/ou en anglais

Aptitudes personnelles souhaitées :

  • Goût pour la recherche (méthodologies, concepts mathématiques, applications industrielles)
  • Ouverture d'esprit, curiosité et capacité à être autonome

Stage de 6 mois à compter de septembre 2024.