ORANGE SA : THÈSE SUR LA DÉTECTION SÉQUENTIELLE D'ANOMALIES (H/F)

Poste
Thèse (36 mois) - Cadre
Niveau d'étude
Bac+5 (Master / Ingénieur)
Univers
Informatique, web et numérique
Métier
Recherche : Direction R & D
Localisation
Caouënnec-Lanvézéac (22, Cotes-d'Armor)

Inscrivez-vous !

En vous inscrivant sur Engagement Jeunes, recevez les offres qui vous correspondent et rendez vous visible des recruteurs.

Présentation de la société : ORANGE SA

L'ambition de la Division Innovation est de porter plus loin l'innovation d'Orange et de renforcer son leadership technologique, en mobilisant nos capacités de recherche pour nourrir une innovation responsable au service de l'humain, éclairer les choix stratégiques du Groupe à long terme et influencer l'écosystème digital mondial.
Nous formons les expertes et les experts des technologies d'aujourd'hui et de demain, et veillons à une amélioration continue de la performance de nos services et de notre efficacité. La division Innovation rassemble, dans le monde, 6000 salariés dédiés à la recherche et l'innovation dont 740 chercheurs. Porteurs d'une vision globale avec une grande diversité de profils (chercheurs, ingénieurs, designers, développeurs, data scientists, sociologues, graphistes, marketeurs, experts en cybersécurité…) , les femmes et les hommes de Innovation sont à l'écoute et au service des pays, des régions et des business units pour faire d'Orange un opérateur multiservices de confiance.

Au sein de la direction Networks, vous serez intégré(e) dans une équipe passionnée, aux compétences très variées (expert réseaux IP, développeurs, data scientists, spécialistes des traitements temps réel) ; une équipe qui spécifie et met en oeuvre dans les réseaux d'Orange, des solutions de monitoring et de diagnostic utilisés par nos équipes opérationnelles qui permettent d'améliorer la Qualité des Services et des Réseaux, la sécurité et l'efficacité dans la lutte contre la fraude

Missions

Votre rôle est d'effectuer un travail de thèse sur la détection séquentielle d'anomalies dans les séries temporelles quasi périodiques.
La supervision des réseaux au moyen de sondes génère à intervalles réguliers des indicateurs numériques qui forment des séries temporelles caractérisées par un comportement quasi-périodique. Il est impossible pour les exploitants d'analyser manuellement le grand nombre de séries temporelles enregistrées pour y détecter d'éventuelles anomalies, caractérisant des dysfonctionnements. Il s'agit donc de faciliter leur travail par un pointage automatique de ces anomalies, qui peuvent apparaitre simultanément dans des séries temporelles distinctes. Il faudra prendre en compte cette propriété en employant des algorithmes susceptibles de prendre en charge des séries temporelles multivariées.
La problématique de détection d'anomalies est partagée par de nombreux secteurs d'activité et a donné lieu à une grande diversité d'algorithmes couvrant la variété des signaux rencontrés, des phénomènes que l'on cherche à mettre en évidence ou simplement la méconnaissance de ce qui existe déjà dans les autres domaines. Ainsi, une référence récente [3] propose une synthèse sur le sujet basée sur plus de 150 publications. Un objectif de la thèse visera notamment à faire des choix adaptés aux besoins de l'opérateur parmi les méthodes d'inspiration variées (ML, traitement du signal, théorie de détection…) . On évaluera en particulier l'intérêt potentiel de méthodes existantes plus spécifiquement développées pour le traitement de signaux quasi-périodiques [2].
Un aspect à prendre en compte réside dans la difficulté d'obtenir une base d'exemple suffisante pour un apprentissage supervisé, d'autant plus que le profil des courbes de trafic évolue sans cesse au fil des usages et qu'elles sont également très différentes d'un pays à l'autre.
Un autre enjeu important pour l'opérateur est de détecter le plus rapidement possible l'apparition des anomalies pour orienter le diagnostic et entreprendre les actions correctrices adaptées. Là encore, il conviendra de commencer par étudier les solutions existantes [1].

Profil recherché

Le ou la candidat(e) aura un niveau Master 2 (diplôme universitaire ou école d'ingénieur) et possédera les compétences suivantes :
Spécialisation dans le domaine des statistiques, Machine Learning, IA et/ou traitement du signal
Goût pour les mathématiques appliquées et le développement algorithmique
Bonne aptitude en programmation scientifique : langages Python/Julia pour le prototypage et Rust pour l'intégration aux logiciels des sondes d'Orange;
Aisance en anglais (écrit et oral) .
Une connaissance des réseaux télécoms serait un plus mais n'est pas indispensable.

Expériences souhaitées (stages, …)
Posséder une expérience comportant une forte composante connexe au problème proposé sera un atout pour ce poste (par exemple, en traitement de signal ou de séries temporelles, en analyse de données, apprentissage non supervisé)