ORANGE SA : THÈSE ' SÉPARATION DE SOURCES PAR IA GÉNÉRATIVE (H/F)

Poste
Thèse (36 mois) - Cadre
Niveau d'étude
Bac+5 (Master / Ingénieur)
Univers
Informatique, web et numérique
Métier
Recherche : Direction R & D
Localisation
Cesson-Sévigné (35, Ille-et-Vilaine)

Inscrivez-vous !

En vous inscrivant sur Engagement Jeunes, recevez les offres qui vous correspondent et rendez vous visible des recruteurs.

Présentation de la société : ORANGE SA

e
L'ambition de la Division Innovation est de porter plus loin l'innovation d'Orange et de renforcer son leadership technologique, en mobilisant nos capacités de recherche pour nourrir une innovation responsable au service de l'humain, éclairer les choix stratégiques du Groupe à long terme et influencer l'écosystème digital mondial.
Nous formons les expertes et les experts des technologies d'aujourd'hui et de demain, et veillons à une amélioration continue de la performance de nos services et de notre efficacité. La division Innovation rassemble, dans le monde, 6000 salariés dédiés à la recherche et l'innovation dont 740 chercheurs. Porteurs d'une vision globale avec une grande diversité de profils (chercheurs, ingénieurs, designers, développeurs, data scientists, sociologues, graphistes, marketeurs, experts en cybersécurité…) , les femmes et les hommes de Innovation sont à l'écoute et au service des pays, des régions et des business units pour faire d'Orange un opérateur multiservices de confiance.

Au sein d'Innovation, vous serez intégré(e) dans une équipe de recherche composée d'une dizaine de chercheurs et doctorants spécialistes du traitement d'antenne et du deep-learning. Notamment, vous serez encadré.e par des spécialistes du format Ambisonique et de traitement d'antenne neuronal et travaillerez étroitement avec trois autres doctorants sur des sujets connexes comme le tracking de sources sonores et le codage neuronal

Missions

Votre rôle est d'effectuer un travail de thèse sur la : " Séparation de sources par IA générative. Application à des contenus ambisoniques "
Contexte global et problématique du sujet
Les récents progrès de la reconnaissance automatique de la parole, portés par les avancées en deep learning, ont grandement participé à mettre en avant les services vocaux. Cependant, qui n'a pas été excédé de devoir répéter plusieurs fois la même commande à un assistant domestique tel Alexa ou Google Home ? De fait, la prise de son main-libres se traduit par l'amplification de perturbations liées à l'environnement sonore : bruit, réverbération, interférences. Afin de rendre à la voix son intelligibilité, cela nécessite d'appliquer des techniques de rehaussement comme la séparation de sources permettant de supprimer les interférences.
Dernièrement, les technologies de séparation ont bénéficié de la démocratisation des antennes de microphones : la plupart des tablettes, smartphones, laptops, aides auditives sont équipés de plusieurs microphones, . Ces interfaces multicanales sont en effet plus performantes que les versions mono car elles peuvent tirer parti d'informations spatiales pour séparer les sources.
L'autre élément incontournable de ces dernières années, est l'irruption avec succès du deep learning dans le domaine du traitement du signal audio. Les résultats des derniers challenges de séparation de sources comme Sound Demixing sont tout simplement excellents (https://www.aicrowd.com/challenges/sound-demixing-challenge-2023) .
Cependant, ces méthodes présentent des limites fondamentales :
i) l'approche discriminative retenue, qui consiste à extraire une source d'un mélange - généralement par application de masques temps-fréquences -, génère des artefacts : résidus d'interférences, voix dégradée
ii) les réseaux, entraînés de manières supervisées sur des bases de données synthétiques, fonctionnent mal en situations réelles.
Objectif scientifique
  • résultats et verrous à lever
L'objectif de la thèse consiste à développer des méthodes de séparation de sources audio multicanal qui soient robustes en condition réelle.

Profil recherché

Compétences (scientifiques et techniques) et qualités personnelles exigées par le posteMaitrise des techniques d'apprentissage automatique, réseaux de neurones profonds
Maitrise des techniques de traitement du signal, audio.
Connaissances approfondies en Python, Bash etc.
Rigueur et créativité
Notions de propriété intellectuelle
Formation demandée (master, diplôme d'ingénieur, doctorat, domaine scientifique et technique …) Diplôme niveau bac+5 (master, diplôme d'ingénieur, etc.) dans le domaine du traitement du signal ou de l'apprentissage automatique ou de l'acoustique.
Une connaissance du domaine de l'audio est un plus
Expériences souhaitées (stages, projets, TPs …) Expérience en apprentissage automatique, notamment réseaux de neurones profonds (DNN) , framework PyTorch/Tensorflow
Expérience en traitement du signal audio ( filtrage, réduction de bruit, codage)