CNRS : THÈSE EN IA : MODÈLES PRÉDICTIFS DYNAMIQUES EXPLOITANT LES SÉQUENCES MÉDICALES INDIVIDUELLES POUR P (H/F)

Poste
Thèse (36 mois) - Cadre
Niveau d'étude
Bac+5 (Master / Ingénieur)
Univers
Santé et Médecine
Localisation
Paris (75, Paris)

Inscrivez-vous !

En vous inscrivant sur Engagement Jeunes, recevez les offres qui vous correspondent et rendez vous visible des recruteurs.

Présentation de la société : CNRS

Le Centre national de la recherche scientifique est un organisme public de recherche pluridisciplinaire placé sous la tutelle du ministère de l’Enseignement supérieure et de la Recherche. Créé en 1939 et dirigé par des scientifiques, il a pour mission de faire progresser la connaissance et être utile à la société dans le respect des règles d’éthique, de déontologie et d’intégrité scientifique.

Missions

Sujet de thèse :
L’objectif de cette thèse est de développer des modèles dynamiques d'IA prédictifs du risque d’arrêt cardiaque (AC) , en exploitant les trajectoires médicales individuelles issues de données temporelles structurées (SNDS et CEMS) . Les algorithmes développés devra intégrer la dimension longitudinales des parcours de soins.
En mobilisant des méthodes avancées d’apprentissage automatique adaptées aux données longitudinales (EHR) , le projet analysera les séquences de diagnostics, d’actes médicaux et de prescriptions afin de modéliser finement l’évolution du risque dans le temps. Des représentations vectorielles (embeddings) seront explorées pour capturer les interactions complexes entre événements cliniques, notamment au moyen de techniques comme Time2Vec (pour encoder les dimensions temporelles continues) ou FAN (Fourier Analysis Networks) pour capter les motifs fréquentiels.
Pour faire face à l’important volume des données (séquences longues, nombreux patients) , des architectures Transformer seront explorées. En particulier, le modèle Performer (FAVOR+) , qui repose sur une approximation de l’attention par noyaux (kernelized attention) , permettra de traiter efficacement de longues séquences cliniques grâce à une complexité linéaire, tout en conservant les capacités de modélisation des relations de dépendance lointaines.

Outre les approches de type Transformer ou plus classiques de boosting, plusieurs pistes complémentaires pourront être explorées afin d’enrichir la modélisation du risque : Méthodes bayésiennes hiérarchiques , Modèles de processus stochastiques temporels , Processus de Hawkes

Contexte :
Cette thèse sera dirigée par E.Bacry (CEREMADE, Université de Paris-Dauphine, Institut PR[AI]RIE) et co-encadrée par le Prof. Xavier Jouven (APHP, INSERM, Institut PR[AI]RIE.
L'essentiel du travail se fera en intégration dans l'équipe INSERM (unité U970) 56 rue Leblanc 75005 Paris.

Conditions particulières d'exercice

Le Centre national de la recherche scientifique est l’une des plus importantes institutions publiques au monde : 34 000 femmes et hommes (plus de 1 000 laboratoires et 200 métiers) , en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines. Depuis plus de 80 ans, y sont développées des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit que le CNRS tisse entre ses missions de recherche et le transfert vers la société fait de lui un acteur clé de l’innovation en France et dans le monde. Le partenariat qui le lie avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires (près de 100 chaque année) témoignent du potentiel économique de ses travaux de recherche.

Profil recherché

Contraintes et risques :