Présentation de la société : CNRS
Le Centre national de la recherche scientifique est un organisme public de recherche pluridisciplinaire placé sous la tutelle du ministère de l’Enseignement supérieure et de la Recherche. Créé en 1939 et dirigé par des scientifiques, il a pour mission de faire progresser la connaissance et être utile à la société dans le respect des règles d’éthique, de déontologie et d’intégrité scientifique.
Missions
Missions :
Ce poste postdoctoral est dans le domaine du traitement du langage naturel. La personne recrutée rejoindra le projet international CHIST-ERA FAIRClinical. Elle développera des approches d'apprentissage automatique pour l'extraction d'informations à partir d'articles de recherche médicale et clinique et de leurs documents complémentaires.
Activités :
- Identifier les sources de données nécessaires à l'extraction et à la normalisation des entités.
- Développer des pipelines d’extraction d’information à partir des textes complets et des documents complémentaires.
- Évaluer les méthodes d’extraction d’information.
- Participer aux activités de publication et de communication de l'équipe.
Ce poste fait partie du projet FAIRClinical financé par CHIST-ERA, dont l'objectif est de renforcer le caractère FAIR de tous les fichiers de données complémentaires et d'améliorer de manière significative la réutilisation des formulaires de rapport de cas cliniques non structurés (CRF) . Les données complémentaires sont généralement jointes à une publication scientifique, soit directement dans les bibliothèques biomédicales en ligne telles que PubMed Central, soit par l'intermédiaire de plateformes de dépôt généralistes telles que Zenodo.
Les CRF recueillent les données des patients dans le cadre d'études et d'essais de recherche clinique, et représentent un sous-ensemble riche en informations de la littérature de recherche clinique et des données complémentaires non structurées des études cliniques. Ce projet propose d'enrichir spécifiquement le contenu de toutes les données supplémentaires — et donc leur interopérabilité, leur trouvabilité et leur réutilisation — en fournissant un contenu plus normalisé.
Conditions particulières d'exercice
Le Centre national de la recherche scientifique est l’une des plus importantes institutions publiques au monde : 34 000 femmes et hommes (plus de 1 000 laboratoires et 200 métiers) , en partenariat avec les universités et les grandes écoles, y font progresser les connaissances en explorant le vivant, la matière, l’Univers et le fonctionnement des sociétés humaines. Depuis plus de 80 ans, y sont développées des recherches pluri et interdisciplinaires sur tout le territoire national, en Europe et à l’international. Le lien étroit que le CNRS tisse entre ses missions de recherche et le transfert vers la société fait de lui un acteur clé de l’innovation en France et dans le monde. Le partenariat qui le lie avec les entreprises est le socle de sa politique de valorisation et les start-ups issues de ses laboratoires (près de 100 chaque année) témoignent du potentiel économique de ses travaux de recherche.
Profil recherché
Competences :
- Doctorat en informatique, en traitement automatique des langues ou similaire.
- Compétences en apprentissage automatique supervisé et semi-supervisé, y compris l'apprentissage profond.
- Expérience en traitement automatique des langues
- Bonne maîtrise de l'anglais, à l'oral comme à l'écrit
- Capacité à travailler de manière indépendante et en équipe
- Capacité à hiérarchiser les tâches et à prendre des initiatives.
Risques liés au travail sur écran.