L’objectif de la journée SimPa est double :
- documenter les cas pratiques en santé dans lesquels les méthodes de calcul de similarité entre patients sont utiles;
- documenter les solutions existantes, par exemple, mais sans y être limité, pour les systèmes fondées sur des méthodes d’apprentissage automatique.
En bref, nous espérons que cette journée permettra une rencontre des communautés d’informatique médicale, santé publique et traitement
automatique de la langue et d’échanger sur la recherche de contenus textuels « similaires » en TAL.
Les communications sollicitées concernent les thématiques suivantes, sans y être limitées pour autant :
- Définition et identification des phénomènes de similarité textuelle en santé, explorant un continuum allant de l’identité des chaînes de caractères à la similarité sémantique et thématique entre documents ;
- Retours d’expérience sur l’utilisation de systèmes de TAL pour la détection de similarité en santé ;
- Identification de « cas similaires » : cohortes de patients, inclusion dans des essais cliniques, dossiers patients dupliqués,...
- Représentation de patients, modèles "deep patient"
- Similarité multimodale incluant le texte création de jumeaux numériques à partir de compte-rendus textuels, génération de données patient synthétiques (notamment des textes).
Les travaux portant sur d’autres langues que le français sont les bienvenus.
Les communications pourront sans restriction concerner des travaux déjà publiés, des résultats préliminaires non publiés, ou être des points de vue sur le domaine. Les propositions de communications orales sont attendues avant le 31 janvier 2023 sous la forme d'un résumé de 2 pages maximum (hors référence). Le style des soumissions doivent suivre le style TALN disponible ici. Les soumissions se feront sur https://easychair.org/conferences/?conf=simpa2023.
Actes de la journée
les Actes de la journée SimPa 2023 sont disponibles sur Hal : https://inria.hal.science/hal-04080808
Inscription (obligatoire) :
L'inscription est obligatoire et via le formulaire suivant : https://sondage.limsi.fr/labo/index.php/595247?lang=fr
Présentations invitées :
- Nicolas Fiorini (R&D, Algolia, Paris) : Recherche d'information dans un domaine spécifique et intelligence artificielle
Résumé -- La recherche d'information en domaine de spécialité est un problème majeur, aujourd'hui toujours partiellement résolu. Les problématiques sont multiples : les requêtes diffèrent significativement des contenus, la pertinence est complexe à caractériser, le vocabulaire est lui aussi spécifique, et souvent nous faisons face à un manque d'annotations ou de jeux de données pour améliorer les systèmes. Cette complexité a motivé plusieurs initiatives consistant à se reposer sur de l'intelligence artificielle pour trouver des solutions, là où un humain serait dépassé par les possibilités combinatoires. Dans cet exposé, nous présenterons un ensemble de méthodes qui ont pu faire leurs preuves dans le contexte de la recherche d'information en domaine de spécialité, ainsi que leur potentielle adaptation d'un domaine à un autre. Les problématiques nouvellement créées lors de l'utilisation de ces approches (notamment éthiques, de confidentialité, ou d'explicabilité) seront aussi couvertes, afin de donner une intuition globale de la mise en œuvre de telles approches sur des cas d'applications concrets.
Biographie -- Nicolas Fiorini a réalisé une thèse en informatique à l'Ecole des Mines d'Alès avec un accent sur l'intelligence artificielle, la classification de données et l'utilisation de bases de connaissances. Il a étendu ses recherches au National Center for Biotechnology Information (NCBI, Washington, DC) en appliquant des méthodes d'apprentissage automatique sur la recherche de littérature biomédicale via l'outil PubMed. De retour en France, il a travaillé chez Doctrine, une startup proposant un moteur de recherche de contenu juridique français (décision de justice, lois, etc.). Il a récemment rejoint Algolia en tant que Director of Engineering, où il supervise une équipe construisant des moteurs de recherche et de recommandation avec une forte composante IA.
- Nigam H. Shah (Stanford University, à distance): Adventures in using real-world evidence at the bed-side
Abstract -- Using evidence derived from previously collected medical records to guide patient care has been a long-standing vision of clinicians and informaticians and one with the potential to transform medical practice. We will review research at Stanford University that developed an on-demand consultation service to derive evidence from patient data to answer clinicians’ questions and support their bedside decision-making. We will describe the design and implementation of the service as well as a summary of their experience in responding to the first 100 requests. Consultation results informed individual patient care, resulted in changes to institutional practices, and motivated further clinical research.
Biography -- Dr. Nigam Shah is Professor of Medicine at Stanford University, and Chief Data Scientist for Stanford Health Care. His research group analyzes multiple types of health data (EHR, Claims, Wearables, Weblogs, and Patient blogs), to answer clinical questions, generate insights, and build predictive models for the learning health system. At Stanford Healthcare, he leads artificial intelligence and data science efforts for advancing the scientific understanding of disease, improving the practice of clinical medicine and orchestrating the delivery of health care. Dr. Shah is an inventor on eight patents and patent applications, has authored over 200 scientific publications and has co-founded three companies. Dr. Shah was elected into the American College of Medical Informatics (ACMI) in 2015 and was inducted into the American Society for Clinical Investigation (ASCI) in 2016. He holds an MBBS from Baroda Medical College, India, a PhD from Penn State University and completed postdoctoral training at Stanford University.
Dates importantes :
- Soumission des résumés : **31 Janvier 2023** nouvelle date ! (n'importe où sur Terre)
- Notification aux auteurs et autrices : mi ou fin février 2023
- Date de la journée : lundi 13 mars 2023, de 9h30 à 18h00
Organisation :
- Adrien Coulet, équipe HeKA, Inria, Inserm, Université Paris Cité
- Christel Gérardin, APHP, IPLESP
- Aurélie Névéol, Université Paris Saclay, CNRS, LISN
- Xavier Tannier, Sorbonne Université, LIMICS
Comité scientifique :
- François Antonini, Assistance Publique Hôpitaux de Marseille
- Sandra Bringay, Université Paul Valery, Montpellier 3, LIRMM
- Vincent Claveau, CNRS, IRISA
- Natalia Grabar, CNRS, STL
- Thomas Guyet, Inria Lyon
- Vianney Jouhet, CHU de Bordeaux, BPH
- Lina Soualmia, Université de Rouen Normandie, LITIS
- les membres du comité d'organisation
Sponsors :
- ATALA : Association pour le traitement automatique des langues
- iPLesp : Institut Pierre Louis d'Épidémiologie et de Santé Publique
9h30 : accueil / café
9h50 : mot d'accueil
10h : présentation invitée Nicolas Fiorini "Recherche d'information dans un domaine spécifique et intelligence artificielle"
11h-12h15 : session 1
- 11h : Exploration de la représentation latente d’un modèle profond de patient sous forme de graphes. Hugo Le Baher, Jérôme Azé, Sandra Bringay, Caroline Dunoyer, Pascal Poncelet et Nancy Rodriguez
- 11h30 : Event2vec, democratizing medical concept embeddings at scale. Matthieu Doutreligne, Antoine Neuraz et Gaël Varoquaux
- 12h : Similarité des documents médicales en se basant sur des embeddings appris pour le codage médical. Leonardo Moros, Jérôme Azé, Maximilien Servajean, Sandra Bringay, Pascal Poncelet et Caroline Dunoyer
12h15-14h : Repas (offert par l'ATALA et l'IPLESP)
14h-16h : session 2
- 14h : Détection de zones dupliquées dans des comptes rendus médicaux. Thibault Fabacher, Olivier Birot, Camila Arias-Villamil, Kim-Tâm Huynh, Antoine Neuraz et Bastien Rance
- 14h30 : Patient similarity study to identify hospital units with the highest rate of unplanned readmissions. Nzamba Bignoumba, Sadok Ben Yahia et Nedra Mellouli.
- 14h45 : Exploring Similarities and Dissimilarities in Patient Representations for Analogical Reasoning. Safa Alsaidi, Miguel Couceiro, Nicolas Garcelon et Adrien Coulet
- 15h15 : Similarité surfacique et similarité sémantique dans des cas cliniques générés. Nicolas Hiebel, Olivier Ferret, Karën Fort et Aurélie Névéol
15h45-16h30 : pause / café
16h30-17h : session 3
- Patient-patient similarity-based screening of a clinical data warehouse to support rare disease diagnosis. Xiaoyi Chen, Carole Faviez, Anita Burgun et Nicolas Garcelon
17h-18h : présentation invitée Nigam Shah : "Adventures in using real-world evidence at the bed-side"
Auditorium (RDC), Paris Santé Campus
2 - 10 Rue d'Oradour-sur-Glane
75015 Paris
France