CHU de Limoges

CHU de Limoges

Accélérer la recherche et publier des données de santé sensibles en toute conformité

Challenges

  • Reproduire les résultats d’analyses pharmacogénétiques sur de petits jeux de données tout en préservant la confidentialité des patients.
  • Maintenir la fidélité des modèles statistiques (sélection des mêmes variables clés et estimation des effets) avec des données synthétiques.
  • Améliorer la stabilité des résultats en générant plusieurs jeux de données synthétiques et en agrégeant les performances.

Maintien de la qualité statistique et de l'utilité

Conservation de la variable clé (haplotype)

ROI

  • Publication scientifique dans la revue CPT PSP (IF 3) “To be or not to be, when synthetic data meet clinical pharmacology: A focused study on pharmacogenetics”
  • Validation académique de la méthode Avatar : démonstration de sa capacité à allier forte fidélité des données et protection de la vie privée.
  • Partage de données et collaboration rendue possible entre les centres dans le cadre d’études multicentriques.
  • Éviter les complexités juridiques, les coûts et les procédures longues associés au partage traditionnel de données.
“La création de données synthétiques favorise la science ouverte en fournissant des données en même temps que les résultats. Elle facilite le partage des données entre les centres en tant qu'alternative à l'apprentissage fédéré. Cela permet d'éviter les complexités juridiques, les coûts et les procédures fastidieuses souvent associés au partage traditionnel des données.” - Jean-Baptiste Woillard - Professeur/Praticien Hospitalier Pharmacologie @CHU de Limoges
“La variabilité au sein d'un dataset par bootstrap est similaire à celle obtenue en lançant plusieurs fois avatar”. - Jean-Baptiste Woillard - Professeur/Praticien Hospitalier Pharmacologie @CHU de Limoges