Projets bénéficiant du soutien financier de l’Institut OpenHealth au titre de la campagne 2017

Max Brüning, Master in Sustainable Development Economics, Université Paris 1 Panthéon-Sorbonne

Résumé : This project aims to use the OpenHealth data for an analysis of the relation between economic distress and population health. While the impact of economic downturns on suicides has found some attention in the prior literature (Regidor et al., 2016), there is a need for more nuanced analyses of mental health during macroeconomic cycles. Adverse mental effects could add significant social costs to economic recessions and require more consideration by policy makers. This research project will use a dynamic panel approach to link the sales data of mental health drugs from the OpenHealth institute to regional data of economic distress from the French Labour Force Survey (LFS). Differential effects by age and gender will find special attention. The research project will make several contributions to the literature. Firstly, research on the link between unemployment and mental health in France is novel as the topic has been addressed by only one other study (Blasco & Brodaty, 2016). Secondly, the richness of the OpenHealth data with respect to regional detail facilitates an analysis at different levels of aggregation and thereby allows a focus on spill-over effects between geographic units. Thirdly, the data enables me to use various approaches for causal identification simultaneously and thus to compare the results of these methodologies.

Julien Tourille, Thèse en Santé Publique, Laboratoire pour la mécanique et les sciences de l'ingénieur (LIMSI), Université Paris Saclay

Résumé : Important information for public health is contained in the free-text of clinical documents within Electronic Health Records (EHRs). The retrospective analysis of EHRs allows health professionals to obtain a concise view of the healthcare pathways within their institutions. It allows to compare effective patient care to clinical guidelines. Such a temporal analysis of clinical documents is a complex problem that requires leveraging information from multiple documents. Through a research stay at the Boston Children's Hospital Natural Language Processing (NLP) Laboratory, this project aims at i) developing a cross-document event coreference annotation schema for Electronic Health Records (EHR) written in French and ii) developing and implementing a cross-document event coreference resolution system for EHRs written in English. Both Boston Children's Hospital and LIMSI have extensive knowledge of EHRs processing and are currently in the process of developing cross-document event coreference methods in English or French. This research stay is the opportunity to share knowledge and methodology around this subject which is also the main focus of my PhD dissertation.

Kankoe Sallah, Thèse en Santé Publique, The Boston Children's Hospital Natural Language Processing (NLP), Unité Mixte de Recherches (URM 912 SESSTIM), INSERM, Université d’Aix-Marseille

Résumé : Lors des tentatives d’élimination du paludisme dans les années 60, la mobilité humaine a provoqué des résurgences dès lors que les mesures de contrôle ont été relâchées. Il est donc indispensable de tenir compte des flux de mobilité humaine dans la mise en place des programmes d’action visant l’élimination. Deux principales sources de capture peuvent renseigner la mobilité humaine : les données d’utilisation de téléphonie mobile et les enquêtes sur la mobilité et les migrations. Cette étude comparera, dans un premier temps les deux types de recueil de mobilité en les utilisant les données d’enquête comme référence. Ensuite, les deux schémas de mobilité seront chacun intégrés au sein d’un métamodèle de transmission du paludisme qui permettra de comparer les projections épidémiques dans une perspective d’élimination du paludisme. Les échelles temporelles de la mobilité feront l’objet d’une analyse de sensibilité. Enfin, un choix efficient de cibles d’interventions privilégiés sera discuté comparant les approches ciblant le réservoir de paludisme aux approches centrées sur le potentiel d’interconnectivité des différents sites géographiques. La structure des troubles affectifs et comportementaux chez l’enfant et leurs liens avec le développement ultérieur de 

troubles psychiatriques sont encore mal connus et très débattus. Ce projet postdoctoral a pour but d’utiliser une approche innovante pour l’analyse des phénomènes complexes (analyse de réseau) afin d’étudier cette thématique sur des données longitudinales issues d’une cohorte de 2000 enfants représentatifs de la population générale, suivis de 6 à 29 ans. Le réseau existant entre les 42 symptômes de troubles affectifs et comportementaux collectés lors de l’enfance sera étudié et comparé entre les sujets ayant développé ou non des troubles psychiatriques à l’âge adulte. Le caractère longitudinal des données permettra d’étudier la direction (causalité) des liens entre symptômes et ainsi de mettre en évidence des cercles vicieux ou des symptômes influençant fortement les autres symptômes, informations essentielles à la mise en place de stratégies efficaces de prévention.

Loïc Ferrer, Thèse en Santé Publique, Centre de Recherche Biostatistique (U1219), Inserm, Université de Bordeaux 

Résumé : Après le diagnostic d’une maladie, les patients sont généralement surveillés par des biomarqueurs mesurés de façon répétée. Dans ces populations, il est souvent crucial de prédire des probabilités cumulées individuelles d'événements tels que la rechute clinique, la mort ou plus généralement la progression, à partir des informations individuelles collectées jusqu'au temps de prédiction. Pour calculer ces prédictions dynamiques individuelles, deux principales approches ont été proposées. L'approche de modélisation conjointe modélise simultanément le processus longitudinal (mesures répétées de biomarqueurs) et le processus de survie (données de temps d'événement) en les reliant à l'aide d'une structure latente partagée. Les prédictions individuelles sont ensuite dérivées pour un temps de prédiction donné. En revanche, l'approche landmarking cherche à ajuster des modèles de survie standards en ne considérant que le sous-échantillon des patients à risque au moment de la prédiction et en incluant des prédictions de biomarqueurs jusqu'au temps de prédiction. Ces approches diffèrent notamment dans l'information utilisée, les hypothèses des modèles et la complexité des procédures computationnelles. Avec le besoin croissant d’outils individuels de prédiction de progression clinique, notamment en cancer, il est nécessaire de mieux comprendre ces approches et les contraster afin de fournir des éléments clés pour le développement et l’utilisation de prédictions dynamiques individuelles dans le suivi clinique des patients. Motivés par la prédiction de deux causes concurrentes de progression du cancer de la prostate à partir de l'histoire de l’antigène spécifique de la prostate (PSA), nous souhaitons mener une étude de simulation approfondie permettant d'évaluer et de comparer ces deux approches. Les prédictions dynamiques individuelles dérivées des modèles conjoints et des modèles landmarks seront spécifiquement comparées en termes de précision de prédiction, d’efficience et de robustesse aux hypothèses du modèle. De nouvelles techniques d’évaluation de l’incertitude autour des prédictions seront aussi proposées. Les données de simulations seront générées pour approcher au mieux plusieurs jeux de données (cohortes hospitalières et essais cliniques) issus de collaborations internationales sur lesquels seront aussi illustrées les techniques de calcul de prédiction dynamique de progression de cancer de la prostate localisé à partir des mesures répétées des PSA et des facteurs pronostiques classiques.

Ceren Tozlu, Thèse en Santé Publique, options biostatistique et bioinformatique, Hospices Civils de Lyon

Résumé : La sclérose en plaques (SEP) est la maladie inflammatoire démyélinisante du système nerveux central la plus fréquente de l'adulte jeune. C’est une maladie invalidante dont le problème majeur est l’évaluation du pronostic à long terme. L’évolution de cette maladie est très variable d’un patient à l’autre et la prédiction de la progression individuelle de la maladie est actuellement quasiment impossible (Durand-Dubief F., 2011). L’objectif principal de ce projet est de développer un modèle de prédiction de la progression individuelle de la maladie SEP incluant en particulier des marqueurs radiologiques issus d’IRM multimodale recueillis de façon longitudinale. Les développements méthodologiques statistiques seront adaptés aux données d’imagerie et à l’inclusion de données cliniques longitudinales. Les développements seront mis en oeuvre dans le logiciel (R) et rendus accessibles sous forme de librairie. Ce projet de thèse s’inscrit dans le cadre d‘une collaboration entre l’équipe Biostatistique Santé (UMR CNRS 5558) et dans laquelle se déroulera la thèse, l’équipe « Imagerie cérébrale » du laboratoire Créatis (UMR CNRS 5220 & Inserm U1044), le service de neurologie dédié à la SEP dirigé par le Pr Sandra Vukusic, présidente de la fondation EDMUS et coordonnateur scientifique de l’OFSEP. L’équipe Biostatistique Santé (UMR CNRS 5558) a été évaluée A+ par l’AERES (2010). La dernière évaluation HCERES (campagne A 2015) effectuée au niveau du département a souligné l’excellence du niveau de publication, de l’attractivité et du rayonnement académique, et de son interaction avec l’environnement social, économique et culturel.l.

Catherine Quinot, Thèse en Santé Publique, Unité Vieillissement et maladies chroniques - Approches épidémiologique (VIMA), INSERM

Résumé : L’utilisation de produits de nettoyage et de désinfection est un facteur de risque émergent de l’asthme lié au travail, particulièrement dans le secteur de la santé. Cependant, ces produits sont des mélanges complexes de plusieurs composés chimiques, et les substances spécifiques associées à l’asthme restent mal connues. Cela est en parti dû au fait que l’évaluation de l’exposition professionnelle aux produits de nettoyage et de désinfection est difficile dans les études épidémiologiques. Les méthodes actuellement utilisées sont la déclaration des sujets (questionnaires sur les produits qu’ils tilisent ou les substances auxquels ils sont exposés), le recours à des experts pour une estimation de l’exposition par expertise, ou encore l’utilisation de matrices emplois-expositions. Ces méthodes sont sujettes à

différents biais. Récemment dans la littérature, l’utilisation des codes-barres des produits a été suggérée afin d’estimer l’exposition à ces produits, en faisant le lien avec des bases de données contenant des informations sur leur composition.Le but de ce projet est de développer une méthode innovante permettant d’estimer l‘exposition professionnelle aux produits de nettoyage et désinfectants à partir d’une application smartphone permettant de scanner les codes-barres de ces produits. Les données collectées via l’application smartphone seront ensuite mises en relation avec une base de données contenant des informations sur des produits de nettoyage et des désinfectants utilisés par les personnels hospitaliers. Ce projet permettra le développement d’un outil fiable et standardisé pour améliorer l’évaluation des expositions professionnelles dans les études épidémiologiques. Cet outil devrait contribuer à l’identification des produits en cause dans l’asthme et à l’établissement de mesures de prévention par la réduction de l’exposition à ces produits en milieu professionnel.

Hamdi Amroun, Thèse en Santé Publique, option Informatique, Analyse et Reconnaissance de l'Activité, Université Paris Saclay

 Résumé : Dans le cadre du rapprochement du LIMSI-CNRS (Orsay), laboratoire spécialisé dans le traitement des données, avec le centre hospitalier Mayo Clinic (USA), je souhaite travailler sur le développement d’un outil utilisant des objets connectés pour le suivi personnalisé et la prévention secondaire d’AVC. Cet outil pourra être utilisé par des patients, ayant subi un premier AVC, afin de leur donner un indicateur de risque avancé de rechute post-AVC dans la vie quotidienne (maison, travail et extérieur). Cet outil reposera sur un modèle de quantification du risque intégrant des marqueurs physiologiques et des marqueurs comportementaux (marqueurs corrélés avec le risque de survenue de l’AVC) qui sont compris dans les signaux capteurs retournés par les objets connectés usuels (montre connectée avec mesure de rythme cardiaque, bracelet connecté de mesure de pression artérielle, balance électronique connectée, etc.).

Marion Lecorguille, Master en Santé Publique, INSERM, Université de Paris Sorbonne

 Résumé : La pathologie thyroïdienne est la deuxième cause de maladie endocrinienne en cours de grossesse. Il est essentiel de savoir les reconnaître car celles-ci peuvent avoir un impact sur l’évolution de la grossesse et inversement. L'hypothyroïdie et l'hyperthyroïdie maternelle pendant la grossesse seraient responsables de plusieurs complications obstétricales et pendant l'enfance. Les femmes plus précisément avec des antécédents de pathologies thyroïdiennes sont susceptibles de présenter une concentration en hormones thyroïdiennes suboptimale en début de grossesse.

Marion Lecorguille, Master en Santé Publique, INSERM, Université de Paris Sorbonne

Julie Havas, Master en Santé Publique, Institut de Santé Publique d’Épidémiologie et de Développement (ISPED) de l’Université de Bordeaux

Résumé : En chirurgie cardiaque, les connaissances sur l’évolution des performances hémodynamiques à long-terme des valves biologiques actuellement implantées restent faibles. La détérioration valvulaire structurelle (SVD pour Structural Valve Deterioration) est définie selon les recommandations internationales comme une détérioration valvulaire diagnostiquée au cours d’une réopération, une autopsie, ou la réalisation d’une évaluation clinique (Akins et al., 2008). L’utilisation de l’échographie est recommandée pour la réalisation du suivi clinique des bioprothèses cardiaques mais les critères échographiques à utiliser pour ce diagnostic ne sont cependant pas précis (Nishimura et al. 2014). Récemment, Sénage et al. (2014) se sont intéressés à l’incidence d’une détérioration valvulaire structurelle chez 617 patients ayant eu un Remplacement Valvulaire Aortique (RVA) dans le service de chirurgie cardiaque du CHU de Nantes entre 2002 et 2007 avec la prothèse Sorin Mitroflow®. La définition d’une SVD tenait compte de critères échocardiographiques, et, les cas échéants, de l’histologie obtenue lors d’une autopsie et de la reprise opératoire. Ils montraient le risque sous-estimé et méconnu de détérioration valvulaire de la prothèse biologique Mitroflow® avec un Hazard Ratio ajusté de décès associé à la SVD estimé à 3,5 et une incidence cumulée de SVD à 5 ans estimée à 22,0%. Une limite majeure de cette étude était le choix empirique des seuils utilisés dans le critère composite échographique. Notre hypothèse est qu’une accélération de l’augmentation des gradients transprothétiques au cours du temps pourrait indiquer une dégénérescence de la valve et être associée à la survenue d’un décès. A partir des données cliniques de ces 617 patients, nous proposons de modéliser conjointement l’évolution des gradients transprothétiques moyens et le risque de survenue d’un décès chez des patients avec RVA biologique. L’étude de l’évolution des performances des prothèses pourrait aider au pronostic précoce de dégénérescence valvulaire et ainsi permettre des recommandations pour le suivi des patients avec un RVA. Par ailleurs, une taille de prothèse inadaptée au corps du patient pourrait avoir des conséquences néfastes sur les performances d’une valve au cours du temps. Nous souhaitons étudier le rôle propre de ce facteur de risque sur l’évolution des performances hémodynamiques de la prothèse et sur le risque de décès du patient.

Raphaël Lhote, Master en Santé Epidémiologie, Institut Pierre Louis d’épidémiologie et de santé publique

Résumé : La sarcoïdose est une maladie multi-systémique de causes inconnues caractérisée par la présence de granulomes épithélioïdes et giganto-cellulaires. Il s’agit d’une maladie habituellement bénigne touchant avec prédilection les poumons et les organes lymphatiques. Les atteintes cardiaques peuvent mettre en jeu le pronostic vital immédiat ou retardé alors que les atteintes neurologiques peuvent mettre en jeu le pronostic fonctionnel. L’objectif de cette étude est de décrire la distribution et les caractéristiques des atteintes cardiaques et neurologiques au cours de la sarcoïdose. Pour cela, nous proposons la réalisation d’une enquête épidémiologique sur la période 2010-2017 dans les centres hospitaliers universitaires, les centres hospitaliers régionaux et les centres privé à but non lucratif à valence universitaire d’Ile de France. Elle comporte deux phase : 1) identification des cas de sarcoïdose et de leurs caractéristiques à l’aide de bases de données sanitaires nationales (PMSI, SNIIRAM) 2) étude de type cas-témoins dans laquelle les patients ayant une atteinte neurologique et/ou cardiaque seront appariés à des patients ayant une sarcoïdose sans atteinte cardiaque ni neurologique. Dans cette étude, le score d’activité de la sarcoïdose (ePOST) et le score pronostique des neurosarcoïdoses seront validés.

Clément Hervé, Master en Biostatistiques, département Epidémiologie et Biostatistiques, Université de Californie San Francisco

Résumé : La structure des troubles affectifs et comportementaux chez l’enfant et leurs liens avec le développement ultérieur de troubles psychiatriques sont encore mal connus et très débattus.

Ce projet postdoctoral a pour but d’utiliser une approche innovante pour l’analyse des phénomènes complexes (analyse de réseau) afin d’étudier cette thématique sur des données longitudinales issues d’une cohorte de 2000 enfants représentatifs de la population générale, suivis de 6 à 29 ans.

Le réseau existant entre les 42 symptômes de troubles affectifs et comportementaux collectés lors de l’enfance sera étudié et comparé entre les sujets ayant développé ou non des troubles psychiatriques à l’âge adulte. Le caractère longitudinal des données permettra d’étudier la direction (causalité) des liens entre symptômes et ainsi de mettre en évidence des cercles vicieux ou des symptômes influençant fortement les autres symptômes, informations essentielles à la mise en place de stratégies efficaces de prévention.

Projets bénéficiant du soutien financier de l’Institut OpenHealth au titre de la campagne 2016

Alexandra Rouquette, Mission post-doctorat, Centre de Recherche en Epidémiologie et en Santé des Populations (CESP), Inserm

 

Résumé : La structure des troubles affectifs et comportementaux chez l’enfant et leurs liens avec le développement ultérieur de troubles psychiatriques sont encore mal connus et très débattus.

Ce projet postdoctoral a pour but d’utiliser une approche innovante pour l’analyse des phénomènes complexes (analyse de réseau) afin d’étudier cette thématique sur des données longitudinales issues d’une cohorte de 2000 enfants représentatifs de la population générale, suivis de 6 à 29 ans.

Le réseau existant entre les 42 symptômes de troubles affectifs et comportementaux collectés lors de l’enfance sera étudié et comparé entre les sujets ayant développé ou non des troubles psychiatriques à l’âge adulte. Le caractère longitudinal des données permettra d’étudier la direction (causalité) des liens entre symptômes et ainsi de mettre en évidence des cercles vicieux ou des symptômes influençant fortement les autres symptômes, informations essentielles à la mise en place de stratégies efficaces de prévention.

Manik Kadawathagedera, Thèse en Santé Publique, Centre de Recherche Epidémiologie et Statistique Sorbonne Paris Cité (CRESS), Inserm

 

Résumé : De nombreuses études ont montré des associations entre l’exposition prénatale à des contaminants environnementaux, en particulier les « perturbateurs endocriniens », et la croissance postnatale (e.g. Valvi et al. 2012). Les mesures biologiques d’exposition dans les études de cohorte sont coûteuses et posent des difficultés pratiques.

Les études de l'alimentation totale (EAT) visent à donner une vue précise et réaliste de l'exposition alimentaire aux contaminants majeurs. (Anses 2011).En combinant les données de contamination des aliments aux données de consommation alimentaire individuelle, les études de cohorte permettent d'estimer l'exposition alimentaire individuelle aux contaminants, d'identifier les mélanges auxquels ils sont exposés et d’évaluer leur association avec des données de santé.

L’objectif de ma thèse est d’étudier les associations entre l'exposition aux contaminants alimentaires ou l'exposition à des mélanges de contaminants et la croissance, le développement de la masse grasse et sa répartition dans trois cohortes de naissance, deux cohortes française (EDEN et ELFE) et une cohorte Norvégienne MoBa.

Ce projet permettra de comparer les résultats obtenus dans deux pays européens, la reproduction des résultats étant, en épidémiologie, un gage additionnel d’évidence. De plus, le nombre de sujets inclus y est très important, ce qui donnera à nos analyses une puissance statistique forte.

Bertrand Beaufils, Stage de Master 2, M2 Mathématiques et Application, spécialité Statistiques, majeure Data Science, UPMC

 

Résumé : Le stage intervient dans le cadre d’une collaboration entre la Start-up Sysnav, référence pour la navigation sans GPS, l’équipe DataShape de l’INRIA et le département d’études cliniques pour les maladies rares de la Pitié-Salpétrière.

Le stage porte sur l’étude et la mise en oeuvre de méthodes d’apprentissage statistiques pour prédire l’état d’un patient atteint de la maladie de Parkinson à partir de données enregistrées en milieu contrôlé et au domicile à l’aide d’un dispositif spécifique couvert par de nombreux brevets portant notamment sur la construction de variables précises du mouvement (trajectoire).

Plus précisément, il s’agit de détecter avec un minimum d’erreur les pathologies associées à la maladie de Parkinson : petits pas, dyskinésies (des sous-classes existent dans les dyskinésies) et tremblements à l'aide des mesures des mouvements réalisés par le dispositif.

Angel Eugenio Benitez Collante, Thèse en Santé Publique, Centre de Recherche des Cordeliers, Université Paris Descartes, Inserm

 

Résumé : Les hôpitaux sont confrontés à de nombreux défis économiques et structurels. Différentes stratégies ont été employées pour mesurer et améliorer l’efficience hospitalière sans altérer la qualité des soins. L’objectif est de modéliser puis d’analyser les relations entre efficience hospitalière et qualité des soins.

La première hypothèse est que la recherche d’une meilleure efficience économique pourrait être associée à une moindre qualité des soins. La deuxième hypothèse est que la mise en œuvre de systèmes d’information cliniques performants peut avoir un effet non seulement sur l’efficience, mais également sur la qualité des soins.

Le choix des indicateurs d’efficience et de qualité sera effectué au niveau des processus mais surtout des résultats. Ensuite l’interrogation des entrepôts de données médico -économiques de l’AP-HP sera suivie d’une validation des données. Les calculs statistiques feront appel à des méthodes paramétriques et non paramétriques et différentes modèles économétriques.

Les travaux statistiques seront effectués extraites des entrepôts de données sur les données de 20 hôpitaux de court séjour de l’Assistance Publique Hôpitaux de Paris pendant la période 2008-2015. Ils concerneront l’analyse des relations en les indicateurs sélectionnés de maturité informatique, d’efficience économique et de qualité des soins.

Agnieszka Krol, Thèse en Santé Publique, option Biostatistique, Ecole Doctorale Sociétés, Politique, Santé Publique (EDSP2), Université de Bordeaux

 

Résumé : Les critères RECIST sont utilisés comme outil standard pour l'évaluation clinique des traitements du cancer. L'évaluation est basée sur la charge anatomique de la tumeur, c’est-à-dire, le changement de la somme des plus longues diamètres de lésions cibles et l’évolution des lésions non-cibles: apparition de nouvelles lésions et la progression sans équivoque de lésions non-cibles déterminés avant le traitement.

Malgré les avantages incontestables de cet outil standard, il souffre de certaines limites telles que la catégorisation de la taille continue de la tumeur ou la négligence de sa trajectoire longitudinale. En particulier, il est intéressant de saisir la tendance de baisse à court terme et la re-croissance à long terme de la taille tumoral qui est souvent présente sous un traitement de cancer avancé et de modéliser cette trajectoire simultanément avec le temps d'événement.

Les évènements d’intérêt peuvent être le temps jusqu’à la progression de lésions non-cibles et la survie globale. Cette analyse complexe est réalisable en utilisant des modèles conjoints multivariés à fragilité partagée pour les données longitudinales et de survie. De plus, considérer l’évolution de la maladie au cours de temps permet de construire des prédictions dynamiques pour la survie globale.

Arlette Edjolo, Mission post-doctorat, ISPED, Université de Bordeaux

 

Résumé : Le rôle de plus en plus central de la donnée médicale informatisée et le mouvement vers une médecine centrée sur le patient nécessite la production de données suffisamment probantes pour pouvoir s’inscrire dans l’ère du Big Data. Les critères de mesures rapportés par le patient (Patient-Reported Outcomes ou PROs) fournissent des informations complexes et subjectives sur les symptômes, le fonctionnement et la qualité de vie liée à la santé.

Les PROs, en complétant les données médicales (examens cliniques, biologie, imagerie, etc.) ou du système de santé (consommation de soins, environnement, etc.), ouvrent le champ des possibles. Cependant, des efforts de standardisation et d’harmonisation sont indispensables. En 2004, l’institut national de la santé américain (NIH) a initié un système de mesure standardisé : PROMIS (Patient Reported Outcomes Measurement Information System).

Initialement en langue anglaise, presque toutes les banques d’items PROMIS ont été traduites. Ainsi, le groupe PROMIS néerlandais-flamand a traduit avec succès la banque d’items des composantes interférente et comportementale de l’échelle de la douleur témoignant d’une bonne fiabilité transculturelle de l’échelle.

Cependant, un des aspects de la donnée potentiellement massive à ne surtout pas négliger est son caractère longitudinal. Dans le cas des données PROMIS, il est important d’avoir une mesure stable entre différents groupes culturels, mais il est tout aussi primordial de s’assurer de sa stabilité au fil du temps.

Cette mission post doctorale a pour objectif d’analyser l’invariance longitudinale des échelles néerlandaises de mesure de la douleur (Dutch-Flemish PROMIS Pain scales). Selon les résultats, l’analyse confirmera le succès de l’échelle d’ores et déjà validée ou mènera à une adaptation des banques d’items afin de renforcer la validité conceptuelle, la fiabilité et la précision des échelles. Plus largement, ce travail contribuera au développement de données PROs standardisées pertinentes encore plus fiables et valides pour le Big Data en santé de demain.

Hélène Tubeuf, Thèse en Biologie, lnstitut de Recherche et d'lnnovation Biomédicale de Haute-Normandie, Inserm, Université de Rouen

 

Résumé : Un des défis majeurs en génétique médicale est l’interprétation des variations de signification inconnue (VSI). Cette problématique est particulièrement importante en oncogénétique, notamment dans le contexte des deux formes les plus fréquentes de cancer héréditaire : le syndrome de Lynch et le syndrome seins-ovaires.

Ces syndromes résultent respectivement des mutations des gènes MMR et BRCA, les VSI représentant ~30% des variations détectées. Nous avons démontré, grâce à des tests fonctionnels basés sur l’utilisation de minigènes, qu’une fraction importante de ces VSI est à l’origine de défauts d’épissage. Cependant, la plupart des VSI reste à analyser.

Nos travaux récents suggèrent que deux nouveaux algorithmes dont un nouveau développé par notre groupe pourraient permettre de prédire l’impact de certaines VSI sur l’épissage, et de stratifier les analyses fonctionnelles. Ce projet vise, en prenant comme modèles d’études les gènes BRCA et MMR, à évaluer la performance de ces nouvelles approches bioinformatiques de prédiction d’altérations d’éléments exoniques régulateurs d’épissage (ESRs), en particulier celle basée sur des scores ESRseq et développée par notre laboratoire.

Cette évaluation sera réalisée en confrontant les prédictions obtenues à partir d’un grand nombre de variations répertoriées dans des bases de données nationales et internationales et les résultats expérimentaux obtenus dans des tests minigènes. La seconde partie du projet sera focalisée sur des « exons modèles », correspondant à des cas extrêmes de concordance-discordance entre prédictions informatiques et données expérimentales, avec une analyse mutationnelle extensive.

La dernière étape du projet sera de cartographier les régions exoniques régulatrices d’épissage de ces « exons modèles » par une stratégie de marche sur l’exon en utilisant un test fonctionnel « ESR-dépendant ». Ce projet permettra d’optimiser le diagnostic moléculaire des cancers héréditaires et devrait contribuer à l’interprétation de VSI identifiées par séquençage à haut débit dans d’autres pathologies.

Iryna Nikolayeva, Thèse en Biologie, Systems Biology Laboratory, Institut Pasteur

 

Résumé : Recently, significant efforts have been undertaken to identify genes relevant for a large number of diseases—including dengue—using genomics. Most results, based on the analysis of variation in single genes, have been underwhelming, and the majority of risk factors remain elusive. Many higher-level phenotypes appear to be associated with variations across multiple genes.

The joint analysis of multiple loci in known pathways takes this into account, but the restriction to known pathways limits the explanatory power of this approach. Similar to pathway-based approaches, network-based approaches aggregate information across multiple loci and even genes. But network-based approaches address a much larger search space: Instead of choosing among a relatively limited number of known pathways, network-based approaches need to consider any connected subnetwork of molecules interrelated by molecular or functional interactions.

My project aims to develop, adapt, and apply leading network-based approaches for the integrative analysis of genome data to implicate novel molecular networks in the etiology of dengue virus infection. This project is a collaboration between an experimental lab with a focus on dengue and malaria and a computational (systems biology) research lab at the Pasteur Institute. It creates a new interface between these groups and is supported by broad existing expertise in infectious disease, statistics, and algorithms, and capacity for experimental/clinical follow-up.

Votre espace

Mot de passe perdu ?

Actualité

17 novembre
17 novembre
17 novembre

Les cookies vous permettent de bénéficier de nombreuses fonctionnalités afin d'améliorer votre expérience sur le site Openhealth-institute.org.
En utilisant ce site, vous acceptez de recevoir des cookies conformément à notre politique de confidentialité.