Projects benefiting from financial support from OpenHealth Institute as part of the 2017 campaign

Max Brüning, Master in Sustainable Development Economics, Université Paris 1 Panthéon-Sorbonne

Résumé : This project aims to use the OpenHealth data for an analysis of the relation between economic distress and population health. While the impact of economic downturns on suicides has found some attention in the prior literature (Regidor et al., 2016), there is a need for more nuanced analyses of mental health during macroeconomic cycles. Adverse mental effects could add significant social costs to economic recessions and require more consideration by policy makers. This research project will use a dynamic panel approach to link the sales data of mental health drugs from the OpenHealth institute to regional data of economic distress from the French Labour Force Survey (LFS). Differential effects by age and gender will find special attention. The research project will make several contributions to the literature. Firstly, research on the link between unemployment and mental health in France is novel as the topic has been addressed by only one other study (Blasco & Brodaty, 2016). Secondly, the richness of the OpenHealth data with respect to regional detail facilitates an analysis at different levels of aggregation and thereby allows a focus on spill-over effects between geographic units. Thirdly, the data enables me to use various approaches for causal identification simultaneously and thus to compare the results of these methodologies.

Julien Tourille, Thèse en Santé Publique, Laboratoire pour la mécanique et les sciences de l'ingénieur (LIMSI), Université Paris Saclay

Résumé : Important information for public health is contained in the free-text of clinical documents within Electronic Health Records (EHRs). The retrospective analysis of EHRs allows health professionals to obtain a concise view of the healthcare pathways within their institutions. It allows to compare effective patient care to clinical guidelines. Such a temporal analysis of clinical documents is a complex problem that requires leveraging information from multiple documents. Through a research stay at the Boston Children's Hospital Natural Language Processing (NLP) Laboratory, this project aims at i) developing a cross-document event coreference annotation schema for Electronic Health Records (EHR) written in French and ii) developing and implementing a cross-document event coreference resolution system for EHRs written in English. Both Boston Children's Hospital and LIMSI have extensive knowledge of EHRs processing and are currently in the process of developing cross-document event coreference methods in English or French. This research stay is the opportunity to share knowledge and methodology around this subject which is also the main focus of my PhD dissertation.

Présentation des travaux

Kankoe Sallah, Thèse en Santé Publique, The Boston Children's Hospital Natural Language Processing (NLP), Unité Mixte de Recherches (URM 912 SESSTIM), INSERM, Université d’Aix-Marseille

Résumé : Lors des tentatives d’élimination du paludisme dans les années 60, la mobilité humaine a provoqué des résurgences dès lors que les mesures de contrôle ont été relâchées. Il est donc indispensable de tenir compte des flux de mobilité humaine dans la mise en place des programmes d’action visant l’élimination. Deux principales sources de capture peuvent renseigner la mobilité humaine : les données d’utilisation de téléphonie mobile et les enquêtes sur la mobilité et les migrations. Cette étude comparera, dans un premier temps les deux types de recueil de mobilité en les utilisant les données d’enquête comme référence. Ensuite, les deux schémas de mobilité seront chacun intégrés au sein d’un métamodèle de transmission du paludisme qui permettra de comparer les projections épidémiques dans une perspective d’élimination du paludisme. Les échelles temporelles de la mobilité feront l’objet d’une analyse de sensibilité. Enfin, un choix efficient de cibles d’interventions privilégiés sera discuté comparant les approches ciblant le réservoir de paludisme aux approches centrées sur le potentiel d’interconnectivité des différents sites géographiques. La structure des troubles affectifs et comportementaux chez l’enfant et leurs liens avec le développement ultérieur de 

troubles psychiatriques sont encore mal connus et très débattus. Ce projet postdoctoral a pour but d’utiliser une approche innovante pour l’analyse des phénomènes complexes (analyse de réseau) afin d’étudier cette thématique sur des données longitudinales issues d’une cohorte de 2000 enfants représentatifs de la population générale, suivis de 6 à 29 ans. Le réseau existant entre les 42 symptômes de troubles affectifs et comportementaux collectés lors de l’enfance sera étudié et comparé entre les sujets ayant développé ou non des troubles psychiatriques à l’âge adulte. Le caractère longitudinal des données permettra d’étudier la direction (causalité) des liens entre symptômes et ainsi de mettre en évidence des cercles vicieux ou des symptômes influençant fortement les autres symptômes, informations essentielles à la mise en place de stratégies efficaces de prévention.

Présentation des travaux

Lien vers l’article

Loïc Ferrer, Thèse en Santé Publique, Centre de Recherche Biostatistique (U1219), Inserm, Université de Bordeaux 

Résumé : Après le diagnostic d’une maladie, les patients sont généralement surveillés par des biomarqueurs mesurés de façon répétée. Dans ces populations, il est souvent crucial de prédire des probabilités cumulées individuelles d'événements tels que la rechute clinique, la mort ou plus généralement la progression, à partir des informations individuelles collectées jusqu'au temps de prédiction. Pour calculer ces prédictions dynamiques individuelles, deux principales approches ont été proposées. L'approche de modélisation conjointe modélise simultanément le processus longitudinal (mesures répétées de biomarqueurs) et le processus de survie (données de temps d'événement) en les reliant à l'aide d'une structure latente partagée. Les prédictions individuelles sont ensuite dérivées pour un temps de prédiction donné. En revanche, l'approche landmarking cherche à ajuster des modèles de survie standards en ne considérant que le sous-échantillon des patients à risque au moment de la prédiction et en incluant des prédictions de biomarqueurs jusqu'au temps de prédiction. Ces approches diffèrent notamment dans l'information utilisée, les hypothèses des modèles et la complexité des procédures computationnelles. Avec le besoin croissant d’outils individuels de prédiction de progression clinique, notamment en cancer, il est nécessaire de mieux comprendre ces approches et les contraster afin de fournir des éléments clés pour le développement et l’utilisation de prédictions dynamiques individuelles dans le suivi clinique des patients. Motivés par la prédiction de deux causes concurrentes de progression du cancer de la prostate à partir de l'histoire de l’antigène spécifique de la prostate (PSA), nous souhaitons mener une étude de simulation approfondie permettant d'évaluer et de comparer ces deux approches. Les prédictions dynamiques individuelles dérivées des modèles conjoints et des modèles landmarks seront spécifiquement comparées en termes de précision de prédiction, d’efficience et de robustesse aux hypothèses du modèle. De nouvelles techniques d’évaluation de l’incertitude autour des prédictions seront aussi proposées. Les données de simulations seront générées pour approcher au mieux plusieurs jeux de données (cohortes hospitalières et essais cliniques) issus de collaborations internationales sur lesquels seront aussi illustrées les techniques de calcul de prédiction dynamique de progression de cancer de la prostate localisé à partir des mesures répétées des PSA et des facteurs pronostiques classiques.

Présentation des travaux

Ceren Tozlu, Thèse en Santé Publique, options biostatistique et bioinformatique, Hospices Civils de Lyon

Résumé : La sclérose en plaques (SEP) est la maladie inflammatoire démyélinisante du système nerveux central la plus fréquente de l'adulte jeune. C’est une maladie invalidante dont le problème majeur est l’évaluation du pronostic à long terme. L’évolution de cette maladie est très variable d’un patient à l’autre et la prédiction de la progression individuelle de la maladie est actuellement quasiment impossible (Durand-Dubief F., 2011). L’objectif principal de ce projet est de développer un modèle de prédiction de la progression individuelle de la maladie SEP incluant en particulier des marqueurs radiologiques issus d’IRM multimodale recueillis de façon longitudinale. Les développements méthodologiques statistiques seront adaptés aux données d’imagerie et à l’inclusion de données cliniques longitudinales. Les développements seront mis en oeuvre dans le logiciel (R) et rendus accessibles sous forme de librairie. Ce projet de thèse s’inscrit dans le cadre d‘une collaboration entre l’équipe Biostatistique Santé (UMR CNRS 5558) et dans laquelle se déroulera la thèse, l’équipe « Imagerie cérébrale » du laboratoire Créatis (UMR CNRS 5220 & Inserm U1044), le service de neurologie dédié à la SEP dirigé par le Pr Sandra Vukusic, présidente de la fondation EDMUS et coordonnateur scientifique de l’OFSEP. L’équipe Biostatistique Santé (UMR CNRS 5558) a été évaluée A+ par l’AERES (2010). La dernière évaluation HCERES (campagne A 2015) effectuée au niveau du département a souligné l’excellence du niveau de publication, de l’attractivité et du rayonnement académique, et de son interaction avec l’environnement social, économique et culturel.l.

Présentation des travaux

Catherine Quinot, Thèse en Santé Publique, Unité Vieillissement et maladies chroniques - Approches épidémiologique (VIMA), INSERM

Résumé : L’utilisation de produits de nettoyage et de désinfection est un facteur de risque émergent de l’asthme lié au travail, particulièrement dans le secteur de la santé. Cependant, ces produits sont des mélanges complexes de plusieurs composés chimiques, et les substances spécifiques associées à l’asthme restent mal connues. Cela est en parti dû au fait que l’évaluation de l’exposition professionnelle aux produits de nettoyage et de désinfection est difficile dans les études épidémiologiques. Les méthodes actuellement utilisées sont la déclaration des sujets (questionnaires sur les produits qu’ils tilisent ou les substances auxquels ils sont exposés), le recours à des experts pour une estimation de l’exposition par expertise, ou encore l’utilisation de matrices emplois-expositions. Ces méthodes sont sujettes à

différents biais. Récemment dans la littérature, l’utilisation des codes-barres des produits a été suggérée afin d’estimer l’exposition à ces produits, en faisant le lien avec des bases de données contenant des informations sur leur composition.Le but de ce projet est de développer une méthode innovante permettant d’estimer l‘exposition professionnelle aux produits de nettoyage et désinfectants à partir d’une application smartphone permettant de scanner les codes-barres de ces produits. Les données collectées via l’application smartphone seront ensuite mises en relation avec une base de données contenant des informations sur des produits de nettoyage et des désinfectants utilisés par les personnels hospitaliers. Ce projet permettra le développement d’un outil fiable et standardisé pour améliorer l’évaluation des expositions professionnelles dans les études épidémiologiques. Cet outil devrait contribuer à l’identification des produits en cause dans l’asthme et à l’établissement de mesures de prévention par la réduction de l’exposition à ces produits en milieu professionnel.

Présentation des travaux


Publication : Quinot C, Amsellem-Dubourget S, Temam S, Sevin E, Barreto C, Tackin A, Félicité J, Lyon-Caen S, Siroux V, Girard R, Descatha A, Le Moual N, Dumas O. Development of a bar code-based exposure assessment method to evaluate occupational exposure to disinfectants and cleaning products: a pilot study. Occup Environ Med Published Online First: 14 May 2018. doi: 10.1136/oemed-2017-104793

Lire la publication

Hamdi Amroun, Thèse en Santé Publique, option Informatique, Analyse et Reconnaissance de l'Activité, Université Paris Saclay

 Résumé : Dans le cadre du rapprochement du LIMSI-CNRS (Orsay), laboratoire spécialisé dans le traitement des données, avec le centre hospitalier Mayo Clinic (USA), je souhaite travailler sur le développement d’un outil utilisant des objets connectés pour le suivi personnalisé et la prévention secondaire d’AVC. Cet outil pourra être utilisé par des patients, ayant subi un premier AVC, afin de leur donner un indicateur de risque avancé de rechute post-AVC dans la vie quotidienne (maison, travail et extérieur). Cet outil reposera sur un modèle de quantification du risque intégrant des marqueurs physiologiques et des marqueurs comportementaux (marqueurs corrélés avec le risque de survenue de l’AVC) qui sont compris dans les signaux capteurs retournés par les objets connectés usuels (montre connectée avec mesure de rythme cardiaque, bracelet connecté de mesure de pression artérielle, balance électronique connectée, etc.).

Marion Lecorguille, Master en Santé Publique, INSERM, Université de Paris Sorbonne

 Résumé : La pathologie thyroïdienne est la deuxième cause de maladie endocrinienne en cours de grossesse. Il est essentiel de savoir les reconnaître car celles-ci peuvent avoir un impact sur l’évolution de la grossesse et inversement. L'hypothyroïdie et l'hyperthyroïdie maternelle pendant la grossesse seraient responsables de plusieurs complications obstétricales et pendant l'enfance. Les femmes plus précisément avec des antécédents de pathologies thyroïdiennes sont susceptibles de présenter une concentration en hormones thyroïdiennes suboptimale en début de grossesse.

Présentation des travaux

Julie Havas, Master en Santé Publique, Institut de Santé Publique d’Épidémiologie et de Développement (ISPED) de l’Université de Bordeaux

Résumé : En chirurgie cardiaque, les connaissances sur l’évolution des performances hémodynamiques à long-terme des valves biologiques actuellement implantées restent faibles. La détérioration valvulaire structurelle (SVD pour Structural Valve Deterioration) est définie selon les recommandations internationales comme une détérioration valvulaire diagnostiquée au cours d’une réopération, une autopsie, ou la réalisation d’une évaluation clinique (Akins et al., 2008). L’utilisation de l’échographie est recommandée pour la réalisation du suivi clinique des bioprothèses cardiaques mais les critères échographiques à utiliser pour ce diagnostic ne sont cependant pas précis (Nishimura et al. 2014). Récemment, Sénage et al. (2014) se sont intéressés à l’incidence d’une détérioration valvulaire structurelle chez 617 patients ayant eu un Remplacement Valvulaire Aortique (RVA) dans le service de chirurgie cardiaque du CHU de Nantes entre 2002 et 2007 avec la prothèse Sorin Mitroflow®. La définition d’une SVD tenait compte de critères échocardiographiques, et, les cas échéants, de l’histologie obtenue lors d’une autopsie et de la reprise opératoire. Ils montraient le risque sous-estimé et méconnu de détérioration valvulaire de la prothèse biologique Mitroflow® avec un Hazard Ratio ajusté de décès associé à la SVD estimé à 3,5 et une incidence cumulée de SVD à 5 ans estimée à 22,0%. Une limite majeure de cette étude était le choix empirique des seuils utilisés dans le critère composite échographique. Notre hypothèse est qu’une accélération de l’augmentation des gradients transprothétiques au cours du temps pourrait indiquer une dégénérescence de la valve et être associée à la survenue d’un décès. A partir des données cliniques de ces 617 patients, nous proposons de modéliser conjointement l’évolution des gradients transprothétiques moyens et le risque de survenue d’un décès chez des patients avec RVA biologique. L’étude de l’évolution des performances des prothèses pourrait aider au pronostic précoce de dégénérescence valvulaire et ainsi permettre des recommandations pour le suivi des patients avec un RVA. Par ailleurs, une taille de prothèse inadaptée au corps du patient pourrait avoir des conséquences néfastes sur les performances d’une valve au cours du temps. Nous souhaitons étudier le rôle propre de ce facteur de risque sur l’évolution des performances hémodynamiques de la prothèse et sur le risque de décès du patient.

Présentation des travaux

Raphaël Lhote, Master en Santé Epidémiologie, Institut Pierre Louis d’épidémiologie et de santé publique

Résumé : La sarcoïdose est une maladie multi-systémique de causes inconnues caractérisée par la présence de granulomes épithélioïdes et giganto-cellulaires. Il s’agit d’une maladie habituellement bénigne touchant avec prédilection les poumons et les organes lymphatiques. Les atteintes cardiaques peuvent mettre en jeu le pronostic vital immédiat ou retardé alors que les atteintes neurologiques peuvent mettre en jeu le pronostic fonctionnel. L’objectif de cette étude est de décrire la distribution et les caractéristiques des atteintes cardiaques et neurologiques au cours de la sarcoïdose. Pour cela, nous proposons la réalisation d’une enquête épidémiologique sur la période 2010-2017 dans les centres hospitaliers universitaires, les centres hospitaliers régionaux et les centres privé à but non lucratif à valence universitaire d’Ile de France. Elle comporte deux phase : 1) identification des cas de sarcoïdose et de leurs caractéristiques à l’aide de bases de données sanitaires nationales (PMSI, SNIIRAM) 2) étude de type cas-témoins dans laquelle les patients ayant une atteinte neurologique et/ou cardiaque seront appariés à des patients ayant une sarcoïdose sans atteinte cardiaque ni neurologique. Dans cette étude, le score d’activité de la sarcoïdose (ePOST) et le score pronostique des neurosarcoïdoses seront validés.

Présentation des travaux

Clément Hervé, Master en Biostatistiques, département Epidémiologie et Biostatistiques, Université de Californie San Francisco

Résumé : La structure des troubles affectifs et comportementaux chez l’enfant et leurs liens avec le développement ultérieur de troubles psychiatriques sont encore mal connus et très débattus.

Ce projet postdoctoral a pour but d’utiliser une approche innovante pour l’analyse des phénomènes complexes (analyse de réseau) afin d’étudier cette thématique sur des données longitudinales issues d’une cohorte de 2000 enfants représentatifs de la population générale, suivis de 6 à 29 ans.

Le réseau existant entre les 42 symptômes de troubles affectifs et comportementaux collectés lors de l’enfance sera étudié et comparé entre les sujets ayant développé ou non des troubles psychiatriques à l’âge adulte. Le caractère longitudinal des données permettra d’étudier la direction (causalité) des liens entre symptômes et ainsi de mettre en évidence des cercles vicieux ou des symptômes influençant fortement les autres symptômes, informations essentielles à la mise en place de stratégies efficaces de prévention.

Projects benefiting from financial support from OpenHealth Institute as part of the 2016 campaign

Alexandra Rouquette, Post-doctorate project, Centre de Recherche en Epidémiologie et en Santé des Populations (CESP), Inserm [Epidemiology and Population Health Research Centre]

 

Abstract: The structure of emotional and behavioural disorders in childhood and their associations with the subsequent development of psychiatric disorders is still poorly known and a topic of much discussion. The purpose of this post-doctoral project is to use an innovative approach to analyse complex phenomena (network analysis) in order to explore this issue from longitudinal data from a cohort of 2000 children representative of the general population, followed from the age of 6 to 29.

The network existing between the 42 symptoms of emotional and behavioural disorders collected in childhood will be explored and compared in subjects who either developed or did not develop psychiatric disorders in adulthood. The longitudinal nature of the data will enable the direction (causality) of associations between symptoms to be studied and thereby demonstrate vicious circles or symptoms that strongly influence other symptoms, information which is essential for implementing effective prevention strategies.

Manik Kadawathagedera, Public Health Thesis, Centre de Recherche Epidémiologie et Statistique Sorbonne Paris Cité (CRESS), Inserm [Epidemiology and Statistical Research Centre]

 

Abstract: Several studies have demonstrated associations between pre-natal exposure to environmental contaminants, particularly “endocrine disruptors”, and post-natal growth (e.g. Valvi et al. 2012). Biological measurements of exposure in cohort studies are expensive and have practical difficulties.

Total diet studies (TDS) are aimed at providing a clear and realistic view of dietary exposure to major contaminants. (Anses 2011). By combining contamination data for foods to individual dietary consumption data, cohort studies estimate individual dietary exposure to contaminants, identify the preparations to which they are exposed and assess their association with health data.

The objective of my thesis is to investigate associations between exposure to dietary contaminants or exposure to mixes of contaminants and growth, the development of fat mass and its distribution in three birth cohorts, two French cohorts (EDEN and ELFE) and a Norwegian MoBa cohort.

This project will compare the results obtained in two European countries, the reproduction of results being, in epidemiology, additional confirmation of evidence. Furthermore, the number of subjects enrolled is very large which will give our analyses greater statistical power.

Bertrand Beaufils, Masters 2 internship, M2 Mathematics and Applications, Statistics specialism, Data Science major, UPMC

 

Abstract: The internship is part of a collaboration between the start-up Sysnav, a benchmark for GPS-free navigation, the DataShape team from INRIA and the clinical studies department for rare diseases in Pitié-Salpétrière.

The internship involves the study and implementation of statistical learning methods to predict the condition of a patient with Parkinson’s disease from data recorded in a controlled environment and at home using a special device covered by numerous patents involving in particular the construction of clear movement variables (trajectory).

Specifically, it involves detecting, with a minimum of errors, diseases associated with Parkinson’s disease: gait disorders, dyskinesia (sub-classes exist in dyskinesia) and shaking using movement measurements taken by the device.

Angel Eugenio Benitez Collante, Public Health Thesis, Centre de Recherche des Cordeliers, Université Paris Descartes, Inserm [Cordeliers Research Centre, Paris Descartes University]

 

Abstract: Hospitals are confronted with numerous economical and structural challenges. Various strategies are used to measure and improve hospital efficiency without altering the quality of care. The objective is to model and then analyse associations between hospital efficiency and the quality of care.

The first hypothesis is that seeking to achieve better economic efficiency could be associated with lower quality of care. The second hypothesis is that implementing effective clinical information systems can have an effect not only on efficiency, but also on the quality of care provided.

The selection of efficiency and quality indicators will be made through processes but from results in particular. Querying medical-economic data warehouses for Paris public hospitals will be followed by data validation. Statistical calculations will use both parametric and non-parametric methods and various econonometric models.

Statistical research will be done extracted from data warehouses for data from 20 short-stay Paris public hospitals during the period from 2008-2015. They will involve the analysis of associations and selected indicators of data maturity, economic efficiency and quality of care.

Agnieszka Krol, Public Health Thesis, Biostatistics option, Ecole Doctorale Sociétés, Politique, Santé Publique (EDSP2), Université de Bordeaux [Doctoral Societies, Politics, Public Health School, Bordeaux University]

 

Abstract: RECIST criteria are used as a standard tool for the clinical assessment of cancer treatments. The assessment is based on the anatomical bulk of the tumour, i.e. the change in the sum of the longest diameters of target lesions and the change of non-target lesions: appearance of new lesions and unequivocal progression of non-target lesions determined prior to treatment.

Despite the unquestionable advantages of this standard tool, it does however have certain limitations such as the categorisation of the continuous size of the tumour or disregard of its longitudinal trajectory. Particularly, it is interesting to grasp the tendency to reduce in the short term and the re-growth in the long term of tumoral size which is often seen with an advanced cancer treatment and to model this trajectory simultaneously with the time of the event.

Events of interest can be time to progression of non-target lesions and overall survival. This complex analysis can be performed by using multivaried models with shared fragility for longitudinal and survival data. Furthermore, considering the progression of the disease over time can enable dynamic predictions for overall survival to be constructed.

Arlette Edjolo, Post-doctorate project, ISPED, Bordeaux University

 

Abstract: The increasingly central role of computerized medical data and the movement towards patient-centered medicine requires the production of sufficiently conclusive data to be able to be part of the Big Data era. Criteria for measurements reported by patients (Patient-Reported Outcomes or PROs) provide complex and subjective information about symptoms, the functioning and the quality of life related to health.

PROs, by supplementing medical data (clinical examinations, biology, imaging etc.) or a health system (consumption of care, environment, etc.), open the field of possibilities. However, standardisation and harmonisation efforts are essential. In 2004, the American national institute of health (NIH) initiated a standardised measurement system: PROMIS (Patient Reported Outcomes Measurement Information System).

Initially in English, almost all the item banks of PROMIS have been translated. Therefore, the Dutch-Flemish PROMIS group successfully translated the bank of items of interfering and behavioural components of the pain scale, testimony of the good trans-cultural reliability of the scale.

However, one of the aspects of the potentially massive data not to be neglected in particular is its longitudinal nature. In the case of PROMIS data, it is important to have a stable measurement between various cultural groups, but it is also essential to ensure its stability over time.

This post-doctoral project is intended to analyse the longitudinal invariance of Dutch pain measurement scales (Dutch-Flemish PROMIS Pain Scales). Depending on the results, the analysis will confirm the success of the previously validated scale or will lead to an adaptation of item banks in order to reinforce the conceptual validity, reliability and accuracy of scales. More widely, this research will contribute to the development of relevant standardised PRO data which is even more reliable and valid for Big Data in future health.

Hélène Tubeuf, Biology Thesis, lnstitut de Recherche et d'lnnovation Biomédicale de Haute-Normandie, Inserm, Université de Rouen [Biomedical Innovation and Research Institute of Haute-Normandie]

 

Abstract: One of the major challenges in medical genetics is the interpretation of unknown significance variations (USV). This issue is particularly significant in onco-genetics, especially in the context of the two most common forms of hereditary cancer: Lynch syndrome and breast-ovary syndrome.

These syndromes respectively result from mutations of the MMR and BRCA genes, USVs represent ~30% of the variations detected. We demonstrated, thanks to functional tests based on the use of mini-genes, that a significant fraction of these USVs are the source of splicing defects. However, most USVs remain to be analysed.

Our recent research suggests that two new algorithms, one of which was developed by our group, could predict the impact of certain USVs on splicing, and stratify the functional analyses. This project is aimed, using the BRCA and MMR genes as models, at evaluating the performance of these new bio-informational approaches for the prediction of changes to exonic splicing regulatory (ESR) elements, particularly those based on ESRseq scores and developed by our laboratory.

This evaluation will be made by comparing predications obtained from a large number of variations listed in national and international databases and the experimental results obtained in mini-gene tests. The second part of the project will be focused on “model exons”, corresponding to extreme cases of consistency-discordance between informational predictions and experimental data, with an extensive mutational analysis.

The last step of the project will be to map exonic splicing regulatory regions for these “model exons” by an exon strategy by using a functional “ESR-dependent” test. This project will optimize the molecular diagnosis of hereditary cancers and should contribute to the interpretation of USVs identified by high speed sequencing in other diseases.

Iryna Nikolayeva, Thèse en Biologie, Systems Biology Laboratory, Institut Pasteur

 

Abstract: Recently, significant efforts have been undertaken to identify genes relevant for a large number of diseases—including dengue—using genomics. Most results, based on the analysis of variation in single genes, have been underwhelming, and the majority of risk factors remain elusive. Many higher-level phenotypes appear to be associated with variations across multiple genes.

The joint analysis of multiple loci in known pathways takes this into account, but the restriction to known pathways limits the explanatory power of this approach. Similar to pathway-based approaches, network-based approaches aggregate information across multiple loci and even genes. But network-based approaches address a much larger search space: Instead of choosing among a relatively limited number of known pathways, network-based approaches need to consider any connected subnetwork of molecules interrelated by molecular or functional interactions.

My project aims to develop, adapt, and apply leading network-based approaches for the integrative analysis of genome data to implicate novel molecular networks in the etiology of dengue virus infection. This project is a collaboration between an experimental lab with a focus on dengue and malaria and a computational (systems biology) research lab at the Pasteur Institute. It creates a new interface between these groups and is supported by broad existing expertise in infectious disease, statistics, and algorithms, and capacity for experimental/clinical follow-up.

Your personal space

Lost password?

News

November 21
November 21
November 21