Application De M Thodes De Classification Supervis E Et Int Gration De Donn Es H T Rog Nes Pour Des Donn Es Transcriptomiques Haut D Bit

Download Application De M Thodes De Classification Supervis E Et Int Gration De Donn Es H T Rog Nes Pour Des Donn Es Transcriptomiques Haut D Bit PDF/ePub or read online books in Mobi eBooks. Click Download or Read Online button to get Application De M Thodes De Classification Supervis E Et Int Gration De Donn Es H T Rog Nes Pour Des Donn Es Transcriptomiques Haut D Bit book now. This website allows unlimited access to, at the time of writing, more than 1.5 million titles, including hundreds of thousands of titles in various foreign languages.
Application de méthodes de classification supervisée et intégration de données hétérogènes pour des données transcriptomiques à haut-débit

Machine learning methods have been applied to microarray datasets since very recently. Their use aims at extracting differentially expressed genes between different classes and at building a classification function able to predict the class of a new individual. ln addition to microarray data, one can have information on the interactions between the variables (genes). This information is gathered into Gene Regulation Networks (GRN). The goal of the thesis was to integrate one or several GRNs into a binary supervised classification task of microarray data. We propose a new method, graph Constrained Discriminant Analysis (gCDA), based on Fisher's Discriminant Analysis. The methods from the literature propose to implement the following constraint: genes connected in the GRN should have similar weights in the classification function. ln counterpoint to these methods, gCDA is based on new estimator of covariance matrices able to take into account the information in the GRNs at hand. gCDA is compared to the existing methods with simulated datasets, for which we know exactly the interactions between variables. For real datasets however, the underlying graph is not known. We consequently have also turned our work towards graph inference methods. Finally, we analyzed three real datasets. The GRNs were inferred either on an independent part of the dataset or on another dataset of the same nature. We show that gCDA performs better than the other methods.
A data-based approach for dynamic classification of functional scenarios oriented to industrial process plants

L'objectif principal de cette thèse est de développer un algorithme dynamique de partitionnement de données (classification non supervisée ou " clustering " en anglais) qui ne se limite pas à des concepts statiques et qui peut gérer des distributions qui évoluent au fil du temps. Cet algorithme peut être utilisé dans les systèmes de surveillance du processus, mais son application ne se limite pas à ceux-ci. Les contributions de cette thèse peuvent être présentées en trois groupes: 1. Contributions au partitionnement dynamique de données en utilisant : un algorithme de partitionnement dynamique basé à la fois sur la distance et la densité des échantillons est présenté. Cet algorithme ne fait aucune hypothèse sur la linéarité ni la convexité des groupes qu'il analyse. Ces clusters, qui peuvent avoir des densités différentes, peuvent également se chevaucher. L'algorithme développé fonctionne en ligne et fusionne les étapes d'apprentissage et de reconnaissance, ce qui permet de détecter et de caractériser de nouveaux comportements en continu tout en reconnaissant l'état courant du système. 2. Contributions à l'extraction de caractéristiques : une nouvelle approche permettant d'extraire des caractéristiques dynamiques est présentée. Cette approche, basée sur une approximation polynomiale par morceaux, permet de représenter des comportements dynamiques sans perdre les informations relatives à la magnitude et en réduisant simultanément la sensibilité de l'algorithme au bruit dans les signaux analysés. 3. Contributions à la modélisation de systèmes à événements discrets évolutifs a partir des résultats du clustering : les résultats de l'algorithme de partitionnement sont utilisés comme base pour l'élaboration d'un modèle à événements discrets du processus. Ce modèle adaptatif offre une représentation du comportement du processus de haut niveau sous la forme d'un automate dont les états représentent les états du processus appris par le partitionnement jusqu'à l'instant courant et les transitions expriment l'atteignabilité des états.
Application d'algorithmes de machine learning pour l'exploitation de données omiques en oncologie

Le développement de l'informatique en médecine et en biologie a permis de générer un grand volume de données. La complexité et la quantité d'informations à intégrer lors d'une prise de décision médicale ont largement dépassé les capacités humaines. Ces informations comprennent des variables démographiques, cliniques ou radiologiques mais également des variables biologiques et en particulier omiques (génomique, protéomique, transcriptomique et métabolomique) caractérisées par un grand nombre de variables mesurées relativement au faible nombre de patients. Leur analyse représente un véritable défi dans la mesure où elles sont fréquemment « bruitées » et associées à des situations de multi-colinéarité. De nos jours, la puissance de calcul permet d'identifier des modèles cliniquement pertinents parmi cet ensemble de données en utilisant des algorithmes d'apprentissage automatique. A travers cette thèse, notre objectif est d'appliquer des méthodes d'apprentissage supervisé et non supervisé, à des données biologiques de grande dimension, dans le but de participer à l'optimisation de la classification et de la prise en charge thérapeutique des patients atteints de cancers. La première partie de ce travail consiste à appliquer une méthode d'apprentissage supervisé à des données d'immunogénétique germinale pour prédire l'efficacité thérapeutique et la toxicité d'un traitement par inhibiteur de point de contrôle immunitaire. La deuxième partie compare différentes méthodes d'apprentissage non supervisé permettant d'évaluer l'apport de la métabolomique dans le diagnostic et la prise en charge des cancers du sein en situation adjuvante. Enfin la troisième partie de ce travail a pour but d'exposer l'apport que peuvent présenter les essais thérapeutiques simulés en recherche biomédicale. L'application des méthodes d'apprentissage automatique en oncologie offre de nouvelles perspectives aux cliniciens leur permettant ainsi de poser des diagnostics plus rapidement et plus précisément, ou encore d'optimiser la prise en charge thérapeutique en termes d'efficacité et de toxicité.