Thèse pour obtenir le grade de








télécharger 3.33 Mb.
titreThèse pour obtenir le grade de
page25/36
date de publication21.01.2018
taille3.33 Mb.
typeThèse
b.21-bal.com > droit > Thèse
1   ...   21   22   23   24   25   26   27   28   ...   36

D.Nouvelles directions de recherche


Les résultats que nous avons obtenus nous amènent à proposer de nouvelles directions de recherche qui pourraient être envisagé. Il s’agit d’améliorer la sélection des phrases qui semble décrire une interaction, soit par un meilleurs prise en compte du vocabulaire présent, soit en utilisant le MeSH.
1.Amélioration du calcul de l’IVI

Du point de vue de la biologie, les interactions n’ont pas toutes la même valeur. Certaines interactions sont plus importantes que d’autres, ne serait-ce que parce que des gènes importants y participent. Ces interactions vont être énoncées dans les textes que nous étudions un nombre important de fois. Or dans les statistiques que nous avons réalisées, toutes les interactions se valent. Il serait peut-être plus logique de mettre plus de poids aux erreurs faites sur les interactions fréquemment énoncées dans les textes. Les résultats seraient alors plus flatteurs car on a moins de chance de se tromper sur des interactions énoncées de nombreuses fois.

L’indicateur statistique que nous utilisons est extrêmement simple. La spécificité d’un terme est définie comme une proportion. Une abondante littérature existe sur les modèles mathématiques associés aux mots-clefs (Salton et al., 1983).Ces modèles servent à optimiser le calcul des poids associés aux mots clefs. Il s’agit de favoriser les mots fortement discriminants. Par exemple Marcotte et al. (2001) proposent seulement 80 mots-clefs pour discriminer des résumés. Dans leur travail, il s’agit de distinguer les résumés qui décrivent une interaction entre protéines, de ceux qui n’en décrivent pas. Le modèle mathématique qu’ils utilisent leur permet de calculer quelle est l’hypothèse la plus probable quand une série de mots-clefs est observée. Quand c’est la présence d’une interaction qui est la plus probable, le résumé est retenu pour compléter automatiquement une base de données sur les interactions entre protéines. Ce travail d’extraction d’information a été utilisé pour compléter la base DIP (voir plus loin). Les 80 mots-clefs et les poids associés à ces mots-clefs ont été calculés par apprentissage à partir de données déjà présentes dans la base de données DIP.

Database of Interacting Proteins (DIP) est une base de donnée multi-organismes sur les interactions entre protéines (Xenarios et al., 2000). Dans cette base de donnée relationnelle, l’information est organisée en trois tables principales. La première contient des informations sur les protéines, par exemple leurs numéros dans SwissProt ou GenBank. La deuxième table contient les informations sur les interactions proprement dites : partenaires concernés, domaine concerné, etc. La troisième contient des informations sur les conditions dans lesquels ces interactions ont été mises en évidence : références bibliographiques, type d’expérimentation mise en œuvre, etc.

Nous pourrions nous inspirer de la méthode proposée par Marcotte et al. pour calculer un IVI fondé sur un modèle mathématique classique. Nous pouvons espérer une amélioration des performances de cette façon, sans rien changer d’autre que la formule de calcul de la spécificité.

Les interactions génétiques ou moléculaires sont de nature variée. Chaque type d’interaction a probablement son propre vocabulaire spécifique. Nous aurions intérêt à prendre en compte ce phénomène pour déterminer le vocabulaire spécifique et pour calculer la spécificité des termes. Ainsi, nous pourrions déterminer le vocabulaire spécifique et la spécificité des termes pour chaque type d’interactions. Nous pourrions par exemple distinguer quatre types d’interactions : les interactions entre protéines, les interactions protéines--ADN, les interactions protéines--ARN et les interactions d’un gène avec ses propres produits. Nous pensons que les termes discriminants apparaîtraient mieux, car les ensembles seraient plus homogènes. De plus, cela permettrait de faire la distinction entre plusieurs type d’interactions.
1   ...   21   22   23   24   25   26   27   28   ...   36

similaire:

Thèse pour obtenir le grade de iconTHÈse pour obtenir le grade de

Thèse pour obtenir le grade de iconThèse Pour obtenir le grade de

Thèse pour obtenir le grade de iconTHÈse pour obtenir le grade de Docteur

Thèse pour obtenir le grade de iconThèse Pour obtenir le grade de
«capricieuse»!!! Merci également de m’avoir permis d’être impliqué dans des collaborations (eth zurich) et dans un programme Européen...

Thèse pour obtenir le grade de iconThèse présentée pour l’obtention du grade de Docteur

Thèse pour obtenir le grade de iconThèse pour l’obtention du grade de docteur de l’université

Thèse pour obtenir le grade de iconThèse pour obtenir le titre de

Thèse pour obtenir le grade de iconThèse présentée en vue de l'obtention du grade de

Thèse pour obtenir le grade de iconThèse présentée en vue d’obtenir

Thèse pour obtenir le grade de iconCe site permet d’obtenir les liens pour disposer de l’intégralité des programmes de Maths








Tous droits réservés. Copyright © 2016
contacts
b.21-bal.com