Thèse pour obtenir le grade de








télécharger 3.33 Mb.
titreThèse pour obtenir le grade de
page12/36
date de publication21.01.2018
taille3.33 Mb.
typeThèse
b.21-bal.com > droit > Thèse
1   ...   8   9   10   11   12   13   14   15   ...   36

II.Analyse du problème de la reconnaissance des interactions


Le principe de l’analyse a été posé dans la section Partie 1 Chapitre 3 I.C.2 et notamment dans l’Équation 2. Il nous reste à préciser la méthode, et notamment dire comment d’une part prendre en compte la présence d’un ou plusieurs gènes dans une phrase et d’autre part, comment combiner cette information avec l’existence d’un IVI favorable pour arriver à extraire l’information.

Nous analyserons tout d’abord (partie A) la question de l’extraction d’information sur les interactions, indépendamment de la méthode mise en œuvre ; avant de passer (partie B) aux difficultés que pose la méthode que nous proposons.

A.Complexité de la reconnaissance des interactions


Cette complexité tient à la nature même de la tâche, indépendamment de la méthode mise en œuvre pour y parvenir.

Il s’agit en particulier de trouver une définition pertinente de la notion d’interaction. En effet, dans le travail de Pillet, on est parti du principe que les interactions étaient représentées par des couples de gènes. Cela découlait en réalité d’une technique d’extraction de l’information qui voulait que l’on ne s’intéresse qu’aux seules phrases qui contiennent exactement deux occurrences de gènes. Le travail sur Medline s’est fait sans ce présupposé. C’est à dire que l’on a annoté toutes les phrases, quel que soit le nombre de gènes cités dans celles-ci. On se rend compte alors, à la lecture des textes, qu’il est parfois difficile de réduire l’information contenue dans une phrase à des listes de couples de gènes en interaction.

Il est vrai que l’on peut concevoir un ensemble de gènes en interaction comme un réseau de gènes en interactions moléculaires. Cependant, certains des chaînons de ce réseau font parfois intervenir plus de deux gènes. On ne peut donc réduire le réseau à une liste d’interaction deux à deux. De plus, les faits décrits dans les textes ne portent pas toujours sur des interactions moléculaires. Plus précisément, il s’agit souvent de chemins de signalisation et de groupes de gènes en interaction, ce qui ne peut se ramener entièrement à un ensemble d’interactions direct ou non.
1.Partenaires mal définis

Il arrive fréquemment que les auteurs énoncent des interactions entre des objets qui ne sont pas des gènes à proprement parler, mais des collections de gènes, c’est à dire des objets de type famille de protéines, complexe de protéines ou complexe de gènes. L’exemple 85 illustre le cas particulier d’une interaction faisant intervenir un complexe de gènes.

Exemple 18 Interaction faisant intervenir des groupes de gènes

Cette phrase énonce une interaction entre le complexe de gènes Achaete-scute Complex (ASC) et le gène daughterless (da).

The products of the achaete-scute complex and daughterless interact to form heterodimers able to activate transcription

Cette information ne peut, en toute rigueur, se traduire par l’ensemble des interactions entre le gène daughterless et les membres du complexe Achaete-scute. Cependant le vocabulaire de l’interaction est bien présent avec ce type d’énoncé, de sorte que l’on risque d’introduire une distorsion dans les statistiques si on ne note aucune interaction.

La solution idéale consiste à mentionner l’interaction même si elle fait intervenir un groupe de gènes comme un complexe. C’est aussi l’intérêt d’un système de reconnaissance des gènes qui prennent en compte les complexes de gènes. Une solution alternative, et qui a beaucoup été employée lors de l’annotation manuelle, consiste à noter une interaction mais sans préciser tous les partenaires de celle-ci. Dans le cas présent seul le partenaire daughterless sera noté, l’autre partenaire restant vide.

L’exemple suivant illustre le cas d’une interaction entre un gène d’une part, et une famille de protéines d’autre part. Cette information ne peut pas se traduire en toute rigueur par un ensemble d’interactions entre d’une part, le gène et d’autre part, les gènes qui codent pour chacun des éléments de la famille de protéines.

Exemple 19 Interaction faisant intervenir des familles de protéines

Cette phrase énonce une interaction entre le gène TATA binding protein (Tbp) et la famille de protéines Heat-shock-protein-70 (hsp70).

Immunopurified TFIID produces a large DNase I footprint over the hsp70, hsp26, and histone H3 promoters of Drosophila

Ce type d’information n’a pas été systématiquement pris en compte par les annotateurs. En conséquence on ne connaît pas l’importance numérique de ce type d’information.
2.Interaction et ordre

Dans certains cas, le texte ne précise pas le sens de l’interaction. Ceci est illustré dans l’exemple 86.

Exemple 20 Interaction non ordonnée

Dans cette phrase, le sens de l’interaction entre le gène brahma (brm) et le gène absent, small, or homeotic discs 1 (ash1) n’est pas précisé.

Mutations in the gene brahma (brm) which also is one of the trithorax set of genes interact with mutations in ash1 such that non-lethal ash1 +/+ brm double heterozygotes have a high penetrance of homeotic transformations in specific imaginal disc- and histoblast-derived tissues

Les interactions seront donc caractérisées d’ordonnées ou de non ordonnées. Quand il est possible de dire à la lecture du texte quel est l’ordre, c’est à dire de préciser quel est le gène qui a une influence sur l’expression de l’autre gène, alors cette information est consignée dans une interaction ordonnée. Dans la base coexistent des interactions ordonnées et des interactions non ordonnées. Cependant nous n’avons pas cherché, lors de l’annotation automatique, à proposer un ordre. Autrement dit, les annotations faites par le programme sont toutes de type non-ordonnées. La confrontation des annotations de l’expert avec celles de la machine reste cependant possible car toute interaction ordonnée peut être dégradée en une interaction non ordonnée : il suffit de conserver l’information sur les partenaires et d’oublier celle qui concerne l’ordre. Nous verrons mieux cela dans la partie résolution des problèmes dans la section Chapitre 2 II.A.

Dans les textes, le sens des interactions est généralement précisé, comme on peut le constater au vu des chiffres du Tableau 31.

Tableau 31 Interaction et ordre

Chaque interaction est caractérisée d’ordonnée ou non. Les interactions sans précision d’ordre sont moins fréquentes mais ne sont pas quantité négligeable. Les chiffres sont issus de l’annotation manuelle de l’échantillon A.

Ordre précisé

Fréquence

Proportion

Oui

310

92%

Non

28

8%

Total

338

100%

L’ordre a été précisé à chaque fois que cela était possible dans l’annotation des textes. D’autres informations auraient pu l’être mais ne l’ont pas été, telles que le sens (activation ou inhibition), le caractère moléculaire ou génétique de l’interaction ou le type d’expérience ayant mis en évidence l’interaction.
3.Partenaires de l’interaction non identifiés

Dans certains cas, l’auteur ne précise pas quels sont les gènes en présence dans une interaction. Cela est illustré dans l’exemple suivant.

Exemple 21 Partenaires de l’interaction non identifiés

Dans cette phrase, des interactions entre vasa et quatre autres gènes sont énoncées, mais on ne dit pas quels sont les partenaires en question.

We have found that localization of vasa to the perinuclear nuage is abolished in most vas alleles, but is unaffected by mutations in four genes required upstream for its pole plasm localization

La question est de savoir s’il faut prendre en compte ou non ce type d’information, et si oui comment. Il serait préjudiciable de ne pas du tout en tenir compte. En effet, ce type de phrase, même si elle n’énonce pas une interaction claire, utilise quand même le vocabulaire de l’interaction. Ainsi, lors de l’étude du vocabulaire de l’interaction, il faut considérer ce type de phrase comme un énoncé d’interaction.
1   ...   8   9   10   11   12   13   14   15   ...   36

similaire:

Thèse pour obtenir le grade de iconTHÈse pour obtenir le grade de

Thèse pour obtenir le grade de iconThèse Pour obtenir le grade de

Thèse pour obtenir le grade de iconTHÈse pour obtenir le grade de Docteur

Thèse pour obtenir le grade de iconThèse Pour obtenir le grade de
«capricieuse»!!! Merci également de m’avoir permis d’être impliqué dans des collaborations (eth zurich) et dans un programme Européen...

Thèse pour obtenir le grade de iconThèse présentée pour l’obtention du grade de Docteur

Thèse pour obtenir le grade de iconThèse pour l’obtention du grade de docteur de l’université

Thèse pour obtenir le grade de iconThèse pour obtenir le titre de

Thèse pour obtenir le grade de iconThèse présentée en vue de l'obtention du grade de

Thèse pour obtenir le grade de iconThèse présentée en vue d’obtenir

Thèse pour obtenir le grade de iconCe site permet d’obtenir les liens pour disposer de l’intégralité des programmes de Maths








Tous droits réservés. Copyright © 2016
contacts
b.21-bal.com