Thèse pour obtenir le grade de








télécharger 3.33 Mb.
titreThèse pour obtenir le grade de
page21/36
date de publication21.01.2018
taille3.33 Mb.
typeThèse
b.21-bal.com > droit > Thèse
1   ...   17   18   19   20   21   22   23   24   ...   36

III.Interface de visualisation des données contenues dans la base de données


Nous avons conçu une interface originale de visualisation des données présentes dans la base. Il s’agit de voir sur un même écran plusieurs types d’informations. En particulier nous nous intéressons aux liens entre, d’une part l’IVI et les occurrences de gènes et, d’autre part la présence d’interaction. Par ailleurs, nous souhaitons pouvoir confronter annotations automatiques et annotation manuelle.

A.Confrontation entre indices et faits sur les interactions


L’interface que nous proposons permet de visualiser sur des cas concrets la véracité de notre postulat de base. En effet, elle permet pour un résumé donné, de montrer à la fois IVI, présence de gènes et présence d’interactions. Le formulaire de consultation des données sur les annotations est présenté sur la Figure 2.

Pour cela, trois graphiques sont présentés à gauche de l’écran. Celui du haut permet de connaître l’IVI de chaque phrase du résumé. Cela donne tout d’abord une idée globale sur le résumé, à savoir sa propension à décrire des interactions. Cela permet aussi de voir dans quelle partie du résumé il semble qu’il y ait des descriptions d’interaction.

Le graphique du milieu permet de voir quelle sont les gènes en présence dans le résumé. La légende établit la liste de tous les gènes. Les noms utilisés sont ici les symboles, de façon à ne pas encombrer inutilement le graphique. Ce graphique permet aussi de connaître la répartition dans les phrases. En particulier on repère immédiatement les phrases qui comptent plus de deux gènes.

On peut alors faire la synthèse des informations contenues dans les deux premiers graphiques en repérant les phrases qui ont un bon IVI et qui citent deux gènes au moins. Ce sont les phrases potentiellement porteuses d’interactions.

Le graphique du bas permet de confronter cette prévision avec la réalité. Les interactions y sont représentées.

La partie droite de l’écran donne des informations sur une des phrases du résumé. Dans l’instantané qui est présenté, il s’agit de la phrase 9. La partie supérieure donne le texte de la phrase. La partie médiane donne les identifications de gènes faites dans la phrase. Chaque ligne correspond à une reconnaissance de gènes, avec position, label reconnu et gène attribuée. La partie inférieure donne les interactions reconnues dans la phrase avec partenaires et ordre.

Sur le résumé que nous présentons, nous pouvons faire plusieurs constats, qui nous amènent à des investigations plus précises.

Nous voyons que les choses se sont bien passées sur la phrase 5. Cette phrase à un IVI très favorable de 0,08. De plus cette phrase cite un grand nombre de gènes. Elle a donc toutes les chances de décrire des interactions. Nous observons que c’est effectivement le cas. En revanche, il est difficile de dire combien d’interactions seront présentes. Dans cet exemple, il y a 5 gènes dans la phrase, ce qui fait 10 interactions possibles si l’on ne compte pas les auto-interactions et si on ne prend pas en compte la direction des interactions. Dans la réalité, il n’y en a que 7.

La phrase 4 avait un IVI bien plus fort mais ne citait qu’un seul gène. On est donc très satisfait de ne voir aucune interaction dans cette phrase. Cependant la présence d’un IVI fort parait assez étonnant pour une phrase qui ne décrit pas d’interaction. Une investigation plus poussée nous permet de comprendre le phénomène. En réalité la phrase, qui a déjà été présentée Exemple 18 page 85, décrit une interaction, mais cette interaction fait intervenir un complexe de gènes et non un gène. Cette interaction a été notée par l’annotateur mais elle ne figure pas dans le graphique car il ne prend en compte que les gène au sens strict. Il est naturel que l’IVI soit grand car il y a bien un vocabulaire de l’interaction. C’est notre définition restrictive des interactions qui est la source du paradoxe de cette phrase à fort IVI mais sans interaction.

Le cas de la phrase 9 est lui aussi favorable. En effet, l’IVI de cette phrase est plutôt favorable. Il est de -0,04. Le fait qu’il soit négatif n’est pas déterminant car il n’y à aucune raison de comparer systématiquement les IVI à zéro. A titre de comparaison l’IVI moyen des phrases liées à Flybase est de -0,09. Par ailleurs la phrase cite deux gènes. On peut donc s’attendre à une interaction entre ces deux gènes. Le graphique du bas permet de vérifier que c’est effectivement le cas.

La phrase 8 décrit la même interaction bien que cette fois l’IVI ne soit pas favorable. Le système n’a donc pas bien fonctionné avec cette phrase.

En revanche le système a bien fonctionné pour la phrase 6 qui fait intervenir les mêmes gènes mais qui ne décrit pas d’interactions entre eux.

La phrase 2 pose un autre type de problème. On n’a pas d’interaction bien que l’IVI soit très favorable et qu’il y ait trois gènes en présence. La phrase est présentée dans l’Exemple 26 ci-dessous.

Exemple 26 Phrase délicate à cause de la proposition whereas

l’auteur suggère par l’utilisation de la conjonction whereas que l’activation par achaete-scute complex et daughterless, d’une part, et l’inhibition par extramacrochaete et hairy, d’autre part, sont des phénomènes indépendants.

Sensilla development is promoted by members of the achaete-scute complex and the daughterless gene whereas it is suppressed by whereas extramacrochaete (emc) and hairy.

Nous voyons que seul la présence de la conjonction whereas permet de dire qu’il n’y a pas interaction. Il se trouve que whereas ne fait pas partie des termes spécifiques. On peut faire ce constat Figure 4. Cette copie d’écran correspond au même formulaire que dans la Figure 2 mais dans une zone qui était « hors champ ». Dans le cas présent, le système risque donc de générer par erreur des interactions entre les gènes en présence dans la phrase.

B.Confrontation entre l’annotation manuelle et l’annotation automatique


Une autre façon d’observer si la méthode que nous proposons fonctionne sur un résumé donné, consiste à comparer directement annotation manuelle et annotation automatique. Cette comparaison vaut aussi bien pour les identifications de gènes que pour les reconnaissances d’interactions.

On modifie alors de critère de sélection des informations présentées à l’écran de façon à voir à la fois l’annotation manuelle et une partie des annotations automatiques. Cette modification se fait au niveau des requêtes jacentes aux formulaires. Une copie d’écran est présentée Figure 3.

L’instantané présenté correspond à la phrase 8 du résumé précédemment étudié. On découvre une partie du formulaire qui était hors champ sur la Figure 2. La phrase est donnée en haut de l’écran. On constate qu’il y a eu une erreur de segmentation de la phrase. L’annotateur a coché la case correspondante en haut à droite.

La partie centrale en vert montre les reconnaissances de définitions de gènes. Plusieurs nouveaux champs ont été rajoutés par rapport à la figure précédente. Le premier champ correspond au processus de reconnaissance qui a été mis en œuvre. Il s’agit ici une fois sur deux d’un processus automatique. La première reconnaissance n’a pas été retenue par le système d’identification automatique des gènes. Cela est indiqué par le champ Prendre qui n’est pas coché. La raison est indiquée dans le champ processus qui indique que le label, small en l’occurrence, n’as pas été confirmé. En effet, small aurait dû l’être pour être interprété car il est ambigu comme cela est indiqué dans le champ reconnaître. Nous voyons que l’expert n’a pas non plus reconnu cette définition en position 41, car il n’y a pas d’enregistrement correspondant. Les autres reconnaissances automatiques sont toutes de type prendre et elles ont bien été confirmées par l’annotateur.

Le sous-formulaire du bas en bleu montre les reconnaissances d’interactions faites sur la même phrase soit par l’annotateur soit par le programme. Nous n’avons présenté que les annotations automatiques faites au cours du processus 2G. L’annotation du programme et de l’expert coïncident dans cet exemple, à ceci près que l’annotation du programme est moins précise, puisqu’elle n’indique pas le sens de l’interaction.

C.Autres informations sur le résumé


Le même formulaire de consultation des annotations donne aussi accès à d’autres informations comme présenté dans la Figure 4.

Le résumé en entier est présenté en bas à droite. Juste au-dessus, on trouve des informations propres au résumé dans son entier comme le numéro Medline, l’IVI du résumé ou l’annotateur du résumé.

Le sous-formulaire, au haut à droite, présente la ou les phrases de Flybase qui ont un lien avec le résumé. La présence d’une description d’interaction est notée dans le champ validation. Pour plus de détail on se reportera au Tableau 60 qui décrit la structure de la table des phrases extraites de Flybase. Cette table, dont la structure est provisoire est intitulée IPF_PF_IRM_.

Le sous-formulaire à gauche fournit des informations sur le calcul de l’IVI. Les informations présentées se rapportent à une des phrases du résumé. Dans le cas présent, il s’agit de la phrase de l’Exemple 26. La colonne fréquence donne le nombre de phrases de Flybase qui utilisent le lemme associé au terme. Si elle est faible, cela peut expliquer une valeur inattendue de la spécificité.

Tableau 69 Interactions extraites par le programme (processus 2G)

Le seuil choisit pour l’IVI est –0,1. Le tableau est listé dans l’ordre alphabétique sur la première colonne puis sur la seconde colonne. Les interactions en gras ont été confirmées par l’expert.

Gène 1

Gène 2

abdominal A (abd-A)

Ultrabithorax (Ubx)

achaete (ac)

hairy (h)

armadillo (arm)

shaggy (sgg)

armadillo (arm)

wingless (wg)

bicoid (bcd)

hunchback (hb)

bicoid (bcd)

nanos (nos)

bicoid (bcd)

oskar (osk)

bicoid (bcd)

runt (run)

bicoid (bcd)

Serendipity delta (Sry-delta)

brahma (brm)

absent, small, or homeotic discs 1 (ash1)

cactus (cact)

dorsal (dl)

cdc2

Cdc37

cdc2c

Cyclin E (CycE)

clift (cli)

zeste (z)

concertina (cta)

folded gastrulation (fog)

copia element (copia)

Lighten up (Lip)

crossveinless (cv)

yellow (y)

Cyclin A (CycA)

cdc2

Cyclin A (CycA)

roughex (rux)

decapentaplegic (dpp)

hedgehog (hh)

decapentaplegic (dpp)

screw (scw)

decapentaplegic (dpp)

thickveins (tkv)

decapentaplegic (dpp)

tolloid (tld)

decapentaplegic (dpp)

wingless (wg)

dishevelled (dsh)

wingless (wg)

Distal-less (Dll)

Ultrabithorax (Ubx)

dorsal (dl)

decapentaplegic (dpp)

dorsal (dl)

Dorsal switch protein 1 (Dsp1)

dorsal (dl)

empty spiracles (ems)

dorsal (dl)

torso (tor)

dorsal (dl)

zerknullt (zen)

doublesex (dsx)

transformer (tra) {valide}

doublesex (dsx)

transformer 2 (tra2)

DP transcription factor (Dp)

E2F transcription factor (E2f)

dunce (dnc)

shibire (shi)

easter (ea)

snake (snk)

EGF receptor (Egfr)

rhomboid (rho)

engrailed (en)

extradenticle (exd)

engrailed (en)

Ultrabithorax (Ubx)

engrailed (en)

wingless (wg)

Enhancer of Polycomb (E(Pc))

Suppressor of zeste 2 (Su(z)2)

Enhancer of split (E(spl))

Notch (N)

even skipped (eve)

fushi tarazu (ftz)

extra macrochaetae (emc)

scute (sc)

fork head (fkh)

trithorax (trx)

groucho (gro)

hairy (h)

gurken (grk)

EGF receptor (Egfr)

gurken (grk)

rhomboid (rho)

gypsy element (gypsy)

flamenco (flam)

Heterogeneous nuclear ribonucleoprotein at 27C (Hr…

P-element somatic inhibitor (Psi)

Histone H1 (His1)

High mobility group protein D (HmgD)

huckebein (hkb)

serpent (srp)

huckebein (hkb)

snail (sna)

hunchback (hb)

Kruppel (Kr)

hunchback (hb)

nanos (nos)

inflated (if)

myospheroid (mys)

Jun-related antigen (Jra)

sevenless (sev)

knirps (kni)

knirps-like (knrl)

knirps (kni)

Kruppel (Kr)

pole hole (phl)

EGF receptor (Egfr)

Rac1

Cdc42

Ras oncogene at 85D (Ras85D)

rolled (rl)

sans fille (snf)

Sex lethal (Sxl)

Sex lethal (Sxl)

male-specific lethal 1 (msl-1)

Sex lethal (Sxl)

transformer (tra) {valide}

shaggy (sgg)

wingless (wg)

sloppy paired 1 (slp1)

sloppy paired 2 (slp2)

snail (sna)

twist (twi)

Stellate (Ste)

Suppressor of Stellate (Su(Ste))

Suppressor of Hairless (Su(H))

Hairless (H)

tolloid (tld)

tolkin (tok)

torso (tor)

Downstream of raf1 (Dsor1)

tube (tub)

pelle (pll)

white (w)

Lighten up (Lip)

wingless (wg)

Notch (N)


Tableau 70 Interactions extraites par l'annotateur

Les phrases prises en compte sont les mêmes que celles de mise en œuvre du processus 2G. Le sens n’est pas indiqué sur ce tableau. L’ordre de présentation des données est alphabétique (colonne 1 puis colonne 2). Les interactions en gras ont aussi été extraites par le programme (processus 2G).

Gène 1

Gène 2

achaete (ac)

hairy (h)

armadillo (arm)

shaggy (sgg)

armadillo (arm)

wingless (wg)

bicoid (bcd)

hunchback (hb)

bicoid (bcd)

nanos (nos)

bicoid (bcd)

runt (run)

bicoid (bcd)

Serendipity delta (Sry-delta)

blood element (blood)

Lighten up (Lip)

brahma (brm)

absent, small, or homeotic discs 1 (ash1)

cactus (cact)

dorsal (dl)

cdc2

Cdc37

cdc2c

Cyclin E (CycE)

clift (cli)

zeste (z)

concertina (cta)

folded gastrulation (fog)

copia element (copia)

Lighten up (Lip)

Cyclin A (CycA)

cdc2

Cyclin A (CycA)

roughex (rux)

decapentaplegic (dpp)

hedgehog (hh)

decapentaplegic (dpp)

screw (scw)

decapentaplegic (dpp)

thickveins (tkv)

decapentaplegic (dpp)

tolloid (tld)

dishevelled (dsh)

wingless (wg)

Distal-less (Dll)

Ultrabithorax (Ubx)

dorsal (dl)

decapentaplegic (dpp)

dorsal (dl)

Dorsal switch protein 1 (Dsp1)

dorsal (dl)

torso (tor)

dorsal (dl)

zerknullt (zen)

doublesex (dsx)

transformer (tra) {valide}

doublesex (dsx)

transformer 2 (tra2)

DP transcription factor (Dp)

E2F transcription factor (E2f)

EGF receptor (Egfr)

rhomboid (rho)

engrailed (en)

extradenticle (exd)

engrailed (en)

Ultrabithorax (Ubx)

engrailed (en)

wingless (wg)

Enhancer of split (E(spl))

Notch (N)

extra macrochaetae (emc)

scute (sc)

extra sexcombs (esc)

even skipped (eve)

exuperantia (exu)

transformer 2 (tra2)

fork head (fkh)

trithorax (trx)

gurken (grk)

rhomboid (rho)

gypsy element (gypsy)

flamenco (flam)

hairy (h)

knirps (kni)

hairy (h)

Kruppel (Kr)

Heterogeneous nuclear ribonucleoprotein at 27C (Hr…

P-element somatic inhibitor (Psi)

huckebein (hkb)

serpent (srp)

huckebein (hkb)

snail (sna)

hunchback (hb)

Kruppel (Kr)

hunchback (hb)

nanos (nos)

Jun-related antigen (Jra)

Ras oncogene at 85D (Ras85D)

Jun-related antigen (Jra)

sevenless (sev)

knirps (kni)

Kruppel (Kr)

male-specific lethal 2 (msl-2)

male-specific lethal 1 (msl-1)

pole hole (phl)

EGF receptor (Egfr)

Sex lethal (Sxl)

male-specific lethal 1 (msl-1)

Sex lethal (Sxl)

transformer (tra) {valide}

shaggy (sgg)

wingless (wg)

Stellate (Ste)

Suppressor of Stellate (Su(Ste))

Suppressor of Hairless (Su(H))

Hairless (H)

torso (tor)

Downstream of raf1 (Dsor1)

tube (tub)

pelle (pll)

white (w)

Lighten up (Lip)

wingless (wg)

Notch (N)

Figure 2 Formulaire d’annotations (graphiques synthétiques)



Figure 3 Formulaire d’annotations (comparaison des annotations)



Figure 4 Formulaire d’annotation (autres informations)



Figure 5 Schéma de la base de données

Les tables qui comptent moins de douze enregistrements ne sont pas représentées ici. Les traits représentent les relations. Pour plus de détail sur la signification de chaque relation, se reporter aux sections qui décrivent la table. Le code des tables est définit dans le .
1   ...   17   18   19   20   21   22   23   24   ...   36

similaire:

Thèse pour obtenir le grade de iconTHÈse pour obtenir le grade de

Thèse pour obtenir le grade de iconThèse Pour obtenir le grade de

Thèse pour obtenir le grade de iconTHÈse pour obtenir le grade de Docteur

Thèse pour obtenir le grade de iconThèse Pour obtenir le grade de
«capricieuse»!!! Merci également de m’avoir permis d’être impliqué dans des collaborations (eth zurich) et dans un programme Européen...

Thèse pour obtenir le grade de iconThèse présentée pour l’obtention du grade de Docteur

Thèse pour obtenir le grade de iconThèse pour l’obtention du grade de docteur de l’université

Thèse pour obtenir le grade de iconThèse pour obtenir le titre de

Thèse pour obtenir le grade de iconThèse présentée en vue de l'obtention du grade de

Thèse pour obtenir le grade de iconThèse présentée en vue d’obtenir

Thèse pour obtenir le grade de iconCe site permet d’obtenir les liens pour disposer de l’intégralité des programmes de Maths








Tous droits réservés. Copyright © 2016
contacts
b.21-bal.com