Thèse pour obtenir le grade de








télécharger 3.33 Mb.
titreThèse pour obtenir le grade de
page17/36
date de publication21.01.2018
taille3.33 Mb.
typeThèse
b.21-bal.com > droit > Thèse
1   ...   13   14   15   16   17   18   19   20   ...   36
b.Structure de données pour les phrases qui constituent les résumés

Les phrases qui composent les résumés sont représentées dans une table distincte de celle des résumés. Le Tableau 42 donne un exemple d’enregistrement de cette table. La table est intitulée PM pour Phrase Medline..

Tableau 42 Table des phrases extraites de Medline

Le tableau donne exemple d’enregistrement.

Champ

Contenu

Clef Phrase

21794

Phrase

These results, along with the intermediate SOP phenotype observed in Suppressor of Hairless; Hairless double mutant imaginal discs, suggest that the two genes act antagonistically to commit imaginal disc cells stably to alternative fates

Remarque Vu

Non

N° Résumé

94326643

N° d'ordre

8

IVI

0,06

IVI bis

0,09

Problème

Partenaires non identifiés

Mauvaise sègmentation

Nom

Gène Absent

Nom

Date

21/04/00 16:57:57

Les phrases d’un même résumé sont numérotées grâce au champ Numéro d’ordre.

Deux champs sont destinés à recevoir chacun une valeur de l’IVI de façon à permettre les comparaisons entre plusieurs méthodes.

Quand une erreur s’est produite dans l’opération de segmentation du résumé en phrases, le champ mauvaise segmentation prend la valeur Oui.

Le champ Gène Absent a été utilisé à un moment où la structure de la base de données n’était pas achevée. Les informations qu’il contient actuellement sont destinées à être transférées dans la table CI des couples de gènes en interaction.

Le champ Problème reçoit les remarques faites sur la phrase lors de l’annotation. Lors du passage en revue de tous les problèmes rencontrés, le champ Remarques Vu est coché.
3.Structure de données pour le dictionnaire des gènes
a.Structure de données pour les gènes ou objets assimilés

i.La table des gènes ou objets assimilés

Les gènes ainsi que les objets qui peuvent leurs être assimilés sont contenus dans la table gènes et assimilés (GA) dont un enregistrement est présenté dans le Tableau 43.

Tableau 43 Table des gènes ou objets assimilés

Le tableau donne un exemple d’enregistrement de la table.

Champ

Contenu

Clef Gène

13

Objet

abdominal A (abd-A)

Symbole

abd-A

N° Flybase

14

Classe

Gène

Validation

Actif

Problème




Provenance

Flybase

Référant

abdominal A (abd-A)

Date

21/04/00 17:10:05

Le numéro du gène dans la base de données Flybase est conservé mais ne constitue pas la clef primaire. En effet, lors de l’introduction de nouveaux enregistrements, on ne peut pas garantir facilement que l’on n’utilise pas des numéros identiques à ceux que Flybase utilise pour ajouter de son coté, de nouveaux enregistrements.

Le champ légendé objet permet de donner un nom convivial à l’enregistrement. Au départ il est créé à partir du nom complet et du symbole du gène, mais il est librement modifiable par la suite.

Le champ symbole est une redite par rapport à l’information qui se trouve dans la table des définitions de gènes, mais sa présence est néanmoins utile car elle évite de faire référence sans cesse à cette table, ce qui aurait pour conséquence de ralentir l’affichage des formulaires de consultation de la base de données. Il est rempli au départ à partir des informations contenues dans la table des définitions.

La classe permet de gérer les rubriques du dictionnaire. Cette structure permet de traiter de la même façon des objets qui ne sont pas des gènes mais qui jouent le même rôle dans notre base de données.

Le champ référant permet de faire référence au gène père dans la relation d’allélisme. Un gène qui n’est l’allèle d’aucun autre gène fera référence à lui-même, comme c’est le cas dans l’exemple présenté dans le Tableau 43.

Le champ validation permet d’invalider des enregistrements sans les supprimer de façon à permettre la mise à jour des données avec la base de données Flybase qui est la source des données. Seuls quelques enregistrements ont été invalidés car ils formaient des doublons.

ii.Les tables annexes à la table des gènes

1)Structure de données pour les rubriques du dictionnaire

Le dictionnaire est organisé en plusieurs rubriques selon la classe de l’objet considéré. La table Entité Biologique (EB) fait l’inventaire de toutes les modalités du champ classe. Le Tableau 44 donne le contenu de cette table dans son exhaustivité.

Tableau 44 Table des entités biologiques

Les modalités du champ classe sont données dans cette table.

Clef

Classe

1

Gène

2

Famille de protéines

3

Complexe de protéines

4

Complexe de gènes

5

Termes spécifiques

6

Famille

7

Allèle

9

Gène mammifères

2)Structure de données pour la gestion de la provenance du gène

Les gènes ou objets assimilés sont pour la plupart issus de Flybase mais un petit nombre d’entre eux ont été introduits manuellement lors de l’annotation. La table Provenance des Gènes ou objets Assimilés (PGA) dont le contenu est donné dans le Tableau 45 est prévue à cet effet.

Tableau 45 Table Provenances des gènes

La table est donnée ici dans son intégralité.

Clef

Origine Gène

1

Flybase

2

Ajout

iii.Structure de données pour la gestion de la filiation

Les nouvelles entités biologiques que sont les complexes de gènes, les complexes de protéines ou les familles de protéines sont liées aux gènes déjà présents par une relation d’appartenance. L’ensemble de ces liens est contenu dans la table dite de filiation. Le Tableau 46 donne un extrait de cette table. Cette table est intitulée FGA pour Filiation Gène ou Assimilé.

Tableau 46 Table des filiations

La table complète compte 57 lignes. Nous en présentons ici un extrait.

Clef Filiation

Objet fils

Objet père

Classe du père

4

abdominal A (abd-A)

bithorax complex (BXC)

Complexe de gènes

5

Abdominal B (Abd-B)

bithorax complex (BXC)

Complexe de gènes

6

Ultrabithorax (Ubx)

bithorax complex (BXC)

Complexe de gènes

95

sloppy paired 2 (slp2)

Sloppy paired (slp)

Complexe de gènes

94

sloppy paired 1 (slp1)

Sloppy paired (slp)

Complexe de gènes

133

Antennapedia (Antp)

Antennapedia complex (ANT-C)

Complexe de gènes

143

Polycomb (Pc)

Polycomb group (Pc-G)

Complexe de protéines

2

Actin 42A (Act42A)

Actin

Famille de protéines

20

Actin 88F (Act88F)

Actin

Famille de protéines

19

Actin 87E (Act87E)

Actin

Famille de protéines

18

Actin 79B (Act79B)

Actin

Famille de protéines

17

Actin 57B (Act57B)

Actin

Famille de protéines

1

Actin 5C (Act5C)

Actin

Famille de protéines
1   ...   13   14   15   16   17   18   19   20   ...   36

similaire:

Thèse pour obtenir le grade de iconTHÈse pour obtenir le grade de

Thèse pour obtenir le grade de iconThèse Pour obtenir le grade de

Thèse pour obtenir le grade de iconTHÈse pour obtenir le grade de Docteur

Thèse pour obtenir le grade de iconThèse Pour obtenir le grade de
«capricieuse»!!! Merci également de m’avoir permis d’être impliqué dans des collaborations (eth zurich) et dans un programme Européen...

Thèse pour obtenir le grade de iconThèse présentée pour l’obtention du grade de Docteur

Thèse pour obtenir le grade de iconThèse pour l’obtention du grade de docteur de l’université

Thèse pour obtenir le grade de iconThèse pour obtenir le titre de

Thèse pour obtenir le grade de iconThèse présentée en vue de l'obtention du grade de

Thèse pour obtenir le grade de iconThèse présentée en vue d’obtenir

Thèse pour obtenir le grade de iconCe site permet d’obtenir les liens pour disposer de l’intégralité des programmes de Maths








Tous droits réservés. Copyright © 2016
contacts
b.21-bal.com