Thèse pour obtenir le grade de








télécharger 3.33 Mb.
titreThèse pour obtenir le grade de
page23/36
date de publication21.01.2018
taille3.33 Mb.
typeThèse
b.21-bal.com > droit > Thèse
1   ...   19   20   21   22   23   24   25   26   ...   36

II.Évaluation du programme de reconnaissance des interactions et discussion


La performance de chaque processus d’annotations automatiques est évaluée par le calcul des taux de rappel et de précision.

A.Explications communes à tous les graphiques


Nous donnons ici quelques indications valables sur l’ensemble des graphiques présents dans cette section. Le premier exemple de graphique est donné Figure 6 (ci-après). Les données correspondantes sont données dans le Tableau 88.

La première colonne donne le seuil appliqué à l’IVI de la phrase. Le test sur l’IVI consiste à rejeter la reconnaissance extraite si l’IVI de la phrase est inférieur au seuil fixé. La première valeur du seuil, qui est -2, correspond en réalité à une extraction d’information qui ne prend pas en compte l’IVI. En effet, l’IVI ne peut par définition être inférieur à -1. Le point correspondant sur le graphique se trouve à l’extrémité droite. Il est souvent un peu en retrait par rapport aux autre points qui se trouvent eux globalement sur une ligne. Cela traduit le fait que c’est un cas limite.

A l’opposé les dernières valeurs du seuil correspondent à une sélection drastique des données à extraire. Les points correspondants se trouvent à l’extrémité gauche sur les graphiques. Les effectifs associés sont faibles. Les quotients rappel et précisions sont donc moins significatifs pour ces points. C’est ce qui explique la dispersion plus grande des valeurs à l’extrême gauche des graphiques. Les données qui correspondent à des effectifs inférieurs à dix ont été supprimés car elles ne sont pas significatives.

La deuxième colonne donne l’effectif des données qui ont été extraites automatiquement. La colonne suivante donne l’effectif des données extraites par l’expert qui a annoté les textes. Il s’agit donc de la référence. La colonne confirmé donne l’effectif des données extraites automatiquement qui se trouvent aussi dans l’ensemble des données extraites par l’annotateur. Le rappel et la précision sont calculés à partir de ces trois dernières colonnes.

Des droites de régression ont été tracées pour faciliter la lecture des graphiques en donnant une tendance. Il ne s’agit ni de la vérification d’une hypothèse statistique, ni d’une tentative d’extrapolation.

B.Statistiques sur les reconnaissances d’interactions


Nous cherchons à comparer l’ensemble des reconnaissances d’interactions faites manuellement d’un part et automatiquement d’autre part.

Cette statistique n’a été faite que pour le processus de reconnaissance intitulé 2RDG que nous décrivons en détail plus bas. Le graphe rappel-précision est donné Figure 6. Les données du calcul sont fournies dans le Tableau 88.

Figure 6 Graphique rappel-précision pour les occurrences d’interactions (processus 2RDG)



L’échantillon de référence est constitué des 225 phrases qui comptent deux occurrences de gène. Les reconnaissances « cibles » sont les reconnaissances d’interactions entre gènes qui ont été faites par l’annotateur sur ces phrases.

Le processus automatique 2RDG consiste à rechercher tous les couples de reconnaissance de gènes faits dans ces phrases et à inscrire l’interaction correspondante dans la table de reconnaissance des interactions.

Ce procédé d’extraction d’informations est donc exactement le même que celui qu’a utilisé Pillet. Cependant la méthode d’évaluation est différente, puisque Pillet compte des phrases pour savoir si elles contiennent ou non des interactions, alors que nous comptons des reconnaissances d’interactions pour savoir si elles sont confirmées ou non par l’annotateur.

Ce procédé de comptage ne prend pas en compte le fait qu’une même interaction puisse être manquée dans une phrase mais réussie dans une autre. Or nous comptons beaucoup sur la redondance de l’information pour obtenir des résultats satisfaisants. Nous avons donc besoin d’une évaluation des performances qui tienne compte de ce phénomène de redondance. Nous allons donc nous intéresser dorénavant non pas aux occurrences d’interaction, mais aux interactions elles-même.
1   ...   19   20   21   22   23   24   25   26   ...   36

similaire:

Thèse pour obtenir le grade de iconTHÈse pour obtenir le grade de

Thèse pour obtenir le grade de iconThèse Pour obtenir le grade de

Thèse pour obtenir le grade de iconTHÈse pour obtenir le grade de Docteur

Thèse pour obtenir le grade de iconThèse Pour obtenir le grade de
«capricieuse»!!! Merci également de m’avoir permis d’être impliqué dans des collaborations (eth zurich) et dans un programme Européen...

Thèse pour obtenir le grade de iconThèse présentée pour l’obtention du grade de Docteur

Thèse pour obtenir le grade de iconThèse pour l’obtention du grade de docteur de l’université

Thèse pour obtenir le grade de iconThèse pour obtenir le titre de

Thèse pour obtenir le grade de iconThèse présentée en vue de l'obtention du grade de

Thèse pour obtenir le grade de iconThèse présentée en vue d’obtenir

Thèse pour obtenir le grade de iconCe site permet d’obtenir les liens pour disposer de l’intégralité des programmes de Maths








Tous droits réservés. Copyright © 2016
contacts
b.21-bal.com