L'arbre phylogénétique présente les relations de parenté entre organismes vivants. IL montre qui est proche de qui, et non pas qui descend de qui. IL permet








télécharger 28.77 Kb.
titreL'arbre phylogénétique présente les relations de parenté entre organismes vivants. IL montre qui est proche de qui, et non pas qui descend de qui. IL permet
date de publication02.02.2018
taille28.77 Kb.
typeDocumentos
b.21-bal.com > droit > Documentos
De Zéro à Paup :

  • L'arbre phylogénétique présente les relations de parenté entre organismes vivants. Il montre qui est proche de qui, et non pas qui descend de qui. Il permet d'identifier les homologies (des états de caractères hérités d'un ancêtre commun) et les homoplasies (états de caractères non hérités d'un ancêtre commun) 

  • L'arbre phylogénétique montre la succession des émergences des groupes d'organismes vivants au cours du temps, mais surtout leurs relations de parenté. Il est fondé sur l'analyse de nombreux caractères chez les espèces qu'il présente. Sur les branches sont situées les transformations de caractères qui ont servi à construire l'arbre. En général, ses branches sont agencées de manière à supposer le minimum de transformations de caractères le long des branches. 

  • L'arbre phylogénétique nous montre quels caractères sont vraiment les mêmes chez plusieurs espèces (hérités d'un ancêtre commun) et quels sont ceux qui, initialement vus comme les mêmes, ne le sont en fait pas

Analyses génétiques : Délimitation du groupe d'intérêt ("ingroup")

Dr Jean-François MBOUMBA

  • Une question posée au départ. Etape de définition du problème phylogénétique, c'est-à-dire délimitation du groupe d'intérêt ("ingroup"). 

  • Le choix d’un échantillon d’organismes propres à répondre à cette question : c’est l’échantillonnage taxonomique. Cette étape consiste aussi à choisir un ou plusieurs points de référence externes, le(s) extra-groupe(s). Ces organismes sont postulés extérieurs au groupe d’intérêt, c’est-à-dire extérieur à tous ceux dont on veut définir les relations de parenté. Les extra-groupes serviront à enraciner le(s) futur(s) arbre(s). 

  • Le choix et/ou la détection des caractères qui seront informatifs pour la question posée : c’est l’échantillonnage des caractères. 

  • Le codage et la construction de la matrice des caractères. Nous nous intéresserons à une matrice de caractères moléculaires (séquences d’ADN) codée en vue d’une analyse de distance sur la ressemblance globale (phénétique). Il faut savoir qu’il existe d’autres types de matrices, les matrices cladistiques, que nous laisserons de côté pour le moment.

  • L’exploration des arbres possibles. A un nombre fixé de taxons dans la matrice correspond un nombre précis d’arbres possibles. Pour quatre taxons dont un est préalablement défini comme extra-groupe, il existe trois arbres racinés possibles. Pour cinq taxons, il existe 15 arbres racinés possibles, etc. L’idéal est de les évaluer tous au regard des informations contenues dans la matrice.

  • L’évaluation de chacun de ces arbres au regard de la matrice. 

  • Le choix d’un critère de choix d’un arbre : ce critère est la parcimonie. On choisit l’arbre le plus parcimonieux, c’est-à-dire l’arbre qui requiert le plus petit nombre d’événements évolutifs entre les états de caractères présentés par les organismes. Mais il faut savoir qu’il existe d’autres critères de choix d’un arbre. Par exemple, sur la base d’une approche probabiliste parfois appliquée aux données de séquences nucléiques ou protéiques, approche où l’on peut associer à certaines transformations d’un acide nucléique en un autre une certaine probabilité, on choisira l’arbre le plus vraisemblable : c’est l’arbre dont la vraisemblance (produit des probabilités) est maximale. A partir d’une approche de distances, on choisira l’arbre dont les distances arborées entre organismes sont les plus fidèles possible aux distances de la matrice de départ ; dans ce cas c’est choisir l’arbre dont la matrice d’arrivée distord le moins possible la matrice de départ.

  • Le choix d’un arbre, ce sera l’arbre le plus "court", c’est-à-dire qui demande le minimum d’hypothèses de transformation des caractères. Cet arbre permet : 

    1. l’identification des états des caractères qui définissent chacun des nœuds (= clades) de l'arbre obtenu (les synapomorphies = homologie de filiation ou homologie secondaire). 

    2. l’identification des états homoplasiques, et éventuellement établissement de conclusions sur le mode d'évolution des caractères. 

    3. la création une classification phylogénétique, c'est-à-dire l’assignation d'un nom de groupe à chaque nœud (= clade) fiable de l'arbre. 

Les problèmes de la reconstruction

  • quelle confiance avoir en un arbre ?

  • quels sont les nœuds dont je suis sûr ?

  • l’ordre des espèces a-t-il une importance ?

  • et si je supprime une espèce ?

  • pourquoi ai-je un peigne ?

Et ces deux branches, elles sont bien longues !

  • tous les gènes n’ont pas la même vitesse d’´evolution,

  • les phénomènes de recombinaison,

  • les transferts de gènes, la confusion entre gènes paralogues et orthologues (sont des séquences qui ont une fonction commune et un ancêtre commun)

NB : i) Dans un groupe d'espèces, une espèce A est plus étroitement apparentée à une espèce B qu'à toutes les autres si elle possède avec l'espèce B un ancêtre commun exclusif (que les deux espèces A et B ne partagent pas avec les autres espèces)

ii) Les ancêtres communs se trouvent toujours aux nœuds de l'arbre et sont hypothétiques.

iii) Un état d'un caractère qui résulte d'une innovation est dit dérivé. Les relations de parenté sont établies en prenant uniquement en compte les états dérivés de caractères homologues.

Test de robustesse des constructions phylogénétiques

Basée sur l’hypothèse que les caractères évoluent de manière indépendante

  • protocole en 3 étapes (réalisé au moins 100 fois) :

1) réalisation d’un pseudo alignement `a partir de l’alignement initial en prenant arbitrairement n colonnes (avec remise),

2) estimation de l’arbre obtenu T’,

3) comparaison des arbres T et T’ (décompte du nombre de fois où un nœud est trouve commun entre ces deux arbres) on assigne ensuite aux nœuds de l’arbre T les fréquences obtenues

Exercice

Feuille de calcul1: Eta pe 1-Créer un fichier txt

1) La feuille de calcul est un fichier Word Pad

Nom du fichier, exemple : Nannomys –cytb.txt

2) Police 10 : Courier New

En tête du fichier

3) Fichier : exemple

#nexus

begin data;

dimension ntax=91 nchar=923;

FORMAT datatype=dna matchchar=. GAP=- missing=? interleave [EQUATE= "A=G C=T"];

OPTIONS gapmod=newstate

matrix

[

1111111111111111111111111111111111111111111111111111111111111111121111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111110]

Seq1

Seq2

Seq3…

NB : seq1 et 2 sont des outgroups (Exemple : Rattus_norveg Mus_musculus )

;

end;

BEGIN ASSUMPTIONS;

CHARSET DOUTEUX = 1-24 868-1143;

;

end;

Feuille de calcul1: Etape 2 -Transformer la feuille de calcul en fichier.NEX

  • Enregistrer le fichier de l’étape 1 sur votre bureau avec une extension .NEX

Et ce fichier.NEX qui est lu par PAUP pour sortir les résultats

Feuille de calcul2: créer un fichier ProgNJB.nex

#NEXUS

BEGIN PAUP;

[Options generales]

time;

factory; weights 1 : all;

log file = NanNJ.log start replace;

cleartrees;

EXCLUDE DOUTEUX;

outgroup Rattus_norveg Mus_musculus / only;

set increase = auto autoclose = yes torder = left storetreewts = yes

storebrlens = yes;

[Analyses de distance]

set criterion = distance;

dset distance = k2P dcollapse = yes;

showdist;

savedist format = tabtext file = NanNJ.txt replace undefined = asterisk

ndecimals = 4;

NJ breakties = random;

savetrees file = Nan.tre brlens = yes root = yes replace;

pscore 1 / CI RI RC HI [et gfit khtest nonparamtest pour comparer topologies 2 a 2];

bootstrap nreps = 1000 search = NJ treefile = bnjtrees.out replace = yes;

gettrees file = bnjtrees.out Unrooted = no StoreBrLens = yes storetreewts = yes ;

contree all/strict = no majrule = yes percent = 50 usetreewts = yes root = outgroup treefile = BNJ.tre replace = yes;

"basefreqs;".

quit;

  • Ce seulement après ça qu’on appuie sur RUN dans PAUP (on lance PAUP).

On peut lire les résultats à l’endroit où le fichier.NEX a été enregistré.

Et ouvrir treeview pour observer les arbres construits.

Ainsi s’achève notre Exercice

Par ailleurs,

  • Méfiez-vous des banques de données : Les données ne sont pas toujours fiables, la mise à jour n’est pas toujours récente

NB: i) La réalité mathématique n’est pas la réalité biologique ;

ii) Les ordinateurs ne font pas de biologie, ils calculent … vite !

iii) La fiabilité des résultats escomptés dépend non seulement de la qualité, de la quantité des séquences et de leur longueur mais aussi du nombre des taxons analysés. Elle sera nécessairement aussi fonction du choix des groupes externes, de la saturation et du codage des indels.

Dans la pratique, si deux modèles donnent les mêmes résultats identiques, mieux vaut choisir le plus simple.

similaire:

L\Selon Dajoz "l'Ecologie est la science qui étudie les conditions...

L\Philosophie et theorie de l’identite
«mais qu’est-ce donc que je suis ?» Et IL répond aussitôt : «Une chose qui pense. Qu’est-ce qu’une chose qui pense ? C’est-à-dire...

L\L’étiopaléopathologie est une discipline originale qui fait appel
«Que les eaux produisent les animaux vivants qui nagent et qui volent dans le firmament» (I,20). IL est à noter que l’apparition...

L\«Qu’est-ce qui permet de devenir vraiment un homme?»
«Comment le xxème siècle a-t-il modelé l’homme moderne ?». En ce qui concerne la modalité de lecture de l’œuvre, j’ai opté pour un...

L\Actualisation de la clinique du syndrome d’Ehlers-Danlos
«l’organicité» des manifestations et qui se pose la question de savoir si son patient n’est pas «fonctionnel». C’est la porte ouverte...

L\La didactique d’une discipline
«point de vue» didactique, les «ponts», les convergences didactiques comparées. Recentre sur ce qui se passe dans la classe, permet...

L\Introduction A. Le problème du lien social
L’individu est conduit par une main invisible à remplir une fin qui n’entre nullement dans ses intentions Dans ce paradigme économique,...

L\Ecologie et sciences environnementales
«la science des relations des organismes avec le monde environnant». L’écologie au sens large est donc la science qui étudie les...

L\Synthèse Biologie, éthique, société et environnement
«bio», qui veut dire «vivant», et d’«éthique», qui signifie «ce qui est bon et utile pour l’homme». La bioéthique s’intéresse aux...

L\Pour les articles homonymes, voir
«induction» est donc venu à signifier un genre de raisonnement qui n'assure pas la vérité de sa conclusion en étant donné les prémisse...








Tous droits réservés. Copyright © 2016
contacts
b.21-bal.com