Résumé Dans le monde de l'intelligence artificiel aujourd'hui, on a tendance à recopier ce que fait la nature. Et quoi de plus normale que de copier le cerveau humain quand on parle d'intelligence et de réflexion.








télécharger 236.32 Kb.
titreRésumé Dans le monde de l'intelligence artificiel aujourd'hui, on a tendance à recopier ce que fait la nature. Et quoi de plus normale que de copier le cerveau humain quand on parle d'intelligence et de réflexion.
page5/10
date de publication16.05.2017
taille236.32 Kb.
typeRésumé
b.21-bal.com > loi > Résumé
1   2   3   4   5   6   7   8   9   10

Réglage des paramètres




En théorie, il est très dur de savoir ce qui fait qu’un joueur est bon ou mauvais.
De plus, au niveau programmation, il y a tellement de paramètres en jeux qu’il est quasiment impossible de définir une technique de jeux optimale.
Pour le réseau de neurones, il faut par exemple fixer le nombre de couches cachées, le nombre de neurone par couche cachées ainsi que les poids des neurones à l’initialisation. On peut même si on le souhaite définir les liaisons internes, mais dans ce cas, le calcul des sorties devient plus complexe et difficile à analyser.
En ce qui concerne l’algorithme génétique, les paramètres sont les taux de cross-over et de mutation, les nombres d’individu et de génération ainsi que le type des transformations.
Avec tout ceci il faut ajouter les gains des parties. Que faut-il privilégier ? Une partie gagnante ou une partie non perdue (gagnante ou égalité) ? Est-ce que le nombre de coup joue est important.
Tous ces paramètres sont à prendre en compte et il faut une phase de réglage qui prend beaucoup de temps. Je pense pour ma part qu’il faut tout d’abord obtenir de bons résultats théoriques (courbes de fitness, nombre de coups et nombre de partie gagnées) et ensuite affiner et jouer contre la machine pour vérifier les progrès. C’est l’étape la plus longue mais primordiale, elle permet de contrôler les formes des courbes de sortie (nombre de coup joue, fitness et parties gagnées) et donc d’influencer la qualité du jeux.
Quelque réglages sont théoriquement plus adapte et d’autre a proscrire. Je me propose de les définir ci-dessous :


Taille de la population



La taille de la population est le nombre de réseau dans une population. Si cette valeur est trop faible, il n’y a pas assez d’affrontement entre les réseaux et la sélection de type roulette ne donne pas de bons résultats. Si elle est trop élevée, le temps de calcul est élevé.

Par expérience une valeur entre 100 et 200 parait correct.

Nombre de génération



Comme le nom l’indique, c’est le nombre de génération qu’il faut effectuer avant de choisir le réseau final. Si le nombre est trop faible, l’exploration n’est pas optimale, elle dépend aussi étroitement d’autre paramètres comme les taux et amplitude de mutation ainsi que le taux de crossover. Tout comme la taille de la population si le nombre est trop élevé, le temps de calcul devient plus important.

J’ai effectué mes tests pour des valeurs entre 100 et 500.

Taux de crossover



Le taux de crossover correspond au pourcentage moyen de réseaux qui subiront un crossover. Les résultats sont aussi étroitement liés au taux de mutation. Quand le taux de crossover est trop faible et que le taux de mutation est trop élevé, il y a risque d’instabilité et donc de mauvaise exploration a cause des variations brusques des gains des réseaux. Si la valeur est trop élevée, on risque de ne pas garder de bons réseaux car une grande partie des enfants proviennent d’un crossover et peu de réseaux sont conservé.

Je pense qu’une valeur entre 30 et 60, combinée avec de bons réglages de mutation donne de bons résultats.

Taux de mutation



Le taux de mutation est le pourcentage de réseau n’ayant pas subit un crossover qui subira une mutation. Cette valeur est primordiale à une bonne évolution et doit être réglé de façon très précise avec l’amplitude et la probabilité de mutation par poids Un taux de mutation trop élevé a souvent pour conséquence des variation brutal de la courbe des gains et donc une instabilité importante surtout lors de longue exécutions. Quand il est trop faible le taux de mutation fournit une exploration lente ce qui est gênant quand l’exécution est petite.

De préférence il faut fixer ce taux à une valeur entre 10 et 30.

Amplitude de mutation



L’amplitude de mutation est le pourcentage maximal de la valeur originale du poids d’un neurone que l’on peut ajouter ou soustraire. Si un poids vaut 10 et que l’amplitude de mutation est de 50 alors lors de la mutation le poids aura une valeur entre 5 et 15.Si l’amplitude est trop faible ; l’exploration est lente et l’évolution est lente voir même descendante alors que si elle est trop élevé, elle peut apporter une instabilité importante.

Entre 30 et 70, l’amplitude ne provoque pas trop de variations importantes.

Probabilité de mutation d’un poids



La chance qu’un poids d’un réseau subissant une mutation mue correspond à la probabilité de mutation. Ce facteur dépends fortement du taux de mutation, quand le taux de mutation est élevé et que la probabilité de mutation l’est aussi alors les enfant ne ressemble plus aux parents et les gains risque une évolution trop brutale, alors qu’une probabilité trop faible apportera une évolution trop lente puisque les enfants ressemblent trop aux parents.

Gain



Il faut récompenser les réseaux, c’est le but des gains. Il n’y a pas de mauvais ou de bon réglages, mais ils servent à donner une forme de jeux. Quand le gain de partie gagnée est le plus grand, les réseau vont avoir tendance à gagné vite souvent en empilant 4 jetons à la suite alors que si l’on privilégie l’égalité, on a tendance à obtenir des réseaux qui contre attaque. On peut même récompense le nombre de coups joués même si l’on perd. Ces gains permettent vraiment de donner une allure et donc des réseaux avec des stratégies bien déterminées.

Coefficient du neurone d’entrée aléatoire



Le neurone d’entrée aléatoire permet d’avoir un bruit dans le réseau pour avoir une stratégie changeante au fur et a mesure de la partie. Ce coefficient règle l’amplitude de ce bruit combiné avec le drand48() qui fournit la valeur initiale. Bien sur on comprend très vite que plus le coefficient est élevé plus le bruit et élevé et plus le réseau risque de prendre des décisions aléatoires. Si on souhaite ne pas avoir de bruit il suffit de fixer cette valeur à 0.


1   2   3   4   5   6   7   8   9   10

similaire:

Résumé Dans le monde de l\Programme Histoire et civilisations
«Peut-être arrivera-t-il bientôt dans la manière d’écrire l’histoire ce qui est arrivé dans la physique. Les nouvelles découvertes...

Résumé Dans le monde de l\* Culture & loisirs Expositions & musées
«Osez l’Intelligence économique avec les cci de Rhône-Alpes», ce document présente les différentes composantes et métiers de l'Intelligence...

Résumé Dans le monde de l\Les formes substantielles chez Malebranche et Leibniz
«devenir comme maître et possesseur de la nature» -, on parle de l’appropriation, de la tutelle jetée sur la nature qui fait le drame...

Résumé Dans le monde de l\Résumé S’il fallait démontrer l’actualité de Pierre Janet, IL suffit...
«La psychologie proprement dite, qui, par peur, de la métaphysique s’était jetée dans les mathématiques dans une prétendue anatomie...

Résumé Dans le monde de l\Thèse pour le Doctorat de sociologie
«Comme tous mes amis sans exception sont des êtres de grand talent et de vaste intelligence, les conceptions qu’ils expriment seraient...

Résumé Dans le monde de l\RÉsumé IL y a aujourd'hui un consensus pour reconnaître que les années...

Résumé Dans le monde de l\Un apprentissage compatible avec le cerveau
Corps-cerveau (bodybrain) : terme inventé par Susan Kovalik pour traduire l’implication dynamique et intégrée de l’ensemble de l’organisme...

Résumé Dans le monde de l\Questionnaire plan
«la bande d’adolescents» qui est aujourd’hui un phénomène actuel mais différent, d’où aujourd’hui IL est étudié différemment qu’auparavant,...

Résumé Dans le monde de l\Il livre une comparaison entre les obsessions qui effrayaient le...
«terrorisme» qui exclut le terrorisme qui fait le plus de dégâts en vies humaines et en destructions matérielles- le terrorisme d’Etat....

Résumé Dans le monde de l\L’écriture avait depuis longtemps conquis d’autres domaines que celui...
«connais-toi toi-même», si bien repris dans la pensée socratique, introduisit sur la place publique le débat principal de la réflexion...








Tous droits réservés. Copyright © 2016
contacts
b.21-bal.com