RÉsumé IL y a aujourd'hui un consensus pour reconnaître que les années 20 ont été décisives dans l'histoire de la statistique mathématique.








télécharger 125.63 Kb.
titreRÉsumé IL y a aujourd'hui un consensus pour reconnaître que les années 20 ont été décisives dans l'histoire de la statistique mathématique.
page1/4
date de publication17.01.2018
taille125.63 Kb.
typeRésumé
b.21-bal.com > économie > Résumé
  1   2   3   4
LES DEBUTS DE LA STATISTIQUE MATHEMATIQUE EN ESPAGNE (1914-1936)

José M. ARRIBAS*

RÉSUMÉ - Il y a aujourd'hui un consensus pour reconnaître que les années 20 ont été décisives dans l'histoire de la statistique mathématique. Quelques auteurs on parlé d'une nouvelle ère dans le développement de la statistique théorique. L’article essai d’expliquer en quoi consiste cette nouvelle ère qui touche tous les pays européens, et de quelle statistique s'agit-il. Ces mêmes années vingt sont, à tous points de vue, une période de grande vitalité pour l'Espagne. Comme dans les autres pays européens, la statistique mathématique s'y développe dans deux directions : la physique mathématique et l'économétrie. On y retrouve également tous les problèmes liés à l'institutionnalisation de la discipline ou au changement de paradigme associé aux noms de F. Y. Edgeworth et de A. Bowley. Le hypothèse de départ est en effet que la nouvelle statistique a pour noyau la théorie des échantillons. Bien que son application rencontre encore des problèmes techniques et méthodologiques importants, les conditions sociales et politiques de cette période permettent déjà d'envisager la naissance d' une nouvelle science appelée statistique mathématique
MOTS CLÉS – Statistique Mathématique, Histoire de la Statistique, Méthodologie, Sociologie de la Science.
SUMMARY – The rise of Mathematical Statistics in Spain (1914-1936)

There is a consensus amongst the historians of Statistics about the importance of the twenties as starting “a new era” in the theoretical statistics. The article tries to give account of this period and to show the characteristics of this new form of statistics. For Spain, this period was very exciting in may respects. As in the rest of the countries, Mathematical Statistics is developed here in two directions: mathematical physics and econometrics. We can find all the problems related to the institutionalisation of the discipline and the change of paradigm associated to the British mathematicians F.Y. Edgeworth and A. Bowley. The hypothesis is that the new statistics has its central point in the theory of sampling . In spite of the technical and methodological problems that its application still entails, the social and political conditions allow for a new science called Mathematical Statistics to arise.
KEYWORDS – Mathematical Statistics, History of Statistics, Methodology, Sociology of Science.
I.- Introduction
Il y a aujourd'hui un consensus pour reconnaître que les années 20 ont été décisives dans l'histoire de la statistique mathématique. Ainsi Donald Mackenzie conclut son étude devenue classique "Statistics in Britain" en affirmant que "jusqu'au milieu des années vingt, il y avait des signes clairs du commencement d'une nouvelle ère dans le développement de la statistique théorique en Grand Bretagne"1. En quoi consiste cette nouvelle ère qui touche tous les pays européens2, et de quelle statistique s'agit-il ?
Ces mêmes années vingt sont, à tous points de vue, une période de grande vitalité pour l'Espagne. Comme dans les autres pays européens, la statistique mathématique s'y développe dans deux directions : la physique mathématique d'un côté, l'économétrie de l'autre. On y retrouve également tous les problèmes liés à l'institutionnalisation de la discipline ou au changement de paradigme associé aux noms de F. Y. Edgeworth et de A. Bowley. Notre hypothèse est en effet que la nouvelle statistique a pour noyau la théorie des échantillons. Bien que son application rencontre encore des problèmes techniques et méthodologiques importants, les conditions sociales et politiques de cette période permettent déjà d'envisager la naissance d' une nouvelle science appelée statistique mathématique.
Ce travail comprendra trois parties. Dans la première nous montrons l' influence de la statistique anglaise et surtout de la voie représentée par F. I. Edgeworth et A.Bowley, aussi bien que les problèmes liés à l' application des nouvelles techniques. C' est à l' intérieur d'une autre nouvelle discipline comme la sociologie que se produisent des critiques importantes à ce propos. En seconde partie, nous présentons les données historiques et les acteurs espagnols de la statistique mathématique, et dans un troisième temps, nous verrons quelques problèmes méthodologiques lies à l'enseignement de la statistique et à la confusion entre deux paradigmes: le modèle linaire, déjà très bien développé et la théorie des échantillons qui arrive.


II- Qu’est-ce que la statistique mathématique ? 
Au milieu des années vingt3, la statistique joue un rôle important dans l'agriculture, la production industrielle, l'industrie militaire ou la création de services publics. Quelques instruments statistiques sont déjà arrivés à un certain point de sophistication mathématique. C'est à cette époque qu'apparaissent aussi les premiers manuels de statistique mathématique, par exemple, Schultz publie en 1927 Mathematical Economics and the quantitative methods, G. Darmois publie en 1928 Statistique Mathématique, les traductions et rééditions des manuels de A. Bowley (1901) et U.Yule (1911) se suivent, le premier manuel espagnol apparaît en 19244, et la statistique commence à entrer dans les programmes d'enseignement des facultés de sciences. A. Bowley occupe en 1919 la première chaire de statistique à l'université de Londres, et en 1928 on inaugure l'Institut Henri Poincaré à l'intérieur duquel s'installe l'ISUP, l'Institut de Statistique de l'université de Paris, créé en 19225.
Bien que la statistique mathématique apparaisse dans des manuels d'enseignement des années vingt, il est évident qu' elle est en gestation dans les décennies antérieures avec ce qui touche à la prévision des cycles économiques et de l'évolution des prix6. Les méthodes de la corrélation développées par Bravais (1846), Galton (1888), Edgeworth, Pearson et Yule, étaient déjà généralisées avant l'institutionnalisation de l'enseignement de la statistique mathématique. Nous savons par Michel Armatte qu'à partir de 1880 on commence à définir une statistique dont les principes et les techniques sont différents de la statistique et de la théorie des moyennes caractéristiques du XIXème siècle, et dont l'objet était de présenter différentes mesures sur un mode comparatif7. Edgeworth, publie en 1881 Mathematical Psychics, où il tente d'appliquer les mathématiques aux sciences sociales, notamment à la psychologie, et qu'aura beaucoup d'influence sur les économistes marginalistes. En 1906, les mesures avec des moyennes, tout comme les idées de médiane, quartiles, mode, moyenne arithmétique, nombres indices, écart type, etc. faisaient déjà partie du savoir des statisticiens avancés, et ils étaient utilisés couramment dans les statistiques officielles en Grande-Bretagne et aux Etats-Unis.
Pour mieux comprendre cette irruption de la statistique mathématique, nous allons nous servir du rapport de 1906, adressé par Arthur L. Bowley à la section d'économie et de statistique de l'Association Britannique pour l'Avancement de la Science, et publié cette même année dans le bulletin de la Royal Statistical Society8.
Il semble qu'au début du siècle, l'enseignement de la statistique en Grande-Bretagne était presque inexistant. Bowley nous dit que les mathématiques occupent une petite place dans les programmes d'économie des universités britanniques,9 et qu'il n'est pas évident que les applications statistiques et la théorie de la probabilité soient inclus dans d'autres programmes d'étude. Il n'était pas non plus facile de trouver en 1906 des mathématiciens capables d'appliquer leurs connaissances aux affaires publiques, et c'est pour cela que Bowley propose de développer un vaste programme qui lie mathématiques et sciences sociales, un programme similaire à celui qui sera aussi mis en place par les fondations nords-américaines.
Comment envisager alors ce programme scientifique?. Une première approche est d'en délimiter le champ de travail, et Bowley trace bien une limite qui sépare les pratiques statistiques anciennes des pratiques et des théories qui caractérisent la nouvelle science statistique. Quelle est la caractéristique fondamentale d'une science ? C'est la méthode,10 bien sûr : Une méthode de mesure qui permettra de différencier le vrai du faux, dans tout raisonnement basé sur la construction de tableaux statistiques. A ce propos, il va reprendre toute la tradition britannique qui depuis le 17e siècle présente la méthode expérimentale comme source principale de légitimation de la science.
Les techniques de recueil d' information restent ainsi: art statistique, et la nouvelle statistique mathématique devient: science statistique11. La statistique mathématique ressemble aux sciences naturelles dans le sens où ses développements théoriques ont aussi des applications pratiques, comme peuvent le montrer les études sur le nivellement des impôts ou l’estimation des coût de la vie des travailleurs. A. Bowley présente tout un programme pour faire de la statistique une discipline qui inclut l’idée de précision, et pour cela il emprunte à l’astronomie le concept d' erreur probable. Il faut dire, en tout cas, que la position de A. Bowley quant aux possibilités de la statistique mathématique est bien modérée:
"Il faut reconnaître que beaucoup de statistiques sont nécessairement approximatives. En statistique, l’exactitude et la précision consiste à estimer les bornes de l’erreur probables et possibles, et la fausse apparence de la prétendue exactitude mathématique doit être abandonnée"12 .
La mesure statistique est cependant approximative et provisoire, et de même que les autres sciences comme la physique ont recours aux expérimentations pour améliorer leur consistance, la consistance des estimations statistiques peut s'améliorer par des échantillons soigneusement sélectionnés. Apparemment, Bowley situe la méthode des échantillons au coeur de la nouvelle science statistique; il était très conscient des possibilités de cette méthode et de sa capacité à se transformer en puissante arme de recherche scientifique.
Il y a d'autres éléments importants qui vont contribuer au développement de la nouvelle science statistique: l'intérêt croissant des classes populaires pour la statistique, surtout des syndicats et des organisations ouvrières, ainsi que le développement rapide de l’intérêt de la presse pour la publication des données statistiques. La presse commence à jouer à cette époque un rôle décisif dans l’élaboration du nouveau discours statistique, bien que Bowley condamne "la confiance aveugle et souvent équivoque que l'on concède aux déclarations statistiques".
Bien que la théorie se soit développée rapidement, et que quelques méthodes aient déjà été utilisées par les biologistes et les botanistes, il y avait peu d'applications relatives aux problèmes pratiques jusqu' au moment où on a commencé à considérer sérieusement le rapport entre les fréquences de la déviation et la loi de l’erreur. Bowley ajoute que la méthode des échantillons disposait de matériaux suffisants depuis les travaux réalisés par Edgeworth en 1885, mais que ceux-ci ont été totalement ignorés.
Le contrôle de la mesure suppose l'estimation la plus probable, prenons l'exemple, d' une moyenne de salaires. Dans ce cas, il propose des énoncés du type 24s.+6d., adoptant l’écart-type comme mesure de sécurité (dans une courbe normale de fréquences, deux tiers de l’aire sont dans l'écart type) Il ajoute: quand cela est applicable, la mesure est très précise.

Il propose deux voies pour appliquer la nouvelle méthode: celle de Pearson, c'est à- dire, une formule empirique et l'ajustement des observations en déterminant une courbe appropriée de fréquences pour assigner la probabilité des observations; ou la voie d' Edgeworth qui consiste à accepter la loi généralisée des grands nombres et à déterminer a priori les phénomènes où l'ont peut utiliser cette loi. Un exemple avec des données de l'Investor's Record et de l'Almanach Nautique lui sert à montrer que tous les éléments de l’ensemble doivent avoir les mêmes possibilités de sélection, et que la précision ne dépendra pas de la taille du groupe à échantillonner mais seulement de sa nature et de la taille des échantillons. La précision peut cependant être aussi grande que l’ont veut, et l’erreur probable et possible, aussi petite que l’ont veut, à condition toutefois d'augmenter seulement la taille de l'échantillon.
Il conclut en assurant que, tant que la théorie n'est pas totalement terminée, l'usage de la méthode devra rester pour un temps entre les mains de spécialistes, et qu' il s'agit d' une formule d' application de la théorie de la probabilité parmi d' autres, mais il faut remarquer qu’à partir du colloque de l’Institut International de Statistique organisé à Rome en 1925, elle devient la méthode presque universelle dans la nouvelle statistique mathématique.


Statistique mathématique et Sociologie. La statistique, trouve finalement sa méthode13 dans l'application de la théorie des erreurs aux problèmes sociaux, tels le chômage ou les conditions de vie de la classe ouvrière. La Grande-Bretagne devient aussi le foyer privilégié de cette nouvelle science statistique, peut-être par la combinaison d’une riche tradition philosophique inductive qui donne la primauté aux méthodes empiriques et de quelques conditions sociales et politiques. La Grande-Bretagne, par exemple, est le premier pays à créer les indemnités de chômage (1911), ce qui produit des conditions suffisantes à l'application de la méthode des échantillons. Certainement, ce n'était pas la même chose de découvrir les lois des séries des prix que de connaître le nombre de chômeurs à un moment et à un endroit donnés. En 1923, lorsque le Ministère du Travail anglais avait besoin d'une description détaillée des presque deux millions deux cent cinquante mille chômeurs enregistrés, John Hilton, professeur à l'université de Cambridge et alors directeur des statistiques du Ministère du Travail britannique, s'est rendu compte de l'utilité de la méthode représentative et de l'urgence d'avoir des entretiens directement avec les chômeurs. Les enquêtes sur les conditions de vie de la classe ouvrière rendent alors possible la construction de la nouvelle méthode statistique.
Les protagonistes de ce processus, par contre, ne seront pas des sociologues, mais des économistes, ou plus exactement, des mathématiciens devenus économistes. Pour comprendre ce processus à l'intérieur du champ de la sociologie, il faut se tourner vers les Etats-Unis et y découvrir deux personnages clés, F. Ogburn et Samuel A. Stouffer. Le premier, auteur de nombreuses publications sur l'opinion publique, ouvre le débat sur la méthode statistique en 1929, dans une séance de l'American Sociological Society, dans laquelle il lance un appel à l'abandon des procédures « non scientifiques », pour une pratique statistique quantitative et objective en matière de prédiction et d'ingénierie sociales. Le second, docteur en 1930 à l'Université de Chicago, est formé sous l'influence de Thurstone et Ogburn, mais fait aussi un stage post-doctoral à l'université de Londres avec K. Pearson et R. Fisher. Durant la IIème Guerre mondiale, il dirige le Research Branch Information and Education Division au Département de la Guerre, où il est responsable d'une des enquêtes les plus impressionnantes qu'on ait jamais fait. A cette recherche a participé une autre étoile montante de la sociologie statistique, le jeune astrophysicien viennois, devenu sociologue: Paul Lazarsfeld.
En Espagne, les enquêtes sur les conditions de vie de la classe ouvrière sont effectuées à l'Institut de Réformes Sociales entre 1903 et 1924 par des sociologues ayant une formation juridique, mais qui exécutent des travaux importants dans la lignée des monographies de Leplay, et établissent des indices du coût de la vie des ouvriers. Parmi les travaux des sociologues, on retiendra simplement l'enquête démographique faite par Severino Aznar à l'aide de la méthode représentative, avec les données du recensement de 192014.
Plus riche, sans doute, est la situation en France, avec la figure de Maurice Halbwachs, récemment sorti de l'oubli par la Revue d'Histoire des Sciences Humaines15. Néanmoins, l'idée s'est répandue qu'Halbwachs avait une attitude ambivalente vis à vis de la statistique; ainsi, Olivier Martin, dans son article : Raison Statistique et Raison Sociologique chez Maurice Halbwachs16 écrit que bien qu'il soit le sociologue français le plus intéressé par les mathématiques, et qui avait la meilleure formation statistique, il donne aux mathématiques une valeur relative. Selon Olivier Martin, pour Halbwachs, les mathématiques ne servent qu' "à établir des faits que le sociologue doit ensuite interpréter et expliquer, et qui doivent être replacés dans leur contexte social précis"17. Nous pensons pour notre part que la position de Halbwachs est seulement de critique des excès et des abus qui commencent à se succéder dans le domaine des sciences sociales à partir de l'introduction des techniques mathématiques. Son intérêt pour la statistique mathématique est déjà suffisamment justifié par les études qu'il a faites sur les conditions de vie de la classe ouvrière, et par son approche des problèmes de calcul des probabilités18.
En 1935, il participe au colloque sur la statistique organisé à Paris par le Centre International de Synthèse19, afin de présenter les problèmes consécutifs à l'application de la statistique aux faits sociaux. Il commence un exposé intitulé La Statistique en Sociologie en disant que la statistique a été découverte dans le domaine des sciences sociales et a été définie comme la science des moyennes. A ce propos, il fait la différence entre les moyens utilisés par les sciences de la nature et ceux des sciences sociales où la statistique s'applique. Il utilise la définition de Durkheim du fait social et donne l'exemple de la durée de vie moyenne qui lui permet de faire la première affirmation importante : tout dénombrement n'est pas une statistique ; il est nécessaire que le groupe présente une certaine consistance. La moyenne des tailles, des prix recueillis au hasard, des salaires, des loyers, ne sont pas vraiment des statistiques; en cela il suit les idées de Simiand.
Il s'interroge sur les différences entre les observations faites dans le domaine de la biologie, où les êtres vivants sont des entités réelles, et les observations faites dans le domaine des faits sociaux. Les faits d'observation d'êtres vivants sont constitués par des éléments presque identiques, à la différence des phénomènes sociaux: "Au fond, il n'y a d' ensembles réels que les groupes sociaux, précisément, parce qu'ils sont constitués par des éléments différents. Tous les autres ensembles sont des collections” 20
Ici le problème des statistiques devient aussi complexe : la population d'un département n'est pas un groupe social; une période quinquennale n'est pas une période socialement définie. D'après les propositions de Simiand d'étudier le phénomène de façon continue, il se demande si les groupes d'âge, tels que les statisticiens les utilisent, sont une réalité sociale. Nous pouvons penser d'abord que l'origine de la méfiance de Halbwachs vis-à-vis de la statistique est l'utilisation qui en est faite par certains mathématiciens. Il parle par exemple, de l'excessive rigueur arithmétique qui commence à se répandre dans le domaine des sciences sociales, et qu'il considère comme un peu artificielle et arbitraire.
Halbwachs considère qu'il faut rendre compte de la diversité des classes sociales, des professions, des différences entre milieu rural et urbain, et se demande si la pyramide des ages est la même en milieu urbain et rural, ou pour les riches et pour les pauvres. Par exemple, la proportion d'adultes aux Etats-Unis est la même qu'en France; ce n'est pas que la natalité y soit faible comme en France, mais beaucoup d'immigrés débarquent dans ce pays à l'âge adulte.
Après toutes ces considérations, voyons en quoi consistent les réserves de Halbwachs concernant l'utilisation que font les mathématiciens de la statistique. Nous avons déjà vu la définition de la statistique comme science des moyennes et des courbes; mais il s'agit d'un point de départ pour une définition satisfaisante. A la différence des Sciences Physiques où, si on supprime quelques aspects fondamentaux durant l'expérience, le phénomène ne se produit pas, dans le statistique, les chiffres se laissent toujours combiner avec des chiffres21. Ce qui pose une fois de plus la question du rapport entre les modèles mathématiques et la réalité :".. de même que l'homo oeconomicus, un tel homo demographicus est une abstraction trop soigneusement détachée de la réalité pour nous apprendre quoi que ce soit sur le réel".22
Concernant le respect de l'utilisation des courbes et graphiques, la position de Halbwachs est aussi claire: “Quant aux courbes, elles doivent subir tous les replis du phénomène, le représenter dans toutes ses phases, mais aussi l'embrasser dans toute son étendue, et en toutes ses parties » .23 Mais surtout, ce qui nous intéresse est la critique qu'il fait de l'utilisation de la courbe la plus fameuse, parce qu'il cite R. Gibrat, ancien élevé de l' Ecole Polytechnique et économiste réputé à l'époque, qui dit à propos des inégalités : "Notre loi est essentiellement statistique. Elle ramène simplement les courbes des répartitions économiques à une courbe célèbre, la courbe en cloche, dite aussi de Gauss ou des erreurs"24
Halbwachs se demande si c' est " bien vraiment l'idéal de la recherche statistique que de ramener les faits économiques et sociaux, leurs mouvements et leurs variations, à telle ou telle courbe avec laquelle les mathématicien sont familiers?"25. Il anticipe, cette pratique qui a fini par se généraliser et, à mon avis, c'est ce qui a empêché une interprétation correcte de la méthode des échantillons pendant plusieurs années, et qui a contribué à la confusion des méthodes à l'intérieur des sciences sociales. De surcroît, ces mauvaises pratiques ont contribué aux disputes académiques entre spécialistes en sciences sociales ayant une formation mathématique, et ceux qui n'en ont pas:
"Certes, l'ingéniosité des algébristes et des géomètres est grande. Ils disposent des nombreux procédés d' ajustement, ils savent introduire dans leurs formules divers paramètres, si bien qu' en faisant les conventions nécessaires il est toujours possible de ramener les courbes observées à des courbes théoriques de forme connue".26
Il critique aussi Udny Yule, qui présente les courbes de population de pays aussi différents que l'Angleterre, la France et les Etats Unis, et les transforme, par des ajustements mathématiques, en une seule courbe théorique avec une seule formule. Halbwachs est mordant à ce sujet : "des courbes de ce type ne nous apprennent rien sur le mécanisme interne."27Les rapports entre différentes séries nous proposent une image approximative, mais c'est avec l'étude de ce jeu de rapports, que commence, et commence seulement, la recherche positive28.
Il poursuit sa critique avec les Cours de statistique de A. Aftalion, avec lequel il commence une polémique à propos des altérations de prix produits depuis la fin du XIXème siècle. A. Aftalion soutient que deux siècles et demi sont insuffisants pour établir une régularité. F. Simiand au contraire, parce qu’il regarde le mécanisme complexe, avait soutenu qu'une ou deux répétitions sont suffisantes pour établir la réalité de ces grands cycles. De cette façon, deux expériences peuvent suffire quand elles montrent toute une complexité de facteurs mesurés avec précision :
C' est, à vrai dire, d' une toute autre façon qu' il faut concevoir l’utilisation des méthodes statistiques en sociologie quantitative. Elles ne nous apportent pas des théories, mais des instruments d' observation et de comparaison, à la fois précises et objectifs, et c' est dans cette direction qu' il faudra de plus en plus les développer".29
A ce propos, il recommande d'analyser "sans entrer dans les détails techniques" les coefficients de dépendance et de corrélation.
  1   2   3   4

similaire:

RÉsumé IL y a aujourd\Programme Histoire et civilisations
«Peut-être arrivera-t-il bientôt dans la manière d’écrire l’histoire ce qui est arrivé dans la physique. Les nouvelles découvertes...

RÉsumé IL y a aujourd\Il y a des millions d’années, la Nature a été ordonnée à la reproduction...
«bébé éprouvette», le 25 juillet 1978, (Louise Brown), environ quatre millions d’enfants sont nés grâce à cette technique. Or, aujourd’hui,...

RÉsumé IL y a aujourd\1 ] une équation plus simple et plus précise, analogue à celle de...
«( … ) les progrès récents des observations ont été foudroyants. (… ); mais le lecteur ne devra pas s’étonner si des remises en causes...

RÉsumé IL y a aujourd\Discours rapportés direct et indirect 55
«Dans Titanic, c’est impossible de distinguer les scènes qui ont été réalisées par ordinateur de celles qui ont été tournées de manière...

RÉsumé IL y a aujourd\I. Généralités tp sur lectine Con A. A. Application
«Drug-targetting». On cherche donc à cibler spécifiquement la drogue suivant la tumeur. Mais trouver le vecteur spécifique n’est...

RÉsumé IL y a aujourd\Les progrès de la société, grâce à qui nous vivons aujourd’hui, ont...

RÉsumé IL y a aujourd\Résumé 501 Les Hautes Alpes (2) Pierre Chauvet est l'auteur d'une...

RÉsumé IL y a aujourd\Les fraises bio ont une meilleure qualité nutritive
«modernes» en nutriments. Alors qu’une pêche suffisait en 1950 pour absorber une bonne ration de vitamine A, IL faudrait aujourd’hui...

RÉsumé IL y a aujourd\Toute reproduction interdite sans autorisation de l’auteur
«Quelle dose de risque vital et de perturbation dans leurs habitudes les individus sont-ils prêts à accepter pour tenir leur rôle...

RÉsumé IL y a aujourd\Résumé Dans le monde de l'intelligence artificiel aujourd'hui, on...








Tous droits réservés. Copyright © 2016
contacts
b.21-bal.com