Corrélations écologiques et comportement des individus
Home Research Details
William S. Robinson

Corrélations écologiques et comportement des individus

0.0 (0 ratings)

Introduction

Corrélations écologiques et comportement des individus. Découvrez l'erreur écologique, l'inférence erronée du comportement individuel à partir de données agrégées. Un concept essentiel en sciences sociales pour des analyses statistiques précises.

0
2 views

Abstract

Hanan C. Selvin inventa l’expression d’erreur écologique (ecological fallacy) dans un article de 1958. Il y pointait les erreurs d’interprétation d’Émile Durkheim qui, dans Le suicide, établissait des corrélations entre diverses propriétés sociales et la propension au suicide à partir de données agrégées à l’échelle de territoires (le département pour la France, la région pour la Prusse, etc.). Par exemple, le taux de suicide étant plus important dans les régions de Prusse où les protestants sont plus nombreux, il existerait un lien entre protestantisme et suicide. Or, les suicides recensés pouvaient en réalité concerner tout autant des protestants que des catholiques : les données ne permettant pas de le mesurer au niveau individuel, il est erroné d’en déduire un lien individuel entre religion et suicide. Selvin appuyait sa critique sur un article de William S. Robinson paru huit ans plus tôt, dont Cambouis propose ici une traduction. Robinson établit mathématiquement, pour la première fois, les raisons pour lesquelles une corrélation observée entre des pourcentages ou des taux portant sur une population agrégée à l’échelle de découpages territoriaux s’avère souvent différente d’une corrélation entre des caractéristiques mesurées à l’échelle des individus composant cette population. Ainsi, plus les immigré⋅es sont nombreux dans une région des États-Unis, plus le taux d’illettrisme y est faible ; pourtant, à l’échelle individuelle, les immigré⋅es s’avèrent en moyenne plus souvent illettré⋅es que les autochtones (une explication possible de cet écart est que les immigré⋅es tendent à s’installer dans les régions aux plus faibles taux d’illettrisme). S’il nous paraît utile de remettre en visibilité cette démonstration aujourd’hui, c’est qu’elle n’a pas empêché depuis que nombre d’analyses statistiques succombent (tout en s'en défendant souvent) à la tentation d’inférer des relations « écologiques » mal contrôlées en l’absence de données individuelles – c’est ainsi fréquent en analyse électorale, lorsque par exemple est déduit de la corrélation entre la forte présence d’ouvrier⋅es et l’importance du vote FN/RN à l’échelle des circonscriptions que les ouvrier⋅es seraient passé⋅es du vote PCF au vote FN/RN, alors que les sondages « sorties des urnes », qui offrent des données individuelles, établissent que, pour l’essentiel, ce ne sont pas les mêmes ouvrier⋅es qui votaient PCF (et aujourd’hui tendent à s’abstenir) et qui votent aujourd’hui FN/RN (et qui auparavant tendaient à s’abstenir). Le risque d'erreur écologique est également l'un des facteurs du développement des modèles multiniveaux, par exemple en sciences politiques ou en démographie (voir, respectivement, les travaux d'Andrew Gelman et de Daniel Courgeau).


Review

This paper, titled "Corrélations écologiques et comportement des individus," offers a timely and crucial re-evaluation of the ecological fallacy, a concept central to robust social science methodology. By presenting a translation of William S. Robinson's foundational 1950 article, the authors effectively bring back into focus the original mathematical demonstration that underpins this critical statistical error. The review correctly traces the concept's naming by Hanan C. Selvin in 1958 and its historical context, particularly its application to critiques of Émile Durkheim's work, setting the stage for understanding the enduring relevance of Robinson's contribution. The abstract effectively illustrates the core of the ecological fallacy through compelling examples. It revisits Selvin's critique of Durkheim's *Le suicide*, showing how aggregate correlations between regional Protestant populations and suicide rates were mistakenly interpreted as individual-level links. More strikingly, the paper highlights Robinson's mathematical proof with an example where a higher presence of immigrants in a region correlates with lower illiteracy rates at the aggregate level, even though immigrants are individually more often illiterate than native populations. This discrepancy underscores the critical danger of inferring individual-level behaviors or characteristics from data aggregated at a broader geographical or social scale. The paper's contemporary relevance is particularly strong, as the abstract notes that many analyses continue to succumb to this inferential error, even while attempting to guard against it. The example from electoral analysis, where aggregate correlations between working-class presence and FN/RN voting are often misinterpreted, provides a sharp illustration of how the fallacy can lead to incorrect conclusions about voter behavior. By re-emphasizing Robinson's work, the paper not only serves as a vital methodological warning but also implicitly connects to more advanced statistical solutions, such as the development of multilevel models championed by scholars like Andrew Gelman and Daniel Courgeau. This translation and accompanying discussion are therefore invaluable for researchers across sociology, political science, demography, and other fields that rely on both aggregate and individual data.


Full Text

You need to be logged in to view the full text and Download file of this article - Corrélations écologiques et comportement des individus from Cambouis, la revue des sciences sociales aux mains sales .

Login to View Full Text And Download

Comments


You need to be logged in to post a comment.