Version Métopes : 3.0
Written by OpenOffice
Corrélations écologiques et comportement des individus
William S. Robinson
(1)
où
(1a)
et
(1b)
Autrement dit, la corrélation écologique est la différence pondérée entre la corrélation individuelle totale et la moyenne des m corrélations individuelles intra-zones. Pour cette différence pondérée, les poids respectifs de la corrélation individuelle totale et de la corrélation individuelle intra-zones dépendent du degré auquel les valeurs de X et de Y sont différentes d’une zone à l’autre.
L’analyse de la relation donnée en (1) montre que des corrélations individuelle et écologique seront égales, et que par conséquent l’hypothèse d’équivalence sera valide, quand
(2)
où
(2a)
La valeur minimale de k3 dans (2) est l’unité. De ce fait, (2) sera valable, et les corrélations individuelle et écologique seront égales, si la moyenne des corrélations individuelles intra-zones ne vaut pas moins que la corrélation individuelle totale. Mais toutes les preuves disponibles montrent que, quoi qu’indiquent les propriétés X et Y, la corrélation entre X et Y n’est certainement pas plus importante pour des sous-groupes relativement homogènes que pour la population dans son ensemble. En bref, l’hypothèse d’équivalence n’a aucune base factuelle. Il doit alors exister une raison pour laquelle les valeurs des corrélations écologiques publiées sont systématiquement élevées en comparaison des valeurs plus petites qu’on obtient habituellement en calculant les corrélations entre les propriétés individuelles. La relation présentée en (1) l’indique : elle donne la condition d’une valeur numérique plus élevée de la relation écologique
(3)
où k3 est donné par (2a). Comme la valeur minimale de k3 est l’unité, l’équation (3) implique que la corrélation écologique sera numériquement plus élevée que la corrélation individuelle quand la corrélation individuelle intra-zones n’est pas plus élevée que la corrélation individuelle totale, ce qui est le cas habituellement.
Les personnes qui utilisent les corrélations écologiques savent que la taille du coefficient dépend fortement du nombre de zones. Gehlke et Biehl, par exemple, ont commenté en 1934 la relation positive entre la taille du coefficient et la taille moyenne des zones à partir desquelles il était calculé (Gehlke et Biehl, 1934). Cette tendance est illustrée par les exemples donnés plus haut : la corrélation entre la race renseignée et l’illettrisme est de 0,773 quand les zones sont les États et de 0,946 quand les zones sont les neuf divisions géographiques du recensement. La même tendance est manifestée par les corrélations entre le lieu de naissance et l’illettrisme, dont la valeur est de -0,526 quand il s’agit des États et de -0,619 quand il s’agit des divisions.
L’équation (1) montre pourquoi la taille de la corrélation écologique dépend du nombre des zones. C’est que le comportement de la corrélation écologique dès lors que de petites zones sont regroupées dans de plus larges peut être prédit à partir du comportement des variables à la droite de (1) quand l’agrégation est effectuée. Quand les petites zones sont agrégées, il arrive deux choses :
Mais ces deux tendances ne sont pas aussi importantes l’une que l’autre. L’analyse de (1) concernant l’effet des changements de valeurs de ηXA, ηYA et rw indique que cet effet est considérablement plus important pour les η que pour rw. L’effet net des changements de ces trois valeurs pris ensemble est donc celui d’un accroissement de la valeur numérique de la corrélation écologique lorsqu’une agrégation des zones est réalisée.