Les sondages sont très présents lors des campagnes électorales et
il est alors bien vu de les critiquer : on prétend qu’ils se trompent
(comme les prévisions météorologiques), qu’ils influencent les indécis (ces derniers devraient plutôt
réfléchir au lieu de se laisser mener par le bout du nez) et qu’ils
vident le vote de son sens (comme si la partie était jouée d’avance).
Les sondages électoraux sont généralement absents au niveau local.
Les mordus de la politique sont alors obligés d’y aller de leurs propres
pronostics et la plupart d’entre eux passent tout à fait à côté de
la réalité. Les organisations partisanes, avec leurs listes de pointage
et leurs armées de bénévoles déploient un luxe d’efforts et finissent
par se tromper tout aussi lourdement.
À quoi bon blesser un éléphant avec un boulet de canon
si on peut le tuer avec une carabine à plomb? (Ramou)
On est alors obligé de reconnaître que l’efficacité des sondages est
impressionnante : il suffit d’interroger un millier de personnes (« bien »
choisies) pour avoir une idée assez précise de l’opinion de millions
d’électeurs et d’électrices. De façon similaire, pendant que Scotland
Yard dépouille, à grands frais, les casiers judiciaires de tous les
Londoniens fichés, Hercule Poirot après avoir examiné deux ou trois
indices (bien choisis aussi) peut déterminer que l’assassin a mis
de la moutarde sur ses œufs au déjeuner, qu’il est membre du Regent
Club et qu’il a oublié de fermer le robinet à gaz en quittant son
cottage dans le Kent le weekend précédent.
Bien sûr, il est toujours possible que le sondage se trompe plus ou
moins souvent et à un degré plus ou moins grand, mais ces possibilités
d’erreurs sont faciles à évaluer. Il suffira alors de choisir un échantillon
suffisamment fiable pour que les possibilités d’erreurs ne dépassent
pas les marges tolérées.
Lorsqu’on désire connaître certaines caractéristiques d’une population,
on se livre à une enquête. Dans beaucoup de situations, le
sondage, qui consiste à observer une population à travers un échantillon
bien choisi, permet d’effectuer cette enquête à peu de frais.
Au terme de ce chapitre, vous devriez être en mesure de répondre aux questions suivantes :
Comment peut-on tirer des conclusions fiables au sujet d’une population à partir des données fournies par un échantillon?
Comment doit-on choisir un bon échantillon?
Comment l’échantillonnage par grappes et l’échantillonnage stratifié peuvent-ils nous aider à obtenir des résultats fiables à moindres frais?
1. COMMENT BIEN CHOISIR L’ÉCHANTILLON
Tout le monde connaît l’histoire du fou qui prend les allumettes dans
une boîte, les allume l’une après l’autre, et les remet dans la boîte
en disant chaque fois : « celle-là est bonne ». Pour notre part, nous
avons un ami qui, avant de partir en camping, prenait la précaution
de vérifier ses boîtes d’allumettes réputées à l’épreuve de l’humidité.
Contrairement au fou, notre campeur se contentait heureusement de
brûler une allumette de chaque paquet. Et cet ami continua ainsi à
prélever son échantillon, jusqu’au jour où il eut l’idée de
remplacer les allumettes par un briquet (pas fou, mais personne n’y
avait pensé).
1.1. L’échantillon : une partie à l’image du tout
Pour connaître une chose, il suffit parfois d’en prélever une partie
ou un morceau. Une cuillerée suffit pour déterminer si la soupe est
assez salée et une goutte de lait sur le creux du poignet permet de
juger si le biberon est assez chaud. Parfois, on ne peut pas se contenter
d’un échantillon aussi petit. Ce n’est pas parce ce que le premier
homme (ou la première femme) que vous avez rencontré est le roi des
crétins que tous les hommes sont comme lui. Ce n’est pas non plus parce
que la première personne croisée dans la rue a l’intention de voter
pour le candidat Jos Bleau (ou Tartinovitch) que celui-ci a des chances de remporter les
élections. Le caractère et les opinions politiques varient
beaucoup d’une personne à l’autre, c’est pourquoi il faut recueillir
un échantillon « suffisant » avant de se faire une idée générale sur
l’ensemble de la population.
L’échantillon représente une partie de la population que l’on observe, dans l’espoir de mieux connaître cette population.
Comme on vient de le voir, le mot population peut être pris
au sens propre (l’ensemble des électeurs d’un pays) ou au sens figuré
(l’ensemble des allumettes du paquet). Faute de pouvoir observer toute
une population, on doit parfois se contenter d’en observer un échantillon.
Mais ce dernier n’est pas nécessairement un reflet parfait de la population.
Lorsqu’on utilise un échantillon pour se faire une idée d’une population, c’est-à-dire lorsqu’on la sonde, on fait alors une enquête par sondage, ou, plus simplement, un sondage.
Plus l’échantillon est grand, plus il donne une image fidèle de la
population (nous apporterons des preuves un peu plus loin). Mais cela
n’est pas suffisant. Si votre quinzième fiancé (rencontré dans le
même bar que les 14 autres) ne vaut pas plus cher que les précédents,
cela ne veut pas dire que tous les hommes ne valent rien. On peut
par contre se questionner sur le genre d’endroit que vous fréquentez.
Si les 150 premières personnes interrogées prétendent vouloir voter
pour le même parti et que vous avez rencontré tous ces gens à la sortie
d’un film de Falardeau, votre échantillon ne vous renseigne
pas beaucoup sur les intentions de vote de la population en général.
L’échantillon doit être suffisamment grand, mais il doit aussi être
choisi selon les règles de l’art.
Lorsque les caractéristiques que l’on veut connaître sont
très variables, pourquoi ne pas observer directement l’ensemble de
la population?
Bien sûr, lorsqu’on observe toute la population on n’a pas à se soucier
de la représentativité de l’échantillon (la population est l’échantillon
le plus fidèle!). Mais, cela mis à part, l’enquête par sondage
possède beaucoup d’avantages par rapport à un recensement complet
de la population. Le sondage coûte beaucoup moins cher, car un échantillon
de quelques milliers d’individus est suffisant dans la plupart des
cas, et ce peu importe que la population compte 100 000 ou 100 millions
d’individus. Du même coup, le sondage permet d’obtenir de l’information
plus rapidement. Cela est particulièrement utile, par exemple, lorsqu’on
veut connaître à l’avance les tendances d’un vote. Il serait en effet
très malheureux de ne connaître les prévisions que trois mois après
la publication des résultats : ce serait aussi intéressant que d’écouter
les prévisions météorologiques pour la veille! Enfin, dans un sondage,
on peut se permettre d’aborder des sujets plus délicats et plus compliqués :
les enquêteurs, mieux formés parce que moins nombreux que lors d’un
recensement, seront plus en mesure de rassurer et de guider la personne
interrogée. C’est pourquoi une enquête par sondage se révèle parfois plus
fiable qu’une enquête par recensement.
Parfois, le recensement de la population est tout bonnement impossible.
Comme nous l’avons vu avec le fou qui teste ses allumettes. Cette
impossibilité s’applique à toutes les situations où l’observation
modifie, ou détruit, l’objet observé. Les tyrans, qui craignaient
par-dessus tout être assassinés par leurs proches, ne touchaient aucune
nourriture avant qu’elle eût été goûtée par des serviteurs. Ces goûteurs
officiels se contentaient de prélever un simple échantillon
de chaque plat : il n’était évidemment pas question qu’ils mangent
tout. Si les goûteurs avaient tout recensé, les tyrans n’auraient
rien eu à manger. Malgré toutes ces précautions, Agrippine, la mère
de l’empereur Néron, réussit à se débarrasser de son impérial époux
en empoisonnant seulement la moitié du plat de champignons, et il s’agissait
justement de la moitié que le goûteur n’avait pas sondée. Voilà une
erreur d’échantillonnage, sans doute voulue, qui a eu des conséquences
tragiques.
Recenser la population présente tout de même un avantage. Le recensement
fournit des informations précises et détaillées qui permettent de
vérifier la qualité des échantillons choisis et de remettre périodiquement
les pendules à l’heure.
1.2. Le hasard : père d’un bon échantillon
Tous les gens qui jouent aux cartes savent qu’à la longue c’est l’habileté,
bien plus que la chance qui permet de gagner. Bien sûr, on peut avoir
du jeu plusieurs fois de suite et même, à l’occasion, toute la soirée,
mais il n’y a pas de miracle. Les bonnes et les mauvaises cartes finissent
toujours par « s’équilibrer », même si dans certains cas exceptionnels,
la chance peut se maintenir très longtemps. C’est ce qu’on appelle
vulgairement la loi des grands nombres.
Un échantillon est probabiliste lorsque tous les éléments
de la population sondée ont les mêmes chances d’être choisis dans
l’échantillon.
Si vous ne tirez jamais l’as, vous allez rapidement vous demander
si le jeu contient vraiment quatre as, si les cartes ont été mêlées convenablement,
ou si quelqu’un triche. Vous savez que le hasard devrait faire que
les cartes que vous aurez en main (votre échantillon) finiront par
refléter à peu près la composition du paquet (la population). Le mot
clé est ici le hasard. Pour que l’échantillon soit représentatif,
il faut absolument que tous les éléments de la population sondée (toutes
les cartes du paquet) aient les mêmes chances de figurer dans l’échantillon.
On parle alors d’échantillon probabiliste, puisque la probabilité
qu’un élément fasse partie de l’échantillon est égale pour tous les
éléments de la population.
Avec cette méthode, les chances de tomber sur un échantillon non représentatif
sont d’autant plus faibles que la taille de l’échantillon est grande.
De plus, il est possible d’évaluer le risque que l’échantillon tombe
plus ou moins loin de la réalité.
Revenons maintenant sur la notion de représentativité de l’échantillon.
Comment vérifier, par exemple, qu’un échantillon de Québécois est
représentatif de la population du Québec? Cet échantillon devrait
théoriquement compter 51 % de femmes, 6 % de protestants, 16 % de
personnes âgées de 65 ans et plus, 3 % de Saguenéens, 20 % de myopes,
23 % propriétaires de chiens, etc.
Cela fait beaucoup de caractéristiques pour un simple échantillon.
Combien de Saguenéens protestants myopes et propriétaires d’un chien
devraient figurer dans cet échantillon? Au moins 30 ou 40 pour que la loi des grands nombres puisse s’appliquer. Pour tenir
compte de toutes les caractéristiques énumérées, il faudrait alors
tirer un échantillon considérable, ce que l’on cherche justement à
éviter. Or il ne faut pas oublier que le sondage repose sur le principe
qu’un échantillon modeste permet de connaître une population à peu
de frais et de façon rapide.
Pour être représentatif, un échantillon doit refléter
toutes les facettes du sujet étudié.
Ce problème est facile à résoudre. Pour être représentatif, un échantillon
doit refléter toutes les facettes du sujet étudié et non pas toutes
les facettes de la population. Si on s’intéresse au partage des travaux
ménagers, par exemple, il pourrait être souhaitable que l’échantillon
soit représentatif des variables suivantes : le sexe, l’âge, le niveau
de scolarité. Il serait par contre inutile que l’échantillon soit
représentatif de la proportion de myopes ou de propriétaires de chiens
dans la population : il est peu probable que le partage des tâches
ménagères soit influencé par de telles variables.
Dans certains cas, il n’est même pas nécessaire que la proportion
de chaque caractéristique soit la même dans l’échantillon que dans
la population. Si on s’intéresse au tabagisme, par exemple, on peut
très bien constituer un échantillon formé à parts égales de fumeurs
et de non-fumeurs, même si dans la population les fumeurs sont cinq
fois moins nombreux que les non-fumeurs. Dans ce cas, les fumeurs
sont surreprésentés; cette surreprésentation se justifie parce qu’ils nous intéressent
particulièrement. Il suffira d’en tenir compte lorsqu’on examinera les résultats du sondage.
Un coup de dé
Le mot hasard vient de l’arabe az-zahar qui signifie
à la fois fleur et chance (ou coup de dé). En latin, le mot alea
signifie aussi coup de dé. Comme disait Jules César en franchissant
le Rubicon avec son armée : alea jacta est! (les dés sont jetés). Rien d’étonnant
à ce qu’un échantillon choisi au hasard soit aussi appelé un échantillon
aléatoire ou probabiliste. Choisir au hasard ne veut surtout pas dire
choisir le premier venu. Si le hasard est aveugle, c’est justement
parce qu’il obéit à des lois et qu’il peut être mis à l’épreuve (du
latin probare, prouver, qui a aussi donné le mot probabilis,
probable). La chance (du latin cadere, tomber, qui a aussi
donné le mot cadence en français et caer en espagnol) est ce
qui tombe du ciel… ou du cornet à dés. Le dé (du latin dare,
donner) serait lui-même à l’origine un jeton ou un pion que l’on distribue
au moment où se fait la « donne » du jeu. Enfin, le mot échantillon
viendrait du « latin de cuisine » scandilia, qui signifiait mesurer,
sonder, vérifier la mesure*.
1.3. Un exemple d’échantillon bien choisi
La population canadienne est recensée tous les cinq ans. Toutefois, compte
tenu de l’ampleur de la consultation, les questions posées aux millions
de résidents canadiens sont relativement simples et peu nombreuses.
Pour mieux connaître les habitudes de vie de la population, Statistique
Canada effectue régulièrement des enquêtes par sondage.
En 1994, cet organisme publiait les résultats d’une enquête portant
sur la famille et les amis. Cette enquête s’inscrivait dans le cadre
plus général de l’enquête sociale générale qui porte sur des
sujets aussi variés que la santé ou les loisirs. Pour les chercheurs
que cela intéresse, les données de ces enquêtes sont facilement accessibles
sous forme de rapports écrits et sous forme de
données informatisées (voir le site de Statistique Canada).
Les sujets abordés par l’enquête sur la famille et les amis étaient
les suivants : la vie de couple, la procréation, le partage des tâches
ménagères, l’aide à la famille et aux amis, les contacts familiaux
et la situation plus particulière des personnes âgées. Le tableau
7.1 donne un exemple des résultats obtenus. Nous reviendrons sur cette
enquête tout au long du chapitre. Pour le moment, nous nous intéresserons
uniquement à la façon dont l’échantillon a été choisi.
Pour couvrir des sujets aussi variés, et pour que l’échantillon demeure
suffisamment fiable au niveau régional ou selon le groupe d’âge, par
exemple, il a fallu interroger un nombre considérable de personnes :
en tout, 13 495 ménages ont été sondés. À titre de comparaison,
il suffit généralement d’un millier de personnes pour sonder l’état
de l’électorat.
L’élaboration de l’échantillon s’est faite selon les deux principes
fondamentaux énoncés plus haut : l’échantillon doit être probabiliste
(chaque élément a la même chance d’être sélectionné) et représentatif
des caractéristiques étudiées.
On définit la population observée.
On a commencé par définir la population étudiée : il s’agit des ménages
canadiens. Le ménage est un groupe de personnes qui habitent ensemble
et qui partagent certaines tâches et certaines décisions : une sorte
de famille au sens large. À la limite, le ménage peut être constitué
d’une seule personne. Par contre, les pensionnaires d’une prison ou
d’un foyer pour personnes âgées ne constituent pas un ménage. D’autre
part, on a décidé de ne s’intéresser directement qu’aux personnes
de 15 ans et plus et, pour des raisons pratiques, on a exclu la population
des Territoires.
On détermine une stratégie pour constituer un échantillon
valable.
Grâce aux compagnies de téléphone, on a pu constituer une liste de
numéros associés à chaque ménage. On a pris soin d’éliminer, par exemple,
les numéros des entreprises ainsi que les numéros supplémentaires
que possèdent certains ménages (pour éviter que ces derniers aient
plus de chances d’être choisis). Évidemment, les ménages qui n’ont
pas le téléphone (moins de 2 % des ménages) n’ont pas été consultés :
cela aurait été très regrettable si l’enquête avait porté sur l’opinion
des sans-abris, mais, dans ce cas-ci, l’inconvénient s’avère négligeable compte
tenu des coûts économisés.
La stratification consiste à diviser la population en
groupes relativement homogènes (les strates) et à sélectionner ensuite
un échantillon indépendant dans chaque strate.
Une fois la liste des numéros de téléphone établie, on l’a découpée
en différents paquets correspondant à chaque région (grâce aux indicatifs
régionaux). On a tiré au hasard 18 325 numéros de téléphone en
faisant en sorte de respecter dans l’échantillon les mêmes proportions
régionales que dans la population*. Ce principe, que l’on appelle la stratification,
permet par exemple d’éviter de tirer, par hasard, un échantillon qui
ne contiendrait aucun Québécois. Dans le même ordre d’idée, on pourrait
diviser la population en sous-groupes basés sur l’origine ethnique,
l’âge et même le sexe avant de constituer un échantillon visant à
sonder les intentions de vote des Québécois. Cela permettrait, moyennant
un petit effort supplémentaire, de diminuer grandement le risque de
tomber sur un échantillon aberrant.
On joignait alors chaque ménage sélectionné au téléphone, on vérifiait
auprès de la personne qui avait répondu à l’appel que le ménage était
admissible, c’est-à-dire qu’il faisait partie de la population choisie, et on notait
certaines données sur chaque membre du ménage : âge, sexe, état matrimonial
et lien avec un membre du ménage choisi comme référence. On choisissait
alors au hasard un seul répondant pour le ménage et on faisait
venir cette personne au téléphone (à moins qu’elle ne soit déjà au
bout du fil) pour lui poser la série de questions (environ 300 questions)
sur l’enquête proprement dite. Aucune entrevue par personne interposée
n’était acceptée.
Parmi les 18 325 ménages appelés, 3206 ne répondirent pas (dont 1
884 qui refusèrent carrément de parler à l’enquêteur). Sur les 15 119 ménages restants (soit 18 325 – 3206), il y avait encore 1624
non-réponses (dans 438 cas, l’individu sélectionné dans le ménage refusait
de répondre, dans 786 cas la communication a été coupée avant que l’enquête
ne soit terminée, dans 13 cas on s’aperçut, après coup, que le ménage
ne faisait pas partie de la population étudiée et dans 387 autres cas, les
réponses étaient trop incomplètes pour être traitées). Il restait,
au bout du compte, 13 495 réponses (soit 15 119 – 1624).
Les non-réponses diminuent la fiabilité d’un sondage, car elles ne
sont pas nécessairement l’effet du hasard. En effet, les personnes
qui refusent de répondre, par exemple, partagent peut-être des caractéristiques
communes, qui exercent une influence sur les variables mesurées par l’enquête.
Dans notre exemple, le taux de réponse est quand même raisonnable
compte tenu de l’envergure de l’enquête : 13 495 ménages sur 18 325,
soit 74 %.
Taux de réponse = Nombre d’individus qui répondent/Nombre d’individus dans l’échantillon
Taux de réponse = 13 495/18 325 = 0,74 = 74 %
EXERCICES 1
1. La représentativité de l’échantillon
Pour chacun des cas suivants, nommez trois caractéristiques qui, selon
votre connaissance du sujet, devraient être bien représentées dans
l’échantillon, et nommez une caractéristique dont il serait inutile
de tenir compte.
a) Une enquête sur la conduite dangereuse sur la route.
b) Une enquête sur les préjugés raciaux.
c) Une enquête sur le tabagisme.
d) Une enquête sur les élections provinciales.
2. L’enquête sur la famille et les amis
Dans l’enquête sur la famille et les amis (dont il est question dans
cette section), quelles sont les précautions qui ont été prises pour
s’assurer que l’échantillon soit représentatif?
2. LA LOI DES GRANDS NOMBRES
Observez le tableau 7.2 ci-dessous. On y retrouve les résultats, pour
le Québec, des élections fédérales du 26 octobre 1993 à côté du dernier
sondage de la maison Gallup (un dossier complet est présenté en annexe du prochain chapitre sur cette élection historique.). Si le sondage
tombe si près de la réalité, ce n’est nullement par un mystérieux
acte de sorcellerie. L’échantillon (un millier de personnes interrogées
du 17 au 20 octobre) est suffisamment grand pour refléter, avec un
bon degré de fidélité, l’opinion des quelque 3 700 000 électeurs
qui s’apprêtaient à voter une semaine plus tard.
Depuis le début de ce chapitre, nous avons affirmé à plusieurs reprises
que les chances de tomber sur un échantillon non représentatif diminuent
lorsque la taille de l’échantillon augmente, à condition bien sûr
que l’échantillon soit vraiment choisi au hasard. Il est maintenant
temps de justifier cette affirmation.
2.1. Des anthropologues sur le terrain
Un congrès sur la famille, qui se tient dans un hôtel des Caraïbes,
réunit, pour le weekend, 6 hommes et 6 femmes, originaires de 6 pays
différents. Nous l’avouons, cette situation est imaginaire, mais
le nombre d’enfants correspond réellement à l’indice de fécondité
pour chaque pays en 1990-1995.
Une Ivoirienne et un Ivoirien, tous deux parents de 6 enfants,
Une Jordanienne et un Jordanien, tous deux parents de 5 enfants,
Une Salvadorienne et un Salvadorien, tous deux parents de 4 enfants,
Une Albanaise et un Albanais, tous deux parents de 3 enfants,
Une Chinoise et un Chinois, tous deux parents de 2 enfants,
Une Espagnole et un Espagnol, tous deux parents d’un enfant unique.
But de la recherche : estimer le nombre moyen d’enfants par
couple.
Trois anthropologues se présentent à l’hôtel et veulent connaître le nombre
moyen d’enfants (la variable étudiée) des personnes qui participent
au congrès (la population). Comme ils sont régis par un décret,
ces chercheurs n’ont pas le droit d’interroger plus d’une personne par
jour.
Le premier anthropologue, une personne très sérieuse, décide d’interroger
une femme le samedi et un homme le dimanche. Il leur demandera combien
d’enfants ils ont, respectivement. En faisant ensuite la moyenne des
deux résultats (l’échantillon), le chercheur compte obtenir
un chiffre assez proche de la moyenne de toutes les familles représentées
au congrès.
Le deuxième anthropologue interroge une femme le samedi et décide
de passer le dimanche au bord de la piscine pour compiler ses résultats.
Pour se donner bonne conscience, ce chercheur se répète la devise
des goûteurs : « inutile d’avaler plus d’une cuillerée quand on veut
savoir si la soupe est chaude ».
Le troisième anthropologue compte se reposer deux jours avant de commencer
ses travaux, d’autant plus que sa banque de congés de maladie est
en train de déborder. Sa devise : « ne fais jamais demain ce que tu
peux faire après-demain ». Le chercheur, une fois bien en forme, compte
occuper les 12 jours qui suivent à interroger successivement chacune
des personnes qui participent au congrès*.
2.2. Les résultats de l’enquête
Inutile de dire que le troisième anthropologue n’obtiendra aucun résultat :
qui trop embrasse, mal étreint. Son projet d’étudier toute la population
(de faire un recensement en somme) est bien trop lourd pour
être mené à bien dans le temps voulu.
Nous savons quant à nous que la moyenne du nombre d’enfants par personne
est de [(2 × 6) + (2 × 5) + (2 × 4) + (2 × 3) + (2 × 2) + (2 × 1)]/12 = 42/12 = 3,5. La question est la suivante : lequel des deux
premiers anthropologues a des chances de tomber le plus
près de la moyenne avec son échantillon? En passant, vous rappelez-vous
que le mot chance vient justement d’un verbe latin qui veut
dire tomber?
Le deuxième anthropologue, qui n’a interrogé qu’une personne, a autant
de chances de tomber sur un élément très éloigné de la moyenne (1
enfant ou 6 enfants) que de tomber sur un élément très proche de la
moyenne.
Le premier anthropologue est dans une bien meilleure position. Examinons
la liste des échantillons de 2 éléments qu’il pourrait avoir recueillis
(tableau 7.3). Dans cette population de 6 femmes et 6 hommes, il existe 36 échantillons possibles de 2 éléments comprenant un homme et
une femme. On constate dans le tableau 7.3 qu’il y a beaucoup plus
d’échantillons concentrés autour de la moyenne de la population (il
y a 6 échantillons qui donnent une moyenne de 3,5) que d’échantillons
éloignés de cette moyenne (il n’y a qu’un seul échantillon qui donne
une moyenne de 2 ou une moyenne de 6).
Ce phénomène est encore plus évident lorsqu’on distribue les valeurs
moyennes de chaque échantillon possible sur un graphique (figure 7.1).
On voit clairement que ces valeurs sont concentrées autour de la moyenne.
En fait, la distribution commence un peu à ressembler à une courbe
normale (la courbe en forme de cloche vue au chapitre 3). Nous pouvons
déjà affirmer que le premier anthropologue a beaucoup plus de chances,
en interrogeant 2 femmes au hasard de tomber sur un échantillon plus représentatif
que son collègue qui dispose d’un échantillon plus petit.
2.3. Une méthode rigoureuse
Grâce à la moyenne d’un échantillon, on peut obtenir une estimation assez précise de la moyenne de la population.
Plus l’échantillon sera grand, moins il sera probable que la moyenne
de cet échantillon s’écarte sensiblement de la moyenne de la population
(nous vous laissons le soin de le vérifier en exercice avec des échantillons
de 3 éléments). Évidemment, la situation que nous avons présentée
est volontairement simplifiée. En pratique, les échantillons doivent
contenir au moins une trentaine d’éléments pour que leurs moyennes
suivent la distribution de la courbe normale. On pourra alors utiliser
les propriétés de la loi normale pour évaluer le degré de fiabilité
de l’échantillon, en déclarant, par exemple, qu’il y a une probabilité
de 95 % que les résultats fournis par l’échantillon du tableau 7.2
vu au début de cette section (les élections du Bloc québécois) ne
s’écartent pas de plus de 3 % de ce qu’on aurait obtenu en observant
toute la population.
Nous verrons au prochain chapitre comment mesurer précisément ces
marges d’erreur lorsqu’on cherche à estimer les caractéristiques
d’une population à partir d’un simple échantillon. Notre propos était
seulement ici de montrer qu’avec un échantillon raisonnablement élevé,
il était relativement facile de sonder, avec un degré raisonnable
de certitude, une population inconnue.
Pour conclure, mentionnons une douloureuse expérience de jeunesse.
Notre grand-frère, bien que peu studieux à l’école, avait saisi très
vite tout l’intérêt des méthodes quantitatives. Tous les samedis,
il nous conviait à jouer notre argent de poche aux dés. Avant de lancer
les deux dés, qu’il avait « empruntés » au jeu de Monopoly des voisins,
il nous encourageait à choisir le 12 (chiffre prestigieux), tandis
qu’il se contentait du 7 (chiffre malchanceux). Nous ignorions alors
que le 7 (moyenne de 3,5 par dé) sort 6 fois plus souvent que le 12
(moyenne de 6 par dé). Il suffit de revoir le tableau 7.3 (ou la figure
7.1) pour s’en convaincre.
Nous espérons une fois de plus que vous utiliserez les connaissances
acquises dans ce manuel à bon escient, c’est-à-dire en luttant contre
les tricheurs. Nous déclinons d’avance toute responsabilité quant
aux tentatives d’extorsion de fonds inspirées par la lecture de cette
section de chapitre.
EXERCICES 2
1. Le quatrième anthropologue
En vous inspirant du tableau 7.3 et de la figure 7.1, faites la liste
de tous les échantillons de 3 éléments. Chaque échantillon doit comporter
3 personnes différentes, peu importe le sexe. Calculez le nombre moyen
d’enfants de chaque échantillon et tracez-en la distribution sur un
graphique.
2. Alea jacta est!
Pour cet exercice, vous devez utiliser deux dés (obtenus par des moyens
honnêtes). Si vous n’avez qu’un seul dé, vous pouvez le lancer deux
fois (pas fou, n’est-ce pas?). Pour rendre l’exercice plus intéressant,
vous pouvez travailler en équipe de deux personnes.
a) Lancez 6 fois les dés, et notez chaque fois la moyenne (de la
valeur des deux dés) obtenue. Quand vous avez fini, tracez une courbe
de distribution du même genre que celle de la figure 7.1.
b) Même chose en lançant les dés 36 fois.
c) Même chose en lançant les dés 216 fois.
d) Comparez les trois courbes de distribution et commentez.
3. LE SONDAGE ET SES LIMITES
Le sondage, qui consiste à estimer les caractéristiques d’une population
par l’observation d’un échantillon, n’est pas une méthode d’enquête
parfaite (demandez au mari d’Agrippine ce qu’il en pense). Le sondage
peut donner lieu à des erreurs d’estimation plus ou moins grandes.
Ces erreurs sont de deux types. Il se peut tout d’abord que, malgré
toutes les précautions prises, le hasard fasse que l’échantillon observé
ne soit vraiment pas représentatif de la population. Ce type d’erreur
est facile à évaluer, à l’aide de calculs relativement simples (nous
expliquerons comment procéder à ces calculs dans le prochain chapitre). D’autres
erreurs, par contre, ne peuvent être mises sur le dos du hasard : il
s’agit d’erreurs de méthodes contre lesquelles les plus savantes formules
mathématiques ne peuvent rien.
Avant de faire l’inventaire des principales erreurs à éviter, nous
parlerons de deux moyens d’améliorer à peu de frais la fiabilité de
l’échantillon : la méthode des grappes et la stratification.
3.1. L’échantillonnage par grappes : pour que le sondage porte fruit
Une grappe est un sous-groupe de la population défini
selon la proximité géographique. L’échantillonnage par grappes
consiste à choisir des grappes au hasard et à inclure dans l’échantillon
un certain nombre de membres de chaque grappe choisie.
Lorsque l’envergure de l’enquête exige l’observation d’un grand échantillon,
on a souvent recours à une astuce pour diminuer les coûts. Au lieu
de tirer chaque élément de l’échantillon de façon individuelle, on
fonctionne par grappes. Supposons qu’on ait décidé de choisir
au hasard un échantillon de 1000 ménages. Qu’est-ce qui vous paraît
le plus fiable : choisir au hasard les 1000 logements où résident ces
ménages dans 100 immeubles (ou 100 pâtés de maisons) de 10 logements
chacun, ou choisir au hasard ces 1000 logements à travers toute la
ville? La première option présente un risque de distorsion plus grand,
car les habitants d’un même immeuble ou d’un même quartier possèdent
souvent des affinités qui n’ont rien à voir avec le hasard. Par contre,
la seconde option, à cause du grand nombre de déplacements, est plus
onéreuse. Le véritable choix, compte tenu des coûts, pourrait bien
être le suivant : 1000 ménages (pris dans 100 immeubles de 10 logements
chacun) ou bien 200 ménages (pris dans 200 logements éparpillés au
hasard)? Lorsqu’on a l’intention de regarder à la loupe certaines
caractéristiques plus ou moins rares de la population, il est essentiel
de travailler sur un échantillon suffisamment grand. Dans ce cas,
l’échantillonnage par grappes peut s’avérer plus fiable sans
coûter plus cher.
Comment améliorer à peu de frais la fiabilité de l’échantillon.
L’échantillonnage par grappes n’est possible que lorsque la population
étudiée se présente sous forme d’une hiérarchie (par exemple : pays,
régions, villes, immeubles, ménages, individus). Lorsque cette condition
est remplie, l’échantillonnage par grappes (qui permet dans le même
temps ou pour le même coût d’interroger plus de monde) peut s’avérer
plus représentatif qu’un échantillonnage purement probabiliste. C’est
pourquoi Statistique Canada utilise cette méthode pour calculer les
taux de chômage.
Un exemple d’échantillonnage par grappes : le sondage sur le
chômage.
L’enquête sur l’emploi, qui se fait en effet par sondage et non en
dépouillant la paperasse de l’Assurance-emploi, doit être à la fois
peu coûteuse (l’enquête est répétée chaque mois) et très fiable
(les taux de chômage régionaux sont utilisés notamment pour calculer
les prestations versées). Étant donné que la personne choisie dans
l’échantillon doit être interviewée en personne au moins une fois,
le coût et le temps de déplacement deviennent alors une contrainte
importante. La méthode de l’échantillonnage par grappes permet de
sonder rapidement un échantillon suffisamment grand (environ 62 000 ménages en tout dans les dix provinces canadiennes) pour pouvoir le
découper ensuite par région.
La situation d’un individu sur le marché du travail peut être rangée
dans une des trois catégories suivantes : chômeur, occupé à un emploi,
inactif. Ces trois catégories sont exclusives (on ne peut faire partie
de plus d’une catégorie à la fois) et exhaustives (on fait nécessairement
partie d’une de ces catégories) : on reconnaît là les caractéristiques
d’une échelle nominale. Le concept de chômeur est simple, mais la réalité
l’est moins, c’est pourquoi les catégories sont définies de façon
rigoureuse (voir la figure 7.2). Il ne servirait à rien de faire de
savants calculs si la notion de chômeur variait chaque mois ou dans
chaque région, ou selon l’enquêteur. Compte tenu de ces définitions,
certaines personnes sont exclues, en toute logique, de la population
observée (les personnes de moins de 15 ans, par exemple, ne devraient
pas se trouver sur le marché du travail). D’autres personnes ont été
exclues pour des raisons pratiques : les gens vivant dans les Territoires,
par exemple, sont trop éparpillés pour qu’on puisse les rejoindre
si souvent.
Le poids d’échantillonnage est le nombre de sujets de la population représentés par chaque sujet de l’échantillon.
Le Canada compte, au moment de l’enquête en 1994, environ 23 millions
de personnes âgées de 15 ans et plus. On peut en déduire, que chacune
des 62 000 personnes de l’échantillon interrogé représente approximativement
370 personnes dans la population. Ce rapport s’appelle le poids
d’échantillonnage.
Poids d’échantillonnage = Taille de la population/Taille de l’échantillon
Poids d’échantillonnage au Canada = 23 millions/62 000 ≈ 370.
Ce poids d’échantillonnage varie d’ailleurs d’une province à l’autre.
Au Québec et en Ontario, chaque personne sondée représente environ
400 individus dans la population. Dans une province comme Terre-Neuve,
où la population est plus faible et plus dispersée, le poids d’échantillonnage
est d’environ 200 (toutes proportions gardées, on interroge deux fois
plus de monde qu’au Québec). La population de 15 ans et plus étant
de 5 730 000 personnes au Québec (en 1994), on peut en déduire que
l’échantillon interrogé au Québec compte environ 14 000 sujets.
Taille de l’échantillon = Taille de la population/Poids d’échantillonnage
Taille de l’échantillon au Québec = 5 730 000/environ 400 ≈ 14 000.
Cet échantillon est suffisant pour que la marge d’erreur soit faible,
même au niveau régional.
3.2. La stratification : une garantie supplémentaire
Mettre toutes les chances de son côté en raffinant l’échantillon.
La stratification, dont nous avons parlé dans la première section
à propos de l’enquête sur la famille et les amis, permet d’éliminer
des échantillons aberrants. Sans stratification, il se pourrait, par
hasard, qu’un échantillon de Canadiens ne contienne aucun Québécois. En outre, la stratification rend plus fiables les estimations par catégorie lorsque ces catégories
correspondent aux strates choisies.
Comment vérifier, après coup, la représentativité de l’échantillon?
Supposons qu’après avoir dépouillé les réponses données à un sondage
on constate deux choses : d’une part, 44 % des Québécois(e)s âgés de
20 à 64 ans estiment avoir un poids excessif et d’autre part, 60 %
des personnes ayant répondu au sondage sont des femmes. Le fait que
les femmes soient surreprésentées dans l’échantillon observé peut
sûrement fausser les résultats, car il y a relativement plus de femmes
que d’hommes qui croient avoir un poids excessif, même si cette perception
n’est pas conforme à la réalité.
Des résultats valables avec un échantillon boiteux.
Dans un cas comme celui-ci, il est relativement facile de rectifier
les résultats, car nous connaissons, grâce au recensement, la répartition
des sexes dans la population. Il suffit alors de pondérer les résultats
de chaque catégorie en fonction de cette répartition. Sachant, d’une
part, après avoir à nouveau observé les questionnaires dépouillés
que 38 % des hommes et 48 % des femmes estiment avoir un poids excessif,
et, d’autre part, que les hommes et les femmes représentent chacun
50 % de la population de 20 à 64 ans*, on peut en déduire que la proportion de personnes qui estiment avoir un poids excessif est en réalité de 43 %, et non
de 44 %.
Résultat corrigé = (Score de la catégorie 1 × Poids de
la catégorie 1) + (Score 2 × Poids 2) + …
Résultat corrigé = (48 × 0,5) + (38 × 0,5) = 43.
Somme toute, l’écart entre le résultat initial et le résultat corrigé
n’est pas très grand : cela est dû au fait que notre échantillon est
quand même relativement représentatif et que les différences entre
les perceptions des hommes et des femmes ne sont pas énormes.
3.3. Prévoir les erreurs possibles
Examinons à nouveau l’enquête sur la famille et les amis pour faire
l’inventaire des biais ou erreurs possibles, autres que ceux qui
seraient dues au hasard.
L’erreur de couverture provient de la différence entre
la population cible et la population observée.
Parler ici des méthodes par téléphone et par internet.
Dans cette enquête, comme cela est souvent le cas, on exclut, pour
des raisons de coût, ceux qui n’ont pas le téléphone. Ça fait peu
de monde en apparence (donc le biais devrait être faible), mais dans
certains cas, il y a une relation entre les questions et les groupes
exclus. Par exemple, ceux qui n’ont pas le téléphone ont de bonnes
raisons de ne pas appeler aussi souvent leur grand-mère (voir le tableau
7.4). Dans un cas comme celui-ci, le biais auquel on doit se résigner
serait alors plus grand. Par contre, on peut remarquer que dans le
tableau 7.4, les gens qui vivent avec leurs grands-parents ont été
éliminés de la population observée. Étant donné que ces gens communiquent
rarement par lettre, voilà une précaution qui s’avère à la fois peu
coûteuse et fort utile.
Les gens vivant en institution ont été exclus de l’échantillon. Cela
est dû à une raison pratique : rappelez-vous, on choisissait, dans
chaque foyer appelé, une personne au hasard. Cette méthode peut causer
un certain biais dans les questions touchant les personnes âgées.
On peut d’ailleurs avoir une idée du biais en sachant que 9 % des
personnes de 65 ans et plus vivent en institution, ce qui n’est pas
négligeable, mais qui n’est pas énorme non plus.
Les refus de répondre amoindrissent la représentativité de
l’échantillon.
Les refus de répondre ne sont pas le résultat du hasard : ceux qui
refusent de répondre correspondent à un groupe particulier (par rapport
au sujet étudié). C’est pourquoi on lutte toujours contre les refus
de répondre qui amoindrissent la valeur des résultats.
Les personnes qui ne donnent pas de réponse dans l’enquête sur la
famille diffèrent peut-être du reste de l’échantillon : 14 % des
non-réponses proviennent du ménage et les 10 % restant proviennent de l’individu. Le taux de réponse global est assez bon dans
les circonstances, mais il faut aussi tenir compte des non-réponses
à certaines questions, ou d’une mauvaise compréhension des questions, ou de l’influence
de certaines réponses sur d’autres réponses.
Tout était beau sur papier, mais…
Imaginez que la base de sondage (annuaire téléphonique ou fichier
administratif contenant la liste d’une population) soit incomplète,
fausse, désuète, difficile à consulter. On a de la difficulté à rejoindre
les gens choisis.
Le degré de précision ne correspond pas à ce qu’on attend. Au cours
de l’enquête, on a eu des problèmes avec l’échantillon (erreurs, refus
de répondre, abandons en cours de route, remaniement de l’équipe de
chercheurs) et la marge d’erreur est devenue trop grande par rapport
à ce qu’on s’était fixé au départ.
Certaines personnes comprennent mal les questions. D’autres sont intimidés
par des questions qu’ils jugent trop personnelles. Certains ne savent
pas vraiment quoi répondre. D’autres enjolivent la réalité ou se contredisent.
On le voit, les embûches qui peuvent surgir lors de l’administration
d’un sondage sont nombreuses, c’est pourquoi il faut bien prévoir
les coups.
EXERCICES 3
1. La grappe
L’enquête sur la population active, basée sur un échantillon de 14 000 personnes au Québec, indique que la population gaspésienne de
15 ans et plus est, en 1994, de 83 700 individus (pour 5 730 000 au
Québec). On suppose d’autre part que le poids d’échantillonnage est
de 400 dans toutes les régions du Québec.
a) Quelle est la proportion de Québécois de 15 ans et plus résidant
en Gaspésie?
b) Utilisez la proportion calculée en a pour déterminer approximativement
la taille de l’échantillon interrogé en Gaspésie.
c) Utilisez le poids d’échantillonnage pour déterminer approximativement
la taille de l’échantillon interrogé en Gaspésie.
2. Comment obtenir de bons résultats avec un mauvais échantillon
Un sondage révèle que les non-francophones s’apprêtent à voter « non »
à 90 % et que les francophones s’apprêtent à voter « oui » à 65 %. On
constate également que l’échantillon observé comporte 40 % de non-francophones
(données fictives).
a) D’après vous, est-ce que le « oui » a des chances de passer? Justifiez votre réponse
avec des chiffres.
b) On s’aperçoit soudain que l’échantillon n’est pas vraiment représentatif car, d’après le dernier recensement, les non-francophones représentent
20 % de la population en âge de voter). Compte tenu de ce nouveau
fait, y a-t-il encore moyen de faire une prévision sérieuse avec ce
sondage? Si oui, que prévoyez-vous faire?
3. Qu’est-ce qu’un chômeur?
Selon une enquête de Statistique Canada, le Québec comptait, en
1956, 1 535 000 personnes occupées et 80 000 chômeurs sur une population
totale de 4 628 000 individus. Quelle était alors la proportion de
chômeurs dans la population active (ou taux de chômage)?
4. DES SONDAGES À TOUTES LES SAUCES
On associe souvent les sondages aux campagnes électorales. Mais si
ce genre d’enquête constitue le moyen privilégié de sonder les cœurs,
il peut s’appliquer à d’autres domaines. On peut sonder l’opinion
des gens (caractéristiques subjectives), mais aussi leur état de santé
(caractéristiques objectives), ou encore leur comportement et les conséquences
de leur comportement. Les trois exemples que nous vous proposons maintenant
correspondent à ces trois types de sujets d’enquête.
4.1. L’opinion des gens (vis-à-vis d’eux-mêmes et vis-à-vis des autres)
Qu’est-ce qu’un politicien? Un politicien est une personne
qui est capable de discourir avec facilité sur n’importe quel sujet.
Qu’est-ce qu’un homme d’État? Un homme d’État est une personne qui
est capable de se taire.
Juger les autres et les catégoriser constituent des activités préférées
des êtres humains en quête de sécurité intellectuelle et affective.
C’est pourquoi les sondages d’opinion, comme celui du tableau 7.5, sont
toujours populaires. Si on se fie au sondage, on doit admettre que
les politiciens n’ont pas la cote. Et vous, que pensez-vous des résultats?
Signifient-ils que les gens font plutôt confiance à ceux qu’ils considèrent
comme plus savants qu’eux?
4.2. L’état des gens
Le cas suivant diffère du précédent à plusieurs égards. On y observe
en effet quelque chose d’objectif (le poids des Canadiens et Canadiennes),
et on utilise les grands moyens (l’échantillon est grand, les variables
nombreuses et soigneusement définies). Ce type d’enquête est donc
relativement coûteux. Le tableau 7.6 montre que l’excès (ou l’insuffisance)
de poids varie avec le lieu de résidence, l’âge,
le sexe et le niveau de revenu.
Les deux dernières lignes du tableau 7.6 concernent non plus des caractéristiques
objectives, mais des opinions (subjectives). Les résultats illustrent
l’écart qui existe parfois entre une réalité et la perception qu’on
se fait de cette réalité.
4.3. Le comportement des gens
Deux personnes en état d’ébriété avancée rentrent chez elles en auto.
« Fais donc un peu plus attention, dit le passager, tu as failli nous
envoyer dans le fossé. — Ah bon? répond le chauffeur, je croyais que
c’était toi qui conduisais. »
Le tableau 7.7 montre qu’environ une personne sur 8 conduit parfois
avec un verre de trop dans le nez. Par ailleurs, l’âge et le niveau
de revenu semblent avoir une influence sur ce comportement. Les résultats
doivent cependant être interprétés avec prudence, car pour conduire
en état d’ébriété, il est indispensable d’avoir une voiture à sa disposition,
ce qui n’est pas donné à tout le monde. Si, par contre, les gens les
plus riches sont les plus délinquants, est-ce parce qu’ils ont moins
peur des contraventions? Est-ce parce qu’ils ont plus d’automobiles?
Est-ce parce qu’ils boivent plus que les autres? Voilà encore une
fois un bon sujet de recherche.
EXERCICES 4
1. Ce qu’on peut sonder
Donnez des exemples d’enquêtes qui porteraient sur chacun des types
de sujets suivants : l’opinion des gens, l’état des gens, le comportement
des gens, les conséquences d’un comportement.
(Utilisez les données du tableau 7.6 pour répondre aux questions.)
a) Identifiez les variables étudiées.
b) L’excès de poids selon le sexe : commentez les écarts entre la réalité
observée et la perception que se font les hommes et les femmes de
cette réalité.
c) D’après vous, de quelle catégorie faites-vous partie : poids sous
la normale, poids recommandé ou poids excessif?
d) Calculez votre IMC (en divisant votre poids en kilogrammes par le carré
de votre taille en mètres). Comparez le résultat à votre perception telle
que spécifiée dans la question c.
EXERCICES SUPPLÉMENTAIRES
1. Non représentatifs
Dans chacun des cas suivants, quels sont les défauts des échantillons?
a) Les douanes américaines décident d’ouvrir toutes les boîtes de
thon du Nouveau-Brunswick pour vérifier si elles sont avariées.
b) Un laboratoire prélève 20 échantillons du sang d’un chauffard pour
déterminer s’il est en état d’ébriété.
c) Le bureau national de statistiques profite du recensement pour
calculer le nombre de chômeurs.
d) Un institut de sondage interroge 30 000 citoyens pour connaître
leurs intentions de vote.
e) Allô! Êtes-vous un itinérant?
2. Stratifions
Dans chacun des cas suivants, dites quelles précautions on doit prendre
pour s’assurer de la représentativité de l’échantillon.
a) Allô! Êtes-vous d’avis que le Canada demeure une monarchie?
b) Allô! Aimez-vous la musique Heavy Metal?
c) Allô! Pensez-vous que le geste du Premier ministre du Canada, qui a saisi
Bill Clennet à la gorge le 15 février 1996, est « acceptable dans les
circonstances »?
d) Allô! Pensez-vous que les tribunaux devraient être plus sévères
dans le cas des pensions alimentaires?
3. Le taux de réponse
Un sondage de la Sofres indique que 39 % des Français pensent qu’il
faut restreindre le droit de grève dans les services publics. Si on
y regarde de plus près, on s’aperçoit que 56 % des sympathisants de
la droite endossent ce point de vue contre seulement 23 % des sympathisants
de la gauche. Le sondage a été effectué entre le 26 et le 28 décembre
1994 auprès d’un échantillon national représentatif de la population
française âgée de 18 ans et plus; les personnes ont été interrogées à leur
domicile. (Source : Le Figaro, 27 février 1995)
a) Expliquez pourquoi il est intéressant d’utiliser un échantillon
stratifié dans une telle enquête.
b) En supposant que 1024 personnes aient accepté de répondre et que
312 aient refusé ou n’aient pas pu être rejointes, quel est le taux de
réponse de l’échantillon?
c) En supposant que le taux de réponse est de 76,6 % et que 1336 personnes
ont été approchées, quel est le nombre de personnes qui ont refusé
de répondre?
4. La moyenne des échantillons
Quatre anthropologues possèdent respectivement 1, 4, 5 et 6 crânes
de l’homme de Neandertal.
a) Quel est le nombre moyen de crânes possédé par un anthropologue?
b) En vous inspirant du tableau 7.3 et de la figure 7.1, faites la liste de tous les échantillons de 2 éléments. Calculez
le nombre moyen de crânes de chaque échantillon et tracez-en la distribution
sur un graphique.
5. Médor ou Minou
Les êtres humains aiment parfois s’entourer d’animaux de compagnie.
Un journal vous commande un sondage pour faire un portrait de la
situation au Québec et vous demande de faire quelques suggestions
sur les variables à mesurer. Ces variables, qui peuvent porter sur
le comportement des gens face aux animaux de compagnie ou sur les
caractéristiques de ces gens, doivent susciter l’intérêt des lecteurs
du journal.
a) Trouvez quelques variables concernant le comportement
des gens face aux animaux de compagnie. Si les échelles des variables
sont nominales, identifiez leurs catégories.
b) Trouvez quelques variables concernant les caractéristiques
des gens qui ont des animaux de compagnie, ou qui n’en ont pas. Si les échelles
des variables sont nominales, identifiez leurs catégories.
c) Vous devez sélectionner un échantillon stratifié et tenir compte des variables choisies. Parmi les caractéristiques suivantes, indiquez celles de la population sondée que l’échantillon devrait
absolument refléter : sexe, âge, langue maternelle, religion, niveau
de revenu, type d’habitat (ville, campagne), région de résidence,
orientation politique, poids, niveau de scolarité, état civil.
Note : Dans ce genre de remue-méninges, une bonne façon de trouver des idées consiste à faire appel aux préjugés courants : les grands-mères et les jeunes filles préfèrent les chats, les cultivateurs et les gens de droite préfèrent les chiens, etc. Il sera toujours temps d’infirmer — ou de confirmer — ces préjugés en examinant les résultats du sondage.
6. Le Québec n’a pas la cote… au Canada
En 1996, alors que 500 000 « cousins » français envahissent le Québec comme chaque été, cette destination semble avoir perdu la cote auprès des « frères »
canadiens, suite à un référendum très serré sur la question nationale. Un sondage effectué par le CAA indique que les destinations
préférées des Canadiens sont, dans l’ordre, la Nouvelle-Écosse, l’Ontario,
la Colombie-Britannique, la Floride, l’Alberta, la Caroline du Sud,
le Massachusetts, l’État de New York, la Californie et… le Québec.
Un second sondage classe, outremer, l’Angleterre première, suivie de la France,
de l’Écosse et de l’Allemagne. (Source :La Presse, 20 juillet 1996)
a) Quelles sont les deux variables dont il est question dans ce sondage?
b) À quelle échelle appartiennent ces variables? Dites pourquoi
le choix de cette échelle est judicieux.
c) Que pensez-vous du fait que les résultats publiés dans La Presse
ne contiennent aucun chiffre?