On dit parfois qu’une image vaut mille mots. De la même façon, un
ou deux chiffres peuvent remplacer avantageusement plusieurs pages
de tableaux. Le tout est de bien choisir ces chiffres. Dans ce chapitre,
nous apprendrons justement à bien choisir et à bien interpréter ces
quelques chiffres, qui résument d’un coup d’œil, l’ensemble d’une
situation.
Avant de commencer, prenons un exemple tiré de l’hebdomadaire
économique polonais Gazeta Bankowa, peu après l’effondrement du mur de Berlin. Les Polonais se trouvent à l’étroit, et à juste titre : ils ne disposent,
en moyenne, que de 18 m² habitables par personne. C’est
encore moins que les Japonais (28 m² en moyenne) qui n’ont
pourtant pas la réputation d’occuper des logements spacieux. On voit
ici qu’un simple chiffre, même s’il ne dit pas tout (il doit y avoir
des Polonais plus à l’étroit que d’autres), nous dispense de consulter
la liste des 40 millions d’habitants de cette république d’Europe
de l’Est, si tant est qu’une telle liste existe. À titre de comparaison,
l’Américain moyen dispose alors de 62 m² de surface habitable
et l’Européen de l’Ouest de 37 m² en moyenne.
Comme on le dit vulgairement, les Américains se « pilent » moins sur
les pieds que les Polonais. Il faut cependant faire quelques nuances.
Même si l’Amérique est grande, tous les Américains ne logent pas à
Beverly Hills. Il doit y avoir des écarts en fonction notamment du
milieu social. Les disparités entre les gens sont encore plus élevées
en Europe de l’Ouest, du moins en termes relatifs. Même si la moyenne
d’espace de logement occupé par ces derniers est de 37 m²
par habitant, la plupart des Européens de l’Ouest ont soit beaucoup
plus, soit beaucoup moins. Les plus favorisés sont les gens de la
campagne, ceux qui vivent dans des maisons de banlieue, ceux qui possèdent
une résidence secondaire et plus généralement les personnes fortunées.
Dans ce chapitre, nous verrons aussi comment évaluer rapidement l’importance
de ces écarts autour de la moyenne.
Nous en profiterons également pour établir la position d’un individu
à l’intérieur d’un groupe. Où se situe par exemple l’Américain qui
occupe 100 m² de surface habitable? Fait-il partie
de l’élite? Est-il dans les 10 % meilleurs? Dans les 40 %? Fait-il
partie de la moitié la moins bien lotie de la population? Toutes ces
situations étant possibles (même si la moyenne générale du pays est
de 62 m²), il est parfois bon de connaître non seulement
la moyenne, mais de posséder également des informations sur les écarts entre les éléments
du groupe, ainsi que sur la position d’un élément particulier.
Au terme de ce chapitre, vous devriez être en mesure de répondre aux questions suivantes :
L’individu « moyen » est-il celui qu’on risque le plus de rencontrer dans le groupe qui est le sien?
Quel est le rapport entre la moyenne et les données qu’elle veut résumer?
Comment peut-on situer une valeur (et le sujet qu’elle désigne) par rapport à la moyenne? Par rapport aux autres valeurs du même groupe?
Comment les autres mesures comme la médiane, le mode ou les quintiles peuvent-elles nous être utiles à rendre la moyenne plus signifiante?
1. LA MOYENNE : UN ÉQUILIBRE DES FORCES
Tout le monde a entendu parler des moyennes. Tout le monde s’en sert.
Comme on pouvait s’y attendre, notre but principal consiste davantage à bien interpréter
les moyennes qui nous sont servies régulièrement dans les livres et
les journaux que de nous livrer à de savants calculs. Cependant,
nous ne sommes pas toujours de simples récepteurs d’information : nous
avons parfois nous aussi quelque chose à dire. C’est pourquoi nous
verrons comment bien choisir et bien calculer les moyennes. Comme
toujours, nous prendrons nos exemples dans la réalité, car l’humanité
a ceci de particulier : mieux on la connaît et plus on la trouve intéressante.
1.1. Le jour J : des péniches et des hommes
Jour J. Le 6 juin 1944. 745 navires, groupés en 38 convois, approchent
des côtes normandes. En tout, 4006 péniches de débarquement sont mises
à l’eau, au large des plages, et 185 000 hommes débarquent sur le
territoire français. Regardons les choses à une échelle un peu plus
humaine : combien d’hommes y avait-il en moyenne sur chaque péniche
de débarquement? Essayez d’imaginer la réponse sans faire de calcul,
mais plutôt en visualisant ces péniches. Et rappelez-vous qu’il
ne s’agit pas d’un film hollywoodien, mais bien d’une histoire vécue par des jeunes gens tels que vous.
La moyenne est une mesure qui correspond à la somme des
valeurs que prend une variable divisée par le nombre de ces valeurs.
Notons que la variable que l’on cherche à évaluer ici est la capacité,
en nombre d’hommes, des péniches de débarquement. Nous ne disposons
pas de la liste des péniches avec leur nombre respectif de passagers,
mais nous connaissons le nombre de péniches et le total des passagers.
Chaque péniche peut être associée à une valeur (le nombre d’hommes qu’elle contient). Le nombre des valeurs (le nombre de péniches) et la somme des valeurs (le nombre total de passagers) nous suffisent pour obtenir la moyenne
des individus présents dans les péniches.
185 000 hommes/4006 péniches = 46 hommes en moyenne par péniche
Moyenne = Somme des valeurs/Nombre de valeurs
Les péniches de débarquement contenaient donc en moyenne 46 hommes
chacun. Nous vous demandions plus haut d’essayer de visualiser ce
résultat avant de le calculer. Si votre intuition correspondait au
résultat, félicitations. Si vous aviez imaginé des péniches avec beaucoup
moins d’hommes, ou beaucoup plus (nous sommes dans ce cas), cela prouve
qu’il n’est pas toujours inutile de faire un petit calcul lorsque
l’on veut avoir une idée objective de la réalité.
C’est donc dire que la plupart des péniches contenaient 46
hommes?
La moyenne ne prétend pas que tous soient égaux (il y aurait alors
eu 46 hommes dans chaque péniche). Elle ne fait que nous dire quelle
valeur aurait eu chacune des données si celles-ci avaient été toutes
pareilles. Cela dit, rien ne prouve que la plupart des péniches contenaient
46 hommes. Certaines étaient peut-être très petites, d’autres très
grandes. L’exemple qui suit nous démontrera que la moyenne est une
valeur autour de laquelle les autres se situent et qu’elle
n’est pas nécessairement celle qu’on retrouve le plus souvent.
1.2. César et ses Romains
Jules César, malgré ses nombreuses conquêtes, son immense talent et
tous ses autres mérites, n’a jamais réussi à se faire couronner empereur.
Sa carrière tardive fut brusquement interrompue lors d’une visite
au Sénat, le 15 mars de l’année 44 avant notre ère. Le Sénat de l’époque
était plus fringant que le nôtre! Auguste, fils adoptif de César
(et son vrai fils selon les mauvaises langues) devait cependant fonder
une dynastie qui dura près d’un siècle. Pour consoler les étudiants qui
traînent encore dans les classes malgré leur âge avancé, signalons
que Jules César n’a véritablement amorcé sa carrière qu’à 40 ans,
après avoir réalisé de façon dramatique « qu’il n’avait encore rien
fait de mémorable à un âge où Alexandre (le Grand) avait déjà soumis
toute la terre ».
Si César et Auguste furent de grands hommes d’État (dont l’héritage
est toujours vivant), on ne peut pas en dire autant de ceux qui leur
ont succédé. Tous furent célèbres pour leurs débauches et leurs excès.
Selon Suétone (l’auteur de la Vie des douze Césars), Tibère
s’était fait installer un « jardin des plaisirs* » dans sa retraite de Caprée. Caligula, son successeur — et sans
doute son meurtrier —, entretenait des relations incestueuses avec ses
sœurs. Caligula nomma même son cheval sénateur (notez l’évolution
du Sénat avec le temps). Il fut assassiné, tout comme ses successeurs
Claude (homme plutôt lâche et influençable) et Néron (qui se prenait
pour une grande vedette).
Les présentations étant faites, revenons à nos chiffres. À quel
âge, en moyenne, devenait-on empereur sous les Césars? Combien de
temps restait-on sur le trône? À quel âge mourait-on?
Pour calculer ces moyennes, nous utiliserons la même formule que dans
le cas précédent.
La seule différence ici est que nous devons calculer nous-mêmes
la somme (à l’aide des données du tableau 3.1 figurant ci-après).
Âge moyen au début du règne : (39 + 55 + 25 + 50 + 17)/5 = 37,2 ans
Durée moyenne du règne : (37 + 23 + 4 + 13 + 14)/5 = 18,2 ans
Âge moyen du décès : (76 + 78 + 29 + 63 + 31) = 55,4 ans
Il faut reconnaître qu’une bonne compréhension des échelles de mesure s’avère ici fort utile. Puisque les données figurant dans les trois premières colonnes du tableau appartiennent à une échelle d’intervalle, il était évidemment impossible d’en tirer des moyennes. Par contre, les trois dernières colonnes du tableau — que nous avons déduites des trois premières — appartiennent à une échelle de rapport. C’est pourquoi nous avons été en mesure de calculer les trois moyennes correspondantes.
Voici maintenant la preuve que les méthodes quantitatives requièrent avant tout un esprit méthodique plutôt que des connaissances poussées en mathématiques. Pour calculer les valeurs des trois dernières colonnes du tableau, nous avons dû tenir compte du fait que la vie et le règne de certains empereurs chevauchaient le premier millénaire avant Jésus-Christ et le premier millénaire après Jésus-Christ (il va de soi que les Romains utilisaient une échelle d’intervalle dont le point de départ était différent). Or, le premier millénaire après Jésus-Christ a de toute évidence commencé en l’an 1* et non en l’an 0, qui n’a d’ailleurs jamais existé. Ainsi, pour calculer la durée du règne d’Auguste, nous ne pouvons pas simplement additionner 24 (années avant J.-C.) et 14 (années après J.-C.). En réalité, il s’est écoulé 37 ans — et non 38 — entre l’an –24 et l’an 14.
Notons que le problème aurait été évité si nous avions utilisé le calendrier romain, qui part de la fondation de Rome (l’an 753 av. J.-C. correspondant à l’an 1 de l’ère romaine). Selon le calendrier romain, Auguste devint empereur en 730 et mourut en 767, ce qui donne bien 37 ans de règne : ouf, le compte est bon!
Cela dit, une telle erreur de méthode ne porterait pas tellement à conséquence ici, puisque nous utilisons des chiffres arrondis à l’année près (les dates considérées peuvent se situer entre le 1er janvier et le 31 décembre d’une année), et que le phénomène étudié n’exige pas un degré de précision extrême. Par contre, dans d’autres circonstances (dossier criminel, médical ou bancaire), une erreur de ce genre serait inacceptable. Il est donc important de bien porter attention au point de départ de l’échelle lorsque celle-ci est une échelle d’intervalle.
1.3. La moyenne et les fréquences
Combien d’individus compte, en moyenne, un ménage montréalais? Il
n’y eut que 5 empereurs dans la dynastie des Césars, mais on a dénombré
756 000 ménages dans la communauté urbaine de Montréal en 1993. Le
principe de la moyenne demeure toujours le même (la somme des valeurs
divisée par le nombre de valeurs), mais la masse imposante des données
nous oblige ici à trouver une méthode plus efficace.
On ne va quand même pas additionner la valeur (en nombre
de personnes) des 756 000 ménages et diviser par 756 000 pour connaître
la moyenne!
Dans le tableau 3.2 ci-après (tiré d’un exemple du chapitre précédent),
la variable est la taille du ménage. Cette variable peut prendre
diverses valeurs déterminées par le nombre d’individus par ménage
(colonne 1). Étant donné que les ménages de plus de 4 personnes sont
rares, notre tableau met dans le même paquet tous les ménages comptant
4 personnes et plus. Pour simplifier, nous estimerons que les ménages
de 4 personnes et plus comptent en moyenne 4,5 personnes. La colonne
2 contient le nombre de ménages dénombrés (la fréquence, en milliers)
pour chaque valeur possible. La colonne 3 reprend la colonne 2 sous
forme de proportions (les fréquences relatives).
Pour obtenir la moyenne, nous pourrions aligner 756 chiffres (255
chiffres 1, suivis de 243 chiffres 2, etc.), les additionner et diviser
le tout par 756. Nous pourrions encore, ce qui reviendrait au même,
effectuer l’opération suivante :
On notera que nous avons attribué, comme convenu, 4,5 personnes aux 140 ménages de 4 personnes et plus. On constatera également que
la somme des fréquences (255 + 243 + 118 + 140) est égale au dénominateur
(756). En fin de compte, le ménage montréalais moyen compte 2,28 individus.
Moyenne = [(Fréquence 1 × Valeur 1) + (Fréquence 2 x Valeur 2) + …]/Fréquence totale
Cette manière de calculer la moyenne n’est qu’une généralisation de
la formule précédente (dans laquelle les fréquences de chaque élément
sont toutes égales à 1). Avez-vous remarqué, par ailleurs, que les
chiffres du tableau 3.2 représentent en réalité des milliers
de ménages? Il y a en effet 756 000 ménages à Montréal et non 756.
Cette particularité ne change rien au résultat, puisque les proportions
restent les mêmes. C’est un peu comme si on mesurait le poids moyen
des poulets en kilogrammes plutôt qu’en grammes : ça ne rendrait pas
les poulets plus légers ni plus lourds.
1.4. La moyenne pondérée : des poids relatifs
Dans l’exemple qui précède (la taille moyenne des ménages), nous aurions
pu obtenir le même résultat en utilisant les fréquences relatives.
Ce qui compte, après tout, c’est de respecter les proportions de chaque
catégorie.
Si on utilise ces proportions sous leur forme décimale, le calcul
de la moyenne se fait de la façon suivante :
(0,337 × 1) + (0,321 × 2) + (0,156 × 3) + (0,186 × 4,5) = 2,28 personnes par ménage
Si on préfère utiliser les proportions sous forme de pourcentage,
il faudra diviser le résultat final par 100 pour obtenir la moyenne : n’oublions
pas que 100 % = 100/100 = 1.
[(33,7 × 1) + (32,1 × 2) + (15,6 × 3) + (18,5 × 4,5)]/100 = 2,28 personnes par ménage
Les fréquences relatives représentent le poids relatif (ou pondération)
de chaque composante. La somme de ces pondérations est bien sûr égale
à 100 % ou 1.
Lorsque les pondérations sont connues, il n’est même plus nécessaire
de connaître les diverses fréquences (ou effectifs) pour calculer
la moyenne.
Parfois, les pondérations sont déterminées à partir d’autres critères
que les fréquences. La moyenne des notes accumulées par un étudiant
dans un cours est souvent une moyenne pondérée : tel exercice peut
compter pour 10 % de la note finale, tel examen pour 30 %, etc. L’enseignant
peut fixer ces pondérations en fonction de l’importance qu’il accorde
personnellement à chaque évaluation, pourvu que la somme des pondérations
soit égale à 100 %.
1.5. Les limites de la moyenne
Peut-être avez-vous déjà entendu l’expression « la loi de la moyenne »
dans la bouche d’un mordu du casino : « Le numéro 13 n’est quasiment pas sorti hier. Aujourd’hui, il devrait se rattraper. J’en suis sûr, mon vieux, c’est la loi de la moyenne. Mise tout sur le 13! ».
Devant la majesté de la loi, l’homme n’a plus qu’à s’incliner, n’est-ce pas? C’est oublier que la moyenne est une mesure qui traduit la réalité, elle ne la commande pas. Le hasard n’a pas de mémoire, et la soi-disant « loi de la moyenne » n’est qu’une superstition héritée de nos croyances primitives.
Même si la moyenne est un concept relativement simple, il arrive parfois
qu’on l’utilise de façon abusive, et pas seulement pendant les parties
de roulette ou les performances sportives. C’est pourquoi nous allons mentionner quelques erreurs
typiques liées au calcul ou à l’utilisation des moyennes.
Erreur de calcul : la moyenne des moyennes
Alors que chaque Américain consomme en moyenne l’équivalent de 6794 kg de pétrole sous forme d’énergie diverse par an, le Mexicain n’en consomme
en moyenne que 1588 kg, et le Canadien, 7270 kg*. Quelle est la moyenne
d’énergie consommée en Amérique du Nord?
On ne peut additionner ici
les 3 chiffres et diviser le total par 3 (cela donnerait [6784 + 1588 + 7270]/3 = 5217 kg). Il faut tenir compte de la population
de chaque pays (314 millions pour les États-Unis, 121 millions pour
le Mexique et 35 millions pour le Canada, soit une population totale
de 470 millions).
Moyenne = [Consommation totale des États-Unis + Consommation totale du Mexique
+ Consommation totale du Canada]/Population totale de l’Amérique du Nord
Erreur d’utilisation
Il ne suffit pas de faire de bons calculs. Il faut encore que la moyenne
veuille dire quelque chose.
Saviez-vous que l’on parle 7 langues locales différentes en Italie : l’italien,
bien sûr, mais aussi l’occitan (dans le Piémont), le français (dans
le Val d’Aoste), l’allemand (dans le Tyrol), le frioulan (en Vénétie),
le slovène (en Vénétie aussi) et le sarde (en Sardaigne). Tout cela
sans compter les multiples dialectes de l’italien aux différences
beaucoup plus grandes qu’entre, par exemple, le français parlé au
Québec ou à Paris. Étant donné que l’Italie comptait 57,8 millions d’habitants
en 1992, on pourrait en déduire que chacune des 7 langues
parlées en Italie comptait en moyenne 8 257 000 locuteurs et des poussières
(soit 57,8/7).
Le résultat précédent ne présente non seulement aucun intérêt, mais
il est même trompeur. En réalité, 56 millions d’Italiens parlent l’italien
standard ou un de ses dialectes. Le reste (1,8 million) se partage
les 6 autres langues, soit en moyenne 0,3 million ou 300 000 individus
par langue (car 1,8/6 = 0,3). On peut donc dire que les langues
secondaires comptent en moyenne 300 000 locuteurs : ça au moins, c’est
une moyenne qui veut dire quelque chose.
Avant de faire une moyenne, il faut d’abord déterminer les éléments
qui devront être considérés. Des valeurs extrêmes viennent parfois
« fausser » des moyennes. Par contre, plus le nombre d’éléments est
grand et moins les éléments extrêmes risquent de brouiller les cartes.
De plus, en interprétant une moyenne, il faut savoir avec précision
qui y est inclus. Ainsi, la moyenne des notes d’un groupe d’étudiants
contient-elle uniquement les notes de ceux qui ont suivi le cours
jusqu’au bout? Les notes de ceux qui ont abandonné et de ceux qui
ne se sont jamais présentés au cours sont-elles incluses? Si oui, comment sont calculées
ces notes? Voilà bien des points à éclaircir avant de se lancer dans
de savantes comparaisons.
EXERCICES 1
1. 1. Le jour J
Le 6 juin 1944. 745 navires, groupés en 38 convois, approchent des
côtes normandes. En tout, 4006 péniches de débarquement sont mises
à l’eau, au large des plages, et 185 000 hommes débarquent sur le
territoire français. En même temps, 1087 avions de largage, protégés
par 13 175 avions de combat, lancent 18 000 parachutistes sur le territoire
normand. (Source : Livre Guinness des records, 1995.)
a) Combien y avait-il d’hommes, en moyenne, sur chaque navire?
b) Combien de navires comptaient les convois, en moyenne?
c) Combien y avait-il de parachutistes, en moyenne, dans chaque avion
de largage?
d) Chaque avion de largage était protégé par combien d’avions de combat,
en moyenne?
2. Si j’avais un char… ou un ordi
a) Dans le cahier automobile de la Presse de Montréal du 17 juillet
1995, six concessionnaires accompagnaient leur publicité du prix total
(au comptant) des véhicules proposés (tableau 3.3). Quel est le prix
moyen des véhicules proposés aux lecteurs de la Presse?
b) En 2011, année qui marque un premier apogée dans le marché des micro-ordinateurs, le nombre d’unités vendues dans le monde s’élevait à 355,2 millions, pour un chiffre d’affaires total de 329 milliards de $US. Aux États-Unis seulement, les données étaient respectivement de 95,4 millions d’unités et de 85,5 milliards de $US (source : Gartner).
Montrez que le prix moyen d’un micro-ordinateur était alors moins élevé aux États-Unis que dans le reste du monde.
3. La moyenne et les fréquences
a) À partir des chiffres du tableau 3.4, calculez le taux d’intérêt
moyen des banques canadiennes.
b) Calculez la moyenne des notes de chacun des étudiants du tableau
3.5 (chiffres fictifs).
2. L’ÉCART TYPE : MESURER LA DISPERSION DES DONNÉES
La moyenne est un outil pratique. En un seul chiffre, elle peut résumer
plusieurs dizaines, centaines, voire plusieurs millions de données.
Cependant, comme tout résumé, la moyenne néglige les détails. Souvent,
ces détails présentent peu d’intérêt, mais parfois ils sont essentiels.
On constate par exemple que la température moyenne estivale est de
26 degrés à Montréal (moyenne des maximums de juillet) contre 31 degrés
à San Juan de Porto Rico. Et pourtant, il arrive souvent que les Montréalais
aient à subir des températures plus élevées que les Portoricains.
C’est que le thermomètre, très stable dans les Antilles, n’hésite
pas à se balader d’un extrême à l’autre au Québec. Certains jours
d’été, Montréal bat même le record de chaleur de toute l’Amérique
du Nord.
La même moyenne peut recouvrir des données très proches ou encore
des données très éparpillées. On peut imaginer, ainsi, deux groupes
d’étudiants dont les moyennes sont égales à 67 %. Dans un cas, la
plupart des étudiants ont des notes qui varient de 60 à 75 alors que
dans l’autre, les résultats se répartissent à peu près uniformément
entre 35 et 95. Ici, nos deux moyennes résument des réalités complètement
différentes. Dans cette section, nous verrons comment mesurer ce degré
de dispersion des données.
2.1. Les Beatles : plus que des musiciens
Qui a eu la plus grande influence dans le domaine de la musique populaire
depuis la fin de la Deuxième Guerre mondiale? La question étant plutôt
subjective, elle pourrait être un bon sujet d’enquête. En attendant,
nous avons personnellement couronné les Beatles pour plusieurs raisons.
Nés juste un peu avant les baby-boomers et arrivés à maturité dans
les années 1960, ils font non seulement des ravages dans les palmarès,
mais ils deviennent les idoles de toute une génération, influencent
(ou reflètent) les mœurs des jeunes, inspirent même un grand nombre des
musiciens populaires qui vont leur succéder. Leur carrière effective
ne dure pourtant que 5 ans (de 1964, année de leurs premiers triomphes
internationaux à 1969, année de la dissolution officieuse du groupe). Toutefois,
pendant ces 5 ans leur musique, et le monde, semblent se transformer
à toute vitesse.
Mais revenons à nos moutons. Nous avons fait l’inventaire des 12 albums
originaux des Beatles (en excluant les compilations) et du nombre
de titres qu’ils contiennent (tableau 3.6). Notre but ici est de mesurer
à quel point le nombre de titres varie d’un album à l’autre. Une fois
que nous aurons construit notre indicateur de dispersion (ici : l’écart
type), nous pourrons l’appliquer à d’autres situations.
Les 12 albums contiennent en tout 168 titres. Il y a donc 14 titres
en moyenne par album (car 168/12 = 14). Cette moyenne va nous servir
de point de repère pour évaluer la dispersion. Y a-t-il beaucoup d’albums
dont le nombre de titres s’écarte de cette moyenne et, si oui, s’en
écartent-ils beaucoup? À première vue, l’écart est plutôt faible
(colonne 4 du tableau 3.6). Certains écarts sont positifs, d’autres
sont négatifs. La somme des écarts est toujours nulle, puisque la
moyenne représente en quelque sorte le centre de gravité de
tous les éléments.
L’écart absolu mesure l’écart entre une valeur et la
moyenne, sans considérer le fait que cet écart soit positif ou négatif.
Pour additionner les écarts sans qu’ils s’annulent, il faut donc se
débarrasser de leur signe. C’est ce que nous avons fait dans la colonne
6. En termes absolus, la somme des écarts est de 10 (en bas de la
colonne 6). Comme le calcul porte sur 12 éléments (les 12 albums),
on peut dire qu’en moyenne, l’écart absolu est de 0,83 (soit
10/12). Ce simple chiffre suffirait pour nous indiquer que le nombre
de titres varie peu d’un album à l’autre.
Pour calculer l’écart absolu moyen
1. Calculez la moyenne : 168/12 = 14
2. Mesurez les écarts entre chaque valeur et la moyenne : pour les deux premières valeurs : 14 – 14 = 0; pour la troisième valeur : 13 – 14 = –1; etc.
4. Divisez la somme des écarts absolus par le nombre de valeurs : 10/12 = 0,83
L’écart type est un indice de dispersion des valeurs
autour d’une moyenne.
7
En pratique, l’écart absolu est peu utilisé. On lui préfère l’écart
type qui possède des propriétés plus intéressantes et qui n’est
pas tellement plus compliqué à calculer. Dans la colonne 5 du tableau
3.6, on s’est débarrassé des signes négatifs en mettant au carré tous
les écarts à la moyenne. La somme des écarts mis au carré est égale
à 20 (au bas de la colonne 5). Pour terminer, et puisque nous avons
mis les écarts au carré au point de départ, nous allons faire la racine
carrée du résultat obtenu : l’écart type est égal à la racine carrée de
1,66, soit 1,29. Ouf! Cela semble compliqué? Pas du tout : regardez
ce qui suit.
Pour calculer l’écart type
1. Calculez la moyenne : 168/12 = 14
2. Mesurez l’écart entre chaque valeur et la moyenne
5. Divisez le résultat par le nombre de données : 20/12 = 1,66
6. Faites la racine carrée du résultat : √1,66 = 1,29
Les données sur lesquelles nous venons de travailler avaient le mérite
d’être simples. Elles nous permettaient d’illustrer facilement la
méthode de calcul de l’écart type. Elles n’étaient cependant pas d’une
grande utilité au niveau de l’interprétation. Il suffisait en effet
de jeter un coup d’œil rapide sur la colonne 3 du tableau 3.6 pour
constater que le nombre de titres variait peu d’un album à l’autre.
Nous allons donc, sans quitter les Beatles, faire appel à un exemple
plus significatif.
La question que nous posons est la suivante : la durée des chansons
des Beatles a-t-elle évolué avec le temps? Nous avons choisi, pour
y répondre, deux albums typiques des Beatles (tableau 3.7) et nous
nous pencherons davantage sur l’analyse des résultats que sur la méthode
de calcul. L’album Help se situe plus vers le début de la carrière
des Beatles (la chanson Yesterday se trouve dessus et elle
dure 2 minutes et 4 secondes) et Abbey Road est le dernier
album fait en commun par le groupe (la chanson vedette, Here Comes
the Sun dure 3 minutes et 4 secondes).
Cette fois, nous avons utilisé notre chiffrier électronique pour calculer
les moyennes et les écarts types. Observons les résultats du
tableau 3.7, puis essayons de les expliquer. En moyenne, les chansons
plus récentes sont plus longues. Mais ce qui est encore plus frappant,
c’est que la durée des chansons plus récentes devient de plus en plus
variable (l’écart type a beaucoup augmenté). En 1965, les chansons
étaient toutes sur le même modèle et duraient entre 2 et 3 minutes.
En 1969, c’est beaucoup plus disparate : il y en a de très longues (7:49)
et de très courtes (1:06).
Voici notre interprétation de cette évolution, avec tout ce qu’elle peut avoir de subjectif.
En 1965, les chansons étaient faites avant tout pour danser,
les paroles étaient simples, la musique était efficace, énergique
et construite selon quelques modèles standards, le public était jeune
et insouciant. Il fallait que ça « roule ». En 1969, l’auditoire des
Beatles a changé : il est un peu plus vieux, il est plus sérieux, plus
intellectuel, plus politisé; la musique est plus sophistiquée, la
construction est plus élaborée et plus variée, les paroles sont plus recherchées;
les chansons sont plutôt faites pour être écoutées.
Proposons, pour conclure, une autre hypothèse plus terre à terre.
Jusqu’au début des années 1950, les disques (78 tours) ne pouvaient
contenir plus de 3 minutes de musique. Cela explique pourquoi les
compositeurs écrivaient toujours des chansons de 2 ou 3 minutes. Et
puis l’habitude est restée pendant près de quinze ans après la mort
du 78 tours. Comme quoi, l’homme est parfois esclave de lui-même…
EXERCICES 2
1. Les empereurs romains : l’essayer c’est l’adopter
Quelques dizaines d’années après les Césars, Rome a eu la chance d’être
gouvernée par des empereurs « sérieux » : les Antonins. Ces derniers
avaient pris l’habitude de se choisir un successeur qualifié en l’adoptant.
Un seul fit exception à la règle : Marc-Aurèle, surnommé le meilleur
des empereurs, qui commit l’erreur de désigner son véritable fils
comme héritier. Ce sinistre jeune homme, Commode de son prénom, un
mélange de Néron et Caligula, sonna le glas de la dynastie des Antonins
et périt assassiné.
a) À partir des chiffres du tableau 3.8 ci-joint, calculez l’âge
moyen des empereurs de la dynastie des Césars au moment de leur accession
au trône et de leur mort. Faites les mêmes calculs pour la dynastie
des Antonins.
b) Calculez la moyenne et l’écart type de la durée du règne pour les
trois cas suivants : (1) la dynastie des Césars, (2) la dynastie des
Antonins, (3) la dynastie des Antonins à l’exception de son fondateur
Nerva.
c) Comparez les deux dynasties.
2. Chansons pour danser, chansons pour écouter
a) Vérifiez les moyennes et les écarts types du tableau 3.7.
b) Recherche. Choisissez deux disques (avec leur durée) et créez un
tableau semblable au tableau 3.7.
Note : vous pouvez remplacer les
disques par des livres (avec la longueur de leurs chapitres) des listes
de films proposés par des cinémas (avec la durée des films) ou par
toute autre situation similaire.
3. LA COURBE NORMALE ET L’ÉCART TYPE
Reprenons les données du tableau 3.6 et représentons-les graphiquement
sous forme d’un histogramme de fréquences (figure 3.1). Sur l’axe
horizontal, nous indiquons les valeurs que peut prendre la variable
nombre de titres et sur l’axe vertical nous indiquons le nombre
de fois (la fréquence) que la variable prend telle ou telle valeur.
Dans de nombreux cas, la distribution des valeurs que prend une variable
suit une courbe en forme de cloche (ou de chapeau de Napoléon) : la
courbe dite normale (figure 3.2). Lorsque la distribution est
normale, le fait de connaître la moyenne et l’écart type permettent
de trouver une foule d’informations.
3.1. Quand la distribution est-elle normale?
Jusqu’ici, nos exemples étaient relativement simples et les données
(les valeurs prises par les variables) étaient peu nombreuses. Notre
but était surtout d’illustrer les nouveaux concepts présentés : la
moyenne et l’écart type. Dans la pratique, lorsque les
données sont trop peu nombreuses, certaines d’entre elles (celles
qui s’éloignent trop de la tendance générale) peuvent jouer les trouble-fête
et « fausser » la moyenne et l’écart type. Lorsque les éléments sont
très nombreux, les trouble-fête ont par contre moins de chance de
se faire remarquer : ils sont noyés dans la masse.
La loi normale apparaît dans de très nombreux contextes.
Lorsque les données sont suffisamment nombreuses et qu’elles dépendent
d’une multitude de facteurs dont aucun ne prédomine sur les autres,
la distribution de ces données est souvent normale. Le nombre de clients
à la banque le jeudi, le temps que nous passons sous la douche, la
grosseur des œufs pondus par une poule X, l’épaisseur des anneaux d’un tronc
d’arbre ont des bonnes chances de suivre la distribution normale.
Par contre, la répartition de la population selon l’âge ne suit pas
une courbe normale pas plus que la distribution des salaires dans
une entreprise.
Même si le nombre de valeurs est peu élevé (il n’y a que 12 albums
considérés), on sent déjà poindre la courbe normale dans la distribution
du nombre de titres par album 33 tours chez les Beatles. Le nombre
de titres est en effet lié à de multiples facteurs d’ordre commercial
(l’attente des clients), artistique (l’inspiration des musiciens),
matériel (la capacité d’un disque), économique (le coût de production),
etc. À plus long terme cependant, il se peut qu’une variable (comme
l’apparition du disque compact) vienne changer les règles du jeu de
façon radicale et modifier complètement l’allure de la distribution.
La variable taille des individus possède les caractéristiques
de la distribution normale. Plus on s’éloigne de la taille moyenne,
que ce soit en montant ou en descendant, et moins on il y a d’individus. Nous allons utiliser cet exemple pour montrer
comment, grâce à la courbe normale et deux simples chiffres (la moyenne
et l’écart type), on peut répondre à un tas de questions intéressantes.
3.2. L’écart type et la courbe normale
Au Québec, la taille moyenne des hommes est de 176 cm. Évidemment,
il y en a de plus grands et de plus petits. L’écart type, qui mesure
cette dispersion, est de 7 cm. Pour les femmes, la moyenne est de
162 cm et l’écart type de 6 cm. Dans un cas comme celui-ci, les hommes
diffèrent systématiquement des femmes et il serait maladroit de les
mettre dans le même paquet. Notons par ailleurs que la taille moyenne
a tendance à augmenter depuis un siècle.
Pour rendre les explications un peu plus simples, nous
avons un peu arrondi les chiffres. Nous nous sommes basés sur les résultats (non publiés) de l’Enquête nationale sur la santé de la population menée en 1994-95
par Statistique Canada, selon laquelle la taille moyenne des Canadiens adultes (18
ans et plus) est estimée à 176,15 cm pour les hommes et à 161,93 cm
pour les femmes. En passant, et selon la même enquête, le poids moyen
des Canadiens adultes est de 80,3 kg pour les hommes et de 64,6 kg
pour les femmes. À titre de comparaison, on pourra consulter le
tableau 3.11 qui contient la taille moyenne et le poids moyen
des jeunes Australiennes. En ce qui concerne l’écart type de la taille
des Canadiens, nous n’avons malheureusement pas été en mesure d’obtenir
de données précises (et gratuites), malgré d’ardentes négociations
avec les autorités. Nous avons donc dû procéder à nos propres estimations
pour l’écart type, en nous basant sur des données américaines et des microdonnées ultérieures.
Les simples chiffres que nous venons de mentionner vont nous permettre
de répondre aux questions suivantes :
Julie mesure 168 cm. Est-elle une grande fille?
Julot mesure 169 cm. Est-il un petit gars?
Le châssis d’une porte a 2,11 m de haut. Sur les 1000 personnes différentes qui franchiront cette porte au cours de l’année, y en a-t-il beaucoup qui risquent de se cogner la tête?
Il faut d’abord savoir que, dans une distribution normale, la proportion
de sujets qui se trouve dans un intervalle donné est toujours la même.
Pour être plus concret, disons que 34,13 % des sujets sont situés
entre la moyenne (point central ou point 0 sur l’axe horizontal de
la figure 3.3) et 1 écart type; 13,59 % des éléments sont situés entre
1 et 2 écarts types de la moyenne; le restant (2,28 %) est situé à
plus de 2 écarts types de la moyenne. Il en va de même pour les sujets
dont les valeurs sont inférieures à la moyenne (partie gauche de la
courbe de la figure 3.3). La surface totale sous la courbe représente
100 % : 50 % à gauche et 50 % à droite de la moyenne.
Pour revenir à nos Québécoises, on peut affirmer que Julie est parmi
les plus grandes (voir la figure 3.4) puisque 84,13 % des Québécoises
sont plus petites qu’elle : les 50 % plus petites que la moyenne et
les 34,13 % comprises entre la moyenne et 168 cm. Il reste quand même
encore 14,87 % de femmes qui sont plus grandes que Julie. Quant à
Julot, il est dans la situation inverse : 84,13 % des Québécois sont
plus grands que lui.
Réglons enfin le cas de la porte de 2,11 cm. Utilisons l’écart type des hommes, qui sont le plus susceptibles de se cogner la tête. Cela nous met à 35 cm de la moyenne (211 cm – 176 cm = 35 cm), soit 5 écarts types (car 5 × 7 cm = 35 cm). Le tableau qui accompagne la figure 3.3 montre que seulement 0,00003 % des sujets (soit 50 % – 49,99997 %) s’éloignent à plus de 5 écarts types de la moyenne. Cette proportion de 0,00003 % équivaut à 3 personnes sur 10 millions. Il y a donc fort peu de chances pour qu’un tel individu, si tant est qu’il se présente, se cogne un jour au cadre de porte. À moins d’utiliser des talons particulièrement épais.
Le nombre d’écarts types qu’il y a entre une valeur particulière et
la moyenne de toutes les valeurs est souvent appelé la cote z.
La cote z de Julie est égale à +1 et celle de Julot est égale à –1,
celle du monsieur qui mesure 2,11 mètres et qui se cogne dans les
châssis de porte est égale à +5.
Cote z = (Valeur particulière – Moyenne)/Écart type
Cote z de Julie = (168 – 162)/6 = 6/6 = 1
Cote z de Julot = (169 – 176)/7 = –7 /7 = –1
Cote z du grand monsieur = (211 – 176)/7 = 35/7 = 5
Posons maintenant les questions à l’envers :
Si nous excluons les 0,5 % de Québécois les plus petits et les 0,5 %
de Québécois les plus grands, quelle est la taille maximum et quelle
est la taille minimum des 99 % de Québécois restants? (La question
gagne à être posée séparément pour les hommes et pour les femmes.)
La figure 3.5 reprend la distribution normale sous l’angle que nous
venons de lui donner. La proportion de 0,5 % correspond à 2,57 écarts
types de part et d’autre de la moyenne. Rappelons que la taille moyenne
des hommes est de 176 cm et l’écart type correspondant, de 7 cm. Pour les hommes, 2,57 écarts types correspondent à 18 cm (2,57 × 7 cm). Il y a donc 99 % des hommes qui mesurent entre 158 cm (soit 176 – 18) et 194 cm (soit 176 + 18).
De la même manière, 99 % des femmes, dont la taille moyenne est de 162 cm avec un écart type de 6 cm, mesurent entre 147 cm (162 – [2,57 x 6]) et 177 cm (162 + [2,57 × 6]).
EXERCICES 3
1. La taille des Québécois
La taille des Québécois de sexe masculin est distribuée de façon normale avec
une moyenne de 176 cm et un écart type de 7 cm.
a) Quelle est la proportion de Québécois mesurant plus de 183 cm?
b) Quelle est la proportion de Québécois mesurant plus de 185 cm?
c) Quelle est la proportion de Québécois mesurant moins de 162 cm?
d) Quelle est la proportion de Québécois mesurant entre 183 cm et 185 cm?
e) César-Auguste Tremblay mesure 2 écarts types de moins que la moyenne
de ses concitoyens. Quelle est sa taille?
2. Cote z
On suppose, dans l’exemple fictif suivant, que les notes sont distribuées de façon normale.
a) Les 150 élèves du professeur X ont obtenu une note moyenne de 64
points à l’examen final (avec un écart type de 12 points). Julie,
qui est également une élève du professeur X a obtenu pour sa part
la note de 88 points. Calculez la cote z de Julie.
b) Pour les élèves du professeur Y, la moyenne est de 60 points et
l’écart type de 10. Julot, élève du professeur Y, a obtenu une note
de 85 points. Calculez la cote z de Julot.
c) Julie et Julot ont tous deux posé leur candidature à l’université.
Le directeur de l’établissement où ces examens se sont déroulés recommande
en premier lieu la candidature de Julot, estimant que ce dernier a
obtenu de meilleurs résultats que Julie. Que pensez-vous de l’attitude
de ce directeur?
3. Courbe normale et proportions
Les questions suivantes portent sur une variable distribuée de façon normale.
a) Quelle est la proportion de valeurs situées entre 0 et 1 écart
type?
b) Quelle est la proportion de valeurs situées entre 0 et 2 écarts
types?
c) Quelle est la proportion de valeurs situées au-delà de 3 écarts
types?
d) Quelle est la proportion de valeurs situées entre –1 et 1 écart
type?
e) Quelle est la proportion de valeurs situées entre –1 et 2 écarts
types?
4. D’AUTRES INDICATEURS DE MOYENNE ET DE DISPERSION
En dehors de la moyenne et de l’écart type, il existe quelques mesures
pratiques et simples pour évaluer le niveau de dispersion des éléments
d’une distribution.
4.1. Le milieu et les bords : autres mesures
La figure 3.6 nous servira à illustrer
ces mesures. Nous avons retenu dans ce tableau les pays de langue
espagnole de l’Amérique centrale et des Antilles : ce sont des pays
d’importance similaire (petits pays en superficie et en population)
et homogènes (même région, même culture). Tout au long du commentaire qui va suivre, nous utiliserons les chiffres de la première colonne (les femmes en 1992).
L’étendue mesure l’écart entre les deux valeurs extrêmes d’une distribution.
Les valeurs extrêmes sont le minimum (ici 67) et le
maximum (ici 79). L’intervalle dans lequel la variable prend
ses valeurs, ou étendue, est la différence entre les deux extrêmes
(ici 79 – 67 = 12).
La médiane est la valeur autour de laquelle on retrouve deux groupes représentant chacun la moitié des données d’une distribution.
La médiane représente la valeur de l’élément du milieu de la
distribution. Il faut évidemment que les valeurs soient, au préalable,
classées par ordre de grandeur. Il y a ici 9 valeurs. La valeur de
l’élément du milieu (le cinquième élément) est de 70 : c’est la médiane
de cette distribution. Il existe autant de valeurs inférieures à 70
que de valeurs supérieures à 70 dans notre distribution. La médiane
permet donc de couper la distribution en 2 parties égales.
Dans une certaine mesure, la médiane nous indique le milieu, mais
elle n’est pas nécessairement égale à la moyenne. Dans notre exemple,
la médiane est plutôt inférieure à la moyenne (qui est de 72,7 : vérifiez-le
si le cœur vous en dit). Dans une distribution normale, par contre,
la médiane coïncide avec la moyenne. Enfin, lorsque le nombre de valeurs
est pair (ici, il était impair), on coupe la poire en deux : la médiane
est alors égale à la moyenne des 2 valeurs centrales.
Au Québec, l’âge médian de la population était de 25,6 ans en 1971. Cela signifie que la moitié des Québécois avaient moins de 25,6 ans. Vingt ans plus tard, cette médiane se situait à 34 ans. En 2012, au moment du « printemps érable », la médiane avait atteint 41,5 ans, et une bonne partie de la population se montrait peu sympathique aux revendications de la jeunesse. Par la suite, la médiane commença à plafonner : par définition, le « vieillissement de la population » ne peut pas être éternel!
Le mode est la (ou les) valeur(s) qui revient (qui reviennent) le plus souvent dans une distribution.
Le mode est la valeur qui revient le plus souvent dans la distribution.
Ici, il y a deux modes : la valeur 69 et la valeur 79 reviennent 2
fois chacune. On dira que la distribution est bimodale (ou à deux
bosses, comme un chameau). Avouons, pour nuancer, que notre distribution
comporte peu d’éléments et qu’aucune valeur ne se détache vraiment
nettement. Si on regroupait les éléments, on pourrait cependant observer
nettement 2 catégories de pays : ceux qui tournent autour de 68 ou
69 et ceux qui tournent autour de 78 ou 79.
Le coefficient de variation mesure le rapport entre l’écart type et la moyenne.
Le coefficient de variation est une variante un peu plus raffinée
de l’écart type. Dans le tableau 3.9, l’écart type est plus grand
pour les femmes que pour les hommes (4,7 pour les femmes et 4,3 pour
les hommes). Le coefficient de variation représente l’écart
type relatif. Ici, le coefficient de variation est à peu près identique
pour les femmes (4,7/72,7 = 0,065 = 6,5 %) que pour les hommes (4,3
/ 67, 7 = 0,063 = 6,3 %). À vous déterminer si le coefficient
de variation convient mieux à la situation étudiée que l’écart type.
Car les méthodes quantitatives sont plus une question de jugement
que de calcul.
Coefficient de variation = Écart type/Moyenne.
Coefficient de variation de l’espérance de vie des femmes = 4,7/72,7 = 0,065 = 6,5 %
Au fait, pourquoi les femmes vivent-elles généralement plus longtemps
que les hommes? Posez la question à votre entourage et vous récolterez
sans doute de beaux spécimens de préjugés. La cause des écarts serait tout banalement de nature chimique : le métabolisme des hommes est plus élevé que celui
des femmes (d’où, entre autres, des besoins supérieurs en calories
ingérées) et la « machine » s’userait plus vite.
4.2. Les quintiles : cinq parts égales?
Par quintile on entend chacune des quatre valeurs qui partagent une distribution (rangée en ordre) en cinq groupes de même effectif et, par extension, ces cinq groupes eux-mêmes.
En plus d’identifier le milieu, la médiane permettait de couper la
distribution de valeurs en 2 paquets, ou tranches. Eh bien,
il arrive aussi que l’on coupe la distribution en 5 tranches (voir
le tableau 3.10 sur lequel figurent les revenus d’une population divisée
en 5 tranches : les plus pauvres, les assez pauvres, ceux du milieu,
les assez riches et les plus riches). On parle alors de quintiles
(qui n’est autre que le mot « cinquième » en latin).
Dans le tableau 3.9, les quintiles sont utilisés de façon particulière
pour observer comment les revenus se distribuent dans la population.
Aux Pays-Bas, le premier quintile le plus pauvre (c’est à dire les
20 % des Néerlandais les plus pauvres) se partage 8,2 % du revenu
national (voir le tableau 3.9). De l’autre côté, la tranche la plus
riche de la population (le cinquième quintile) se partage 36,9 % du
revenu. La figure qui accompagne le tableau permet d’évaluer d’un
coup d’œil le degré d’inégalité de répartition du revenu dans un
pays. Les courbes représentent les proportions cumulées du
revenu au fur et à mesure qu’on ajoute des tranches. Le Panama est
le pays qui s’éloigne le plus d’une répartition égalitaire. Cette
représentation graphique s’appelle la courbe de Lorenz.
Parfois, on découpe une distribution en 4 tranches (on a alors des
quartiles), en 10 tranches (les déciles), voire en 100 tranches (les
centiles). Le principe reste le même.
4.3. Pour ne pas y perdre son latin
Nous venons de présenter beaucoup de mots : moyenne, médiane, milieu,
moitié. Ce qui compte, c’est de bien comprendre chaque concept et
non d’impressionner l’auditoire avec du jargon. D’ailleurs, les quatre
mots que nous venons de citer ont tous la même origine : ils proviennent
du mot latin medius qui veut dire au milieu. Observez
votre main : votre médius (appelé aussi le majeur) n’est-il pas la
médiane de votre collection de doigts? La figure 3.6 montre l’origine de tous ces mots.
Parfois, le mot moyenne est utilisé à toutes les sauces. Le
Québécois « moyen » n’est pas la moyenne des Québécois. Il s’agit plutôt
du Québécois ordinaire (est-ce Elvis Gratton?) Le mot moyenne
est utilisé dans le sens d’intermédiaire dans les expressions :
classe moyenne, Moyen âge, Julot est de taille moyenne, placement
à moyen terme. Ces exemples ne font que témoigner de la richesse du
langage, reflet de la richesse humaine.
4.4. Pour les curieux : la moyenne harmonique
La moyenne dont nous avons parlé jusqu’ici est la moyenne arithmétique
(ou moyenne tout court). Dans la presque totalité des cas,
cette moyenne est amplement suffisante (pour le vérifier, demandez à
un de vos professeurs de sciences humaines s’il connaît la moyenne
harmonique ou la moyenne géométrique).
La « colle » suivante nous permettra d’expliquer simplement la moyenne
harmonique (nous verrons la moyenne géométrique dans le prochain
chapitre). Notre but est uniquement de montrer, encore une fois, que
l’utilisation des chiffres en sciences humaines est plus une question
de jugement qu’une question de calcul.
Un automobiliste fait l’aller-retour entre Montréal et Gatineau (400 km)
en parcourant les 100 premiers kilomètres à 50 km/h, les 100 kilomètres
suivants à 100 km/h, les 100 suivants à 150 km/h et les 100 derniers
à 200 km/h. Voilà un ex-chauffeur (son permis lui a été retiré suite
à cette expérience) qui, une fois bien réchauffé, n’a pas froid aux yeux.
Notre question est la suivante : quelle est la vitesse moyenne de l’automobile
sur l’ensemble du parcours?
Étant donné que le parcours est divisé en 4 tronçons égaux, on serait
tenté d’additionner les 4 vitesses et de les diviser par 4.
(50 km/h + 100 km/h + 150 km/h + 200 km/h)/4 = 500/4 = 125 km/h.
Mais si les 4 sections du parcours sont de longueur égale,
le temps qu’il faut pour parcourir chacun d’entre eux est différent.
Or, la vitesse dépend aussi du temps. Nous connaissons déjà la distance
totale, il nous suffit de calculer le temps total du trajet pour obtenir
la vitesse moyenne.
Il faut 2 heures pour parcourir les 100 premiers km (à 50 km/h), 1
heure pour le tronçon suivant, 40 minutes pour le troisième tronçon
et 30 minutes pour le dernier, soit en tout 4 h 10 min pour parcourir
400 km. La vitesse moyenne est donc de 400 km/4 h 10 min. Notons
qu’avant d’effectuer cette division, il faut convertir les minutes
en fractions d’heures : 10 min = 10/60 d’heure = 0,166 heure. Exprimé
sous forme décimale, le temps du parcours est de 4,166 heures. La
vitesse moyenne est de 400 km/4,166 heures = 96 km/h.
Ce dernier résultat (le bon : 96 km/h) est bien inférieur à celui de
notre premier calcul (le faux : 125 km/h). N’est-ce pas la preuve que
« rien ne sert de courir, il faut partir à point »?
2. Diviser le nombre de valeurs par le résultat précédent. 4/(1/24) = 4 × (24/1) = 96.
Moyenne harmonique = Nombre de valeurs/[(1/Valeur 1)
+ (1/Valeur 2) + …]
Il y a une leçon à tirer de cet exemple. La formule ou même le nom
de la moyenne harmonique ne parviendront peut-être pas à s’implanter
dans votre mémoire, mais vous vous souviendrez sans doute de la chose
suivante : il est plus important de réfléchir aux données du problème
que de se lancer aveuglément dans des calculs.
La moyenne harmonique est employée lorsque les variables considérées
sont en réalité des rapports (ici : la distance divisée par le temps)
et lorsque c’est le dénominateur qui varie (ici : le temps).
EXERCICES 4
1. Les hommes
À l’aide des données du tableau 3.6, calculez l’étendue,
la médiane, le mode et le coefficient de variation de l’espérance de
vie des hommes des pays hispanophones d’Amérique centrale en 1992. Justifiez
vos réponses avec quelques calculs si nécessaire.
EXERCICES SUPPLÉMENTAIRES
1. Le train? Pas dangereux!
Le tableau suivant indique le nombre de personnes tuées dans des accidents
de train dans la patrie du TGV (train à grande vitesse).
a) Calculez la moyenne du nombre annuel de victimes.
b) Calculez l’écart type du nombre annuel de victimes.
2. Une moyenne délicate
Il y a en Inde 880 millions d’habitants dont 340 millions
parlent l’hindi. On dénombre en tout 845 langues différentes dans
ce pays.
La Papouasie-Nouvelle-Guinée ne compte que 4,1 millions d’habitants.
Le pays est très montagneux et presque entièrement recouvert de forêts.
On y parle pas moins de 700 langues*.
a) Quel est le nombre moyen de locuteurs par langue en Inde?
b) Quel est le nombre moyen de locuteurs par langue en Nouvelle-Guinée?
Note : un locuteur est une personne qui parle une langue.
3. Seul dans le noir
Selon La Culture en perspective (Statistique Canada 87-004-XPB,
hiver 1995), il y avait en 1993-94 au Canada 664 cinémas disposant
en tout de 1727 écrans. Les 78 812 milliers d’entrées payantes ont
alors rapporté 400,5 millions de dollars de recettes.
a) Quel était alors le nombre moyen d’écrans par cinéma?
b) Quel était le nombre moyen de spectateurs (payants) par écran?
c) Quelle était la recette moyenne par entrée?
4. Simon, José, Miguel et les autres
Un texte célèbre de José Martí, poète et patriote cubain du XIXe siècle,
raconte comment un voyageur fourbu arrivant à Caracas s’enquiert,
avant toute chose, de l’emplacement de la statue du libérateur Simon
Bolivar. Puis, l’auteur fait le portrait et l’éloge de Bolivar, de
José de San Martín et de Miguel Hidalgo. De ce dernier, Martí dit
qu’il était de la race des hommes bons, c’est à dire des hommes qui
veulent savoir. N’est-ce pas là l’idéal de l’étudiant en sciences
humaines? (Référence : José Martí, Tres héroes.)
a) Cherchez la date de l’indépendance des pays d’Amérique hispanophones.
b) Calculez la moyenne et l’écart type de ces dates.
c) Commentez.
5. Une moyenne piégée
Il y a 1000 familles dans la ville. La moitié des familles de la ville
compte trois enfants. Le reste des familles n’a pas d’enfant (chiffres
fictifs).
a) Quel est le nombre moyen d’enfants par famille?
b) Quel est le nombre moyen de frères et sœurs que peut avoir un
enfant?
6. Un comportement normal?
En 1993, une enquête* menée auprès de 304 étudiants (118 garçons et
186 filles) dans deux universités de l’est des États-Unis a donné,
entre autres, les résultats suivants : l’âge moyen de la première relation
sexuelle était de 16,47 pour les garçons (avec un écart type de 2,4)
et de 17,4 pour les filles (avec un écart type de 2,3). Nous supposerons,
pour les besoins de l’exercice, que la variable âge de la première
relation était distribuée de façon normale, aussi bien pour les
garçons que pour les filles.
Pour faire cet exercice, vous pouvez utiliser la table de distribution normale présentée dans ce chapitre, ou la table plus détaillée fournie en annexe.
a) Quelle est la proportion de filles ayant eu une première relation
sexuelle avant l’âge de 17,4 ans? avant l’âge de 19,7 ans? après l’âge
de 19,7 ans? avant l’âge de 21 ans? entre l’âge de 17,4 ans et de
19,7 ans? entre l’âge de 16 ans et 20 ans?
b) Quel est l’âge à partir duquel on peut affirmer que 1 % des garçons
ont eu une première relation sexuelle? 10 % des garçons? 10 % des
filles? 20 % des garçons? 25 % des garçons? 50 % des garçons? 50 %
des filles?
7. Un pays sans classes
En 1992, le centile le plus fortuné de la population américaine détenait
42 % du patrimoine (contre 21 % en 1979) et 46 % des actions cotées
en Bourse. Le décile le plus fortuné détenait, quant à lui, 89 % des
actions cotées en Bourse. Dans le même intervalle de temps (1979-1992), la famille médiane n’avait
augmenté son patrimoine que de 10 %. (Sources : Courrier international,
8 février 1996.)
a) Quelle était la proportion des actions détenues par les 1 % des Américains
les plus fortunés en 1992? par les 9 % suivants? par les 90 % les moins fortunés?
b) Quelle était la proportion d’Américains qui détenaient un patrimoine
plus élevé que la famille médiane?
c) Montrez que l’écart entre riches et pauvres s’est accru aux États-Unis
entre 1979 et 1992.
d) Entre 1992 et 2012, le PIB américain par habitant en dollars constants a augmenté de 37 % (source : Banque mondiale, IDM). En combinant ce fait aux informations contenues dans la figure 2.3, pouvez-vous déterminer si les inégalités se sont accrues ou non au cours de ces vingt ans aux États-Unis?
8. Changement de médiane
Au Canada*, l’âge médian des personnes infectées par le VIH est passé
de 32 ans en 1982 à 27 ans en 1983-84 et à 23 ans en 1994. Compte tenu de cela,
que pensez-vous des affirmations suivantes?
a) La moitié des personnes infectées en 1994 avaient 23 ans ou plus.
b) Les personnes infectées en 1994 avaient en moyenne 23 ans.
c) La moyenne d’âge des personnes infectées a sensiblement diminué
en l’espace de 12 ans.
9. À l’autre bout du monde
Répondez aux questions suivantes à l’aide du tableau 3.11.
a) Le tableau contient 3 moyennes, 3 médianes, 6 proportions et 3
autres types de rapports. Identifiez-les.
b) Quelle est la proportion des femmes dont le mariage dure plus de
7,7 ans en 1994?
c) Expliquez pourquoi les phrases suivantes ont des bonnes chances
de « s’avérer » fausses! (Note : tous les chiffres concernent l’année 1994.)
i) La moitié des femmes mesure 164,3 cm.
ii) Les femmes se marient en moyenne autour de 26,6 ans.
iii) 6,2 % des femmes sont mariées.
iv) La majorité des femmes utilise la pilule contraceptive.
v) Il y a environ deux fois plus d’hommes que de femmes à l’université.
vi) Les hommes gagnent 18,4 % de plus que les femmes.
d) Tracez des courbes illustrant l’évolution du poids moyen et de
la taille moyenne des Australiennes au cours des décennies.
e) Quelle est l’évolution du ratio taille/poids au cours des décennies?
10. Recherche
Essayez d’obtenir l’âge des députés, des conseillers municipaux, des
professeurs d’une école ou d’un département ou de tout autre groupe
intéressant. Calculez la moyenne d’âge et l’écart type. Comparez les
résultats entre eux : différences entre hommes ou femmes, entre périodes
et entre lieux différents.