Erreurs, non-sens et paradoxes

Parceque ce qui semble logique peut être faux, et que croire savoir aveugle, parceque nos intuitions, comme nos sens, souvent nous trompent, parcequ'il ne suffit pas qu'une phrase soit bien formée pour qu'elle ait du sens, parceque le plus rationnel et instruit des hommes ou des métiers a aussi des croyances, avoir l'occasion de constater ses propres biais sur quelques exemples ludiques ou sérieux permet d'exercer son esprit critique en commençant par la connaissance de nos propres limites...

dimanche 6 avril 2014

Non-sens cachés

Lu / entendu

Voici quelques affirmations banales:

"La police a compté 150.000 manifestants, les organisations bien plus. Pourquoi on n'arrive pas à avoir le nombre exact ?"
"Nous n'utilisons que 10% de notre cerveau"; "l'intestin est notre second cerveau"
" La vague de chaleur de 2003 à causé 15000 morts en France"; "la pollution de l'air cause 7 millions de morts par an dans le monde"
"Il faut exiger un seuil de radio-activité de zéro"
"Il y a 34% de femmes cadre"
"S'ils n'aiment pas la France, qu'ils la quittent"
"Quel est l'age précis de la Terre ? la hauteur exacte de l'atmosphère" ?
"Il y a 9 vitamines dans la banane, c'est bien"; "il y a des micro-particules dans la vapote, c'est mal".
"Il fait deux fois plus froid ce matin"; "ici, le bruit est deux fois plus fort"
"La lecture est en chute libre, comme le montre la baisse du chiffre d'affaire des maisons d’édition"
"La montée de la population carcérale prouve bien la montée de la criminalité"
"Les grottes ornées sont toutes orientées vers une direction solaire remarquable (solstice, équinoxe, etc)"
"Je suis un menteur"
"Il y a en moyenne 0.83 voiture par foyer. ça fait combien par français ?"
"17.3% de soyance en plus"
"Il faut prouver l’innocuité totale de ce procédé avant de l'autoriser"
"Comparons le chômage des 15-20 ans à celui de 20-50 ans"
"Le nombre de suicides de gendarmes est anormalement élevé"
"Il y a alerte/interdiction/autorisation en Allemagne et pas en France. Si c'est dangereux pour les uns, ça l'est autant de l'autre côté de la frontière !"
"Le taux d'accidents étant un peu trop élevé dans les maternités isolées, celles ci seront fermées"
"La fin du monde aura lieu le 21 octobre 2011 à minuit précise"
"Le Diesel pollue plus que l'essence"
"L'ensemble des ensembles qui ne se contiennent pas eux-même se contient-il lui-même ?"
"Il y a environ 5 quintillions de bactéries sur Terre, alors que les mammifères terrestres ne sont qu'environ 25 milliards"
"Ce produit est naturel, alors que cet autre est chimique, ils sont donc fondamentalement différents (en particulier pour la santé)"
"Quel est le prix de revient exact du litre de lait pour le supermarché ?"; "la cantine me vend l'assiette de jambon x euros, c'est une arnaque vu le prix en magasin !"
"Ces mystérieuses roches du Costa-Rica sont parfaitement sphériques"; "ces repères néolithiques sont exactement alignés"

Mais ces affirmations ont elles vraiment un sens ? Du moins, un sens précis, suffisamment pour être informatif ?

Analyse

Les phrases ci-dessus sont entachées de graves problèmes de sens, ou au moins d’ambiguïtés faisant courir de forts risques de contresens. On peut distinguer quelques catégories (qu'on a fait correspondre en couleurs):

Paradoxes et ambiguités réthoriques

On peut former la phrase "je suis un menteur", comme "deux plus deux font cinq": la correction littéraire n'implique en rien que le contenu soit possible, ou même sensé. Un menteur systématique ne pouvant l'avouer, et un "véridique" ne pouvant se qualifier de menteur, seule peuvent prononcer cette phrases des personnes non-sensées, non-rigoureuses, changeantes, ou... aimant les blagues. :-)
Ceci a posé des problèmes Cornéliens aux mathématiciens, quand on a commencé à débattre d'ensembles infinis, d'ensembles de tous les ensembles, et d'ensembles pouvant se contenir eux même, jusqu'à ce qu'on en vienne à la question paradoxale "l'ensemble des ensembles qui ne se contiennent pas eux-même se contient-il lui-même ?". Sous ses dehors ésotériques, il s'agit de la même structure logique que "je suis un menteur", ou "si le barbier ne doit raser que ceux qui ne se rasent pas eux-même, le barbier se rase t'il lui-même ?". Les mathématiciens en ont conclus qu'il ne suffit pas qu'on puisse former une phrase interrogative assemblant des termes mathématiques pour que la question posée ait forcément un sens.
Les mots sont souvent polysémiques, et certains plus que d'autres (comme liberté, démocratie, naturel, science, homme, France...). L'une des raisons pour laquelle il faut raisonner avec des termes précis, c'est à dire non polysémiques au moins dans le contexte (i.e. désignant un signifié non-ambigu), c'est pour éviter le risque du glissement sémantique, c'est à dire d'un même terme qui ne signifie plus la même chose entre le début et la fin d'un raisonnement. C'est particulièrement piégeux, car nous estimons généralement la correction logique de façon purement lexicographique: "B entraîne C, or A entraîne B, donc A entraîne C", ce qui rend très difficilement détectable la fausseté d'un raisonnement (paralogisme ou sophisme) où ce que désigne B est variable. Concernant la phrase "s'ils n'aiment pas la France, qu'ils la quitte", je vous laisse evaluer si la notion de "France" dans "la [quitte]" est le même que dans le début de la phrase, et le cas échéant, s'il s'agit d'une maladresse ou d'une volonté...
Le langage naturel contient d'autres pièges encore. Par exemple l'ordre des adjectifs n'est pas sensé importer, mais peut néanmoins signifier des nuances... sans certitudes. Mais, en maths comme en logique, l'ordre des mots peut changer le sens, ce qui fait qu'une affirmation logique exprimée en langage naturel peut être ambiguë sans même que l'on s'en doute: on aura cru lire une chose précise, qui en signifiait peut-être une toute autre. Ceci est extrêmement fréquent dans le commentaire journalistique ou politique de statistiques. Par exemple "34% de femmes cadre dans la population" (des travailleurs ? des actifs ? des français ?) n'est pas identique à "34% des femmes sont cadre", ni a "34% des cadres sont femme". Mais que comprend-t-on quand on lit l'expression "il y a 34% de femmes cadre" dans un article ?
Les connotations sélectives inconscientes (ou "effet paillassons") chargent émotionnellement certains termes au point de faire raisonner de travers. En vrai, la Nature n'est pas spécialement "gentille" avec ses habitants: après tout poisons, virus et bactéries les plus mortels n'en sont pas moins naturels, de même que la radioactivité et le pétrole. La radioactivité est un problème ou non selon la dose (alors que le mot seul sème l'effroi), mais aussi selon l'atome concerné, qui s'incorporent ou non dans notre organisme (faisant alors bien plus de dégâts), ou dans la chaîne alimentaire (ces atomes sont parfois en outre toxique, indépendamment de leur aspect radiatif), ou dont les produits de fissions sont eux-même problématiques ou non, durables ou non (à noter qu'en soi un atome très radioactif ne l'est pas longtemps, ce qui peut être un avantage, tandis qu'en soi "radioactif des millions d'années" peut-être synonyme de "peu radioactif". Bref, ce ne sont pas les bon concepts opératoires, mais ont n'entend généralement que ceux-là).
De même, les industries chimiques ou pharmaceutiques ne font le plus souvent que synthétiser des molécules qui existent déjà dans la nature (et qu'il serait coûteux ou destructeur de recueillir, ou dont les variations de pureté ou de dosage (que connaissent les "petites plantes") pourraient être problématiques pour notre usage. La chimie est essentielle la description des réactions entre molécules, les usines chimiques les plus intenses et élaborées étant... les cellules vivantes. Quant aux activités humaines, sont de nature directement "chimique" la cuisine, puisqu'on y vise les changements moléculaires responsables de la digestibilité et du goût, et nombre de travaux traditionnels (de la saponification aux teintures).
Les usines elles-mêmes ne font que partir de produits à un moment ou à un autre naturels (on n'y synthétise pas d'atomes à partir de rien !). L'usage de processus optimisés dans les usines alimentaires et dans les champs rend méfiant là où il s'agit notamment de pouvoir observer les draconiennes règles d'hygiène (les deux risques étant la non rentabilité et le gros pépin sanitaire), tandis que c'est dans la cuisine familiale que la chaîne du froid et les agents pathogènes sont traités à 1000 miles des normes les plus permissives. Quant à nos potagers et pots de fleurs domestiques, les insectes tendent à y mourir noyés plus qu'intoxiqués tant les doses y excèdent celles des agriculteurs les plus irresponsables (et pas économes) !
Dans ces connotations pipées qui font souvent raisonner à l'envers, quelle est la part de mythe Grec ou biblique du mal fatalement puni que représenterait l'accès à la connaissance et aux techniques, tandis que de la Nature et des bonnes intentions intuitives ne pourrait sortir que du bon ? Ou de l'inculture sur le fond que vient suppléer une tétanisation sur des symboles aussi romantiques que trompeurs ? Ou de la confusion entre information télévisuelle et éducation populaire, alors qu'un sujet sera d'autant plus médiatisé qu'il est extra-ordinaire (d'où une perception des risques inverse des prévalences réelles), et un industriel d'autant plus débusqué qu'il existe des normes ? (si celles-ci s'appliquaient à la maison, la plupart d'entre nous seraient interdits de gérer un frigo, voire une cuisine...).
Malgré la saine apparition du concept d'"empreinte carbone" s'efforçant de comptabiliser la totalité d'un impact, il reste énormément de domaines pour lesquels une comptabilité incomplète fait faire des contresens: par exemple, la fermeture d'un établissement hospitalier "moins entraîné donc plus à risque" de par son isolement géographique entraîne mécaniquement un accroissement du risque pour les patients qui doivent aller chercher plus loin, éventuellement dans l'urgence, ou renoncer/retarder des examens qu'ils croient peut-être bénins à tord. Le prix des aliments au restaurant ou à la cantine nous parait injuste en comparaison de ce qu'on a l'habitude d'acheter au supermarché, en oubliant que l'établissement doit aussi ventiler sur ses prix le salaire de ses employés, loyers et "fluides" (eau, gaz, électricité). Par ailleurs, qu'il s'agisse d'un restaurant ou d'un supermarché, il n'existe pas de "prix de revient objectif tout compris", puisque la façon de ventiler les frais fixes (caissières, locaux...) ne peut qu'être arbitraire, et se fait donc en fonction de critères marketing, commerciaux ou d'équité (plat principal vs secondaire, tarif psychologique), voire en fonction de rapports de force ou de stratégie (produit d'appel exempt de participation aux frais fixes, d'où le flou de la notion de "vente à perte").

Exactitude et flous inévitables

Comme ce serait rassurant qu'il existe des réponses exactes à toutes les questions ! Ne resterait plus qu'à consacrer l'effort nécessaire pour les trouver (ce dont on néglige généralement la difficulté et le coût), et tout pourrait alors être tranché sans risque ni subjectivité. Et comme notre société traverse une phase d'allergie totale au moindre risque à la mode, elle a une haute exigence de certitudes et d'exactitude, et rejoint les tolérances zéros de la société sécuritaire et autoritaire.
Mais toute grandeur a t-elle forcément une valeur exacte, et si oui, est-elle toujours mesurable ? Est-il toujours raisonnable de vouloir l'imposer à la valeur zéro ?

Les notions d'age et de hauteur semblent simples et objectives: on peut facilement les mesurer pour tout individu ! Mais en va-t-il de même pour tout ? Pour mesurer un age, il faut un début exact. Quel est-il pour une montagne, pour la Terre, pour l'espèce humaine ? (sans parler de l'idée de communisme ou d'évolution, qui ne sont pas assez précises pour que l'on puisse en exclure ou inclure chaque texte ancien). La Terre n'a pas surgit du néant en un jour mais s'est agglomérée à la fois continûment et par collisions ponctuelles. De même, l'instant exact de la surrection d'une montagne, de la spéciation de l'humanité, de la personnification du fœtus, n'existent pas: on pose au besoin un choix arbitraire. Pour mesurer une hauteur, il faut une fin précise. Or, l'atmosphère se raréfie progressivement sans plafond matériel, aussi le voisinage de la Terre reste plus dense que dans le reste du système solaire, lui-même plus dense que dans la galaxie, elle-même plus dense que le vide intergalactique, lui-même pas absolument vide. De fait, en sciences comme en logique une réponse n'existe que par rapport à une question, a fortiori quand une délimitation ne peut qu'être arbitraire (car des critères raisonnables peuvent souvent être choisis en fonction de l'aspect auquel on s'intéresse).
En matière cérébrale, il s'est avéré hasardeux de vouloir mesurer l'intelligence par le volume du cerveau (à cette aune, les hommes, mais surtout les éléphants, seraient plus intelligents, et certains Nobels sous la moyenne), par la surface des bosses crâniennes ou des aires cervicales (le mythe des 10% inutilisés [+ref2] date d'une époque où on ne comprenait pas l'organisation du cortex droit et du lobe frontal), ou par le nombre de neurones (certains sont plus "cérébraux" que d'autres qui ne font que servir de point d'entrée ou de sortie, voire produire des hormones; et de toutes façons si un nombre devait compter pour l'intelligence, c'est celui des synapses, bien plus nombreuses, et surtout, adaptatives). On découvre en outre aujourd'hui que les cellules gliales, longtemps considérées comme un simple substrat, auraient un rôle plus actif.
Par ailleurs, "système nerveux" n'est pas égal à "cerveau": toute surface sensible demande des neurones pour l'être. Toute surface motrice demande des neurones pour l'être. La peau, les intestins, ont une grande surface, sensible, et très contractile pour l'intestin, donc elles ont mécaniquement beaucoup de neurones. De plus, tout système semi-autonome (contractions et autres réactions réflexes) demande des ganglions nerveux pour ça (lesquels ont la capacité de réflexion d'une huître). Si, tout en se méfiant des nombres, on compare les ordres de grandeur, on compte quand même 1000 fois moins de neurones dans l'intestin que dans l'encéphale, et rien que notre moelle épinière en a 10 fois plus, et la peau peut être également. Bref, même sur ce critère il faudrait dire "notre Nème cerveau (à QI d'huitre)". Il faut hélas constater que, aux antipodes de sa mission éducative, Arte diffuse beaucoup de documentaires issus du pire des pseudo-sciences, tout en leur conférant une crédibilité de réputation.
Dans le monde réel, le zéro n'existe (souvent) pas: bactéries et molécules sont si petites et nombreuses qu'on les trouve partout, fusse à dose infinitésimale. Au contraire du sortilège, c'est la dose qui fait le poison ! Mentionner une présence en soi, que ce soit connoté positivement (vitamines de la banane) ou négativement (radio-activité, micro-particules), sans dose ni comparaison, est un non-sens, c'est à dire, n'est pas une information utilisable (et au contraire facilement trompeuse). Le mentionner est soit une erreur, soit une tentative de manipulation. D'autre part, il est rarissime que la science invente quelque chose qui ne soit pas déjà dans la nature, auquel cas il n'est souvent ni nécessaire ni faisable de vouloir... encore moins que qu'on a dans l'environnement naturel ! Ainsi, stricto sensu, tout ce qui est plus lourd que le fer dans la table périodique des éléments, et une partie de ce qui est plus léger, est radioactif. Et en pratique, les roches granitiques, et par conséquent, bien des sous-sols de maisons, sont naturellement au dessus des normes de radioactivité. La radioactivité fait partie de la Nature et donc de l'environnement, et par construction, a énormément baissé depuis les origines de la Terre. De même, il se déroule naturellement depuis toujours dans la haute atmosphère des collisions bien plus puissantes que celles du CERN (si un big-bang devait s'y produire, il serait déjà naturellement arrivé sur Terre depuis longtemps).
Il est difficile en pratique de faire la différence entre "zéro" et "non mesurable". Aussi, il n'est guère sensé ni possible de vouloir exiger un seuil inférieur à la sensibilité des détecteurs, ou aux incertitudes et variations aléatoires. Pour la même raison, il est impossible de prouver l'innocuité absolue (et plus généralement, on ne peut prouver une inexistence: c'est donc l'existence d'une réalité qui doit être prouvée). Au mieux peut-on montrer, dans des conditions de labo ou épidémiologiques, qu'il n'y a pas d'effet... supérieur à ce qu'il advient naturellement, fluctuations aléatoires comprises.

Une affirmation d'exactitude sans mention d'un intervalle de confiance ou d'une marge d'erreur est souvent inutilisable voire trompeuse.

Comment affirmer que des grottes sont orientées vers l'un des axes solaires remarquables si ni l'on ne sait définir à moins de 20° près l'axe d'une grotte, ni ne donne l'écart limite à l'un des axes qui invaliderait l'affirmation ?
De même, les mystérieuses pierres du Costa-Rica sont loin d'être "parfaitement sphériques", aucun alignement néolithique n'est "parfait", et les crop-circles sont moins encore "tellement exacts que des humaines ne pourraient les construire" (ce qui, de fait, est l'intention de ces mentions d'exactitudes. Que la simple observation réelle rend très relative voire imaginaire, quant aux "constructions impossibles à l'humain", il s'agit souvent d'un grand manque d'imagination quant aux techniques passées... et actuelles, concernant les crop-circles dont on trouve facilement nombre de making-of de fabrication).
Une naissance ne se passe pas en une fraction de seconde, or l'astrologie un peu, et les biorythmes énormément, ont besoin d'un moment précis faute de quoi les techniques ne sont plus utilisables (car l'imprécision s'accumule). De même notre mesure du jour et de l'heure est liée d'une part à la longitude, d'autre part au fuseau horaire (et donc à notre position par rapport à la référence solaire du fuseau horaire, ce à quoi s'ajoutent les deux changements d'heure annuel). Dès lors, quel sens donner à la prédiction que la fin du monde se produira simultanément sur Terre le 21 octobre 2011 à minuit ? Ou bien c'est minuit chez le prédicateur (quel heureux hasard), ou bien c'est minuit à chaque horloge locale (bug informatique désastreux ?), ou bien c'est minuit "au soleil" (cataclysme astronomique hors système solaire ?), mais il faut choisir !

Comparaisons non raisonnables

Certains termes n'ont, contrairement à ce qu'on pourrait penser, pas de définition quantitative en soi, ou alors arbitraire ! Ainsi:

La température, bien qu'étant une mesure chiffré objective, comporte une part subjective: son unité (chez nous, Celsius), qui prive de sens certaines opérations, comme la comparaison des proportions. Comme le zéro est placé de façon purement arbitraire au point de congélation de l'eau (pure mais pas trop, à pression ambiante au niveau de la mer), autant les notions de température négatives ou positives sont a peu près reliées à la présence de glace (ce qui a un sens utile), autant la notion de "température double" n'a guère de pertinence. A noter que les scientifiques recourent à une unité plus "physique", le Kelvin, dotée d'un zéro absolu, lui, quand plus rien ne bouge dans la matière (la température étant avant tout un effet de l'agitation des molécules).
Réciproquement, les intensités ont de multiples unités très différentes selon qu'on s'intéresse à leur perception, ou à différents aspects physiques (transitoires ou totaux, par exemple). Le son est une une onde de pression, mais on mesure souvent sa puissance plutôt que son amplitude, et de surcroît en unité logarithmique (le décibel). Pour avoir un sens, l'expression "2 fois plus fort" doit donc préciser dans quelle unité de mesure !
D'autres unité techniques se dotent de termes communs (comme l'"intelligence" du QI ou la "soyance" d'une marque de shampoings) pour désigner des choses bien plus parcellaires. Avancer le terme générique sans précision dans un argumentaire, et pire, l'affubler d'une mesure ultra-précise, doit inciter à la méfiance.
Les bactéries sont immensément plus nombreuses que les insectes, eux même bien plus nombreux que les mammifères terrestres. So what ? Au delà de l’idolâtrie numérique en ersatz de compréhension, qu'est-ce qu'il serait raisonnable de comparer ? Les individus ? mais les bactéries étant monocellulaires, ne faudrait ils pas compter les animaux en nombre de cellules (nous somme à la base des colonies cellulaires structurées, et temporairement solidaires) ? Ou en biomasse ( / poid / volume) ?
"Pollution" est un principe général flou, sa comptabilité n'est possible que dans le cadre d'un objectif précis: s’intéresse t-on à l'impact sur la santé humaine ? sur l'environnement (biodiversité, santé d'espèces végétales ou animales) ? sur le réchauffement climatique ? sur la santé psychique (bruit) ? sur les préférences individuelles (affiches, crottes de chiens, pollution lumineuse) ? Et si l'on souhaite comparer deux entités aux effets composites, comme des carburants, quelle sera "l'unité de compte" permettant de ramener des choses disparates à un seul chiffre commun ? (Si c'est en coût monétaire pour la société, on doit alors aussi chiffrer la maladie et la mort, ce qui ne se fait pas sans une part d'arbitraire). Ainsi, les moteurs Diesel s'avèrent plus polluants ou moins polluants que les moteurs essence, selon le panier de critère choisi... qui est arbitraire ! (dont l'estimation du véhicule de référence, car la présence de filtres joue dans un sens, et son mauvais état dans l'autre; idem pour le bon réglage du moteur). Là aussi, vouloir une réponse absolue est une forme d'essentialisme; il n'existe ici que des réponses qui dépendent de la question précise qu'on choisi de traiter.
Les arbitrages et décisions publiques ne sont jamais techniques, mais politiques (au bon sens du terme): toutes sortes d'éléments contradictoires interviennent dans les choix publics (avantages, inconvénients, coût, impact symbolique, acceptabilité sociale de ces quatre éléments). En effet le politique est en charge de "nous" représenter, mais force est de constater que le contribuable est rarement d'accord avec le citoyen et le consommateur, eux-même parfois en contradiction avec le travailleur ou le parent, le justiciable ou le patient... qui sont sensé être la même personne ! Indépendamment des évaluations techniques elles-mêmes, qui peuvent diverger un peu, les co-facteurs liés au mode de vie et à l'environnement (l'organisation du temps scolaire, l'exposition à des polluants, l'habitat et l'isolation) peuvent notablement différer des deux côtés d'une frontière Européenne, et le poids des préférences et arbitrages sur les différents "curseurs" (risque, santé, coût, environnement, gêne, solidarité, respect des consignes) peuvent être culturellement bien plus divergents ! Sans nier l'effet, parmi d'autres, des aspects symboliques (exemplarité surjouée vs tolérance par peur des troubles) . Il n'est alors guère étonnant que la fixation de seuils, toujours arbitraires, et qui dépendent de la résultante de ces arbitrages, ne soient pas identiques... Sans que ce soit anormal !
La "taille de la manifestation" est également un concept forcément flou, d'où en partie les divergences. Sur son unité de mesure, on s'accorde en général à la ramener au nombre de participants (même si a l'occasion certains préfèrent commenter sa surface, sa longueur, ou sa durée, toutes choses assez mollement liées au nombre). Mais personne ne distribue ni relève de tickets ! Les uns comptent les cars (pour une manifestation nationale) et estiment le ratio parisiens/provinciaux, les autres comptent les rangs qu'ils multiplient par une estimation du nombre de manifestants par rang, d'autres encore, estime depuis un point de vue aérien la surface couverte puis la densité de la foule (en comptant le nombre de têtes sur une région échantillon). Ceci exprime que le comptage est approximatif, mais pas que le "nombre de manifestants" n'existe pas. Mais si l'on avait les moyens de le faire, comment faudrait il compter les spectateurs ? Ceux qui marchent en marge ou a contresens (badaud, ou en recherche de son groupe?) ? Les manifestants qui s'arrêtent en route, ceux qui rejoignent le cortège place de la Bastille ? faut il compter au début, au milieu ou à la fin ? quid des enfants et poussettes ? Bref, non seulement la notion de nombre exact de manifestants n'a pas de sens, mais de toutes façons en quoi serait-elle utile, puisqu'in fine ce qui compte, c'est la comparaison d'une fois sur l'autre ?

Un autre problème récurrent est l'usage opportuniste de statistiques, qui revient a improviser un indicateur de fortune chiffré de la quantité qui nous intéresse (alors que la méthode correcte consisterait à bien définir la question, sa mesure, puis d'enquêter sur cette base). Ainsi:

Si l'on veut mesurer la lecture, et la comparer au fil du temps ou des lieux, cela peut-il avoir du sens de compter en chiffre d'affaire ? les livres de poches n'ont pas le prix des beaux livres, il existe des bibliothèques, des prêts, un marché de l'occasion, qui échappent à ce comptage marchand, et connait-on le nombre de lecteur d'un exemplaire de livre ou de journal ? Réciproquement, faut-il compter les livres jamais ouverts, les pages de journal non lues ? Par ailleurs les supports de lecture évoluent : faut-il, et comment, compter les récits en ligne (classiques ou fan-fic), la "presse en ligne", les gratuits, et la "sous-littérature" des sites web et des BD ? (mais en quoi feuilleter un coûteux "beau livre" de photographies serait-il d'avantage de la "lecture" ?). Comment compter l'usage de wikipedia ? Encore un exemple de ce que l'on ne peut répondre pertinemment tant qu'on n'a pas au préalable bien déterminé quelle était la question qui nous intéressait... Et qu'attraper au vol une statistique vaguement reliée au sujet a peu de chance de réellement éclairer la question !
Quand on relie la population carcérale à la criminalité, quelle était la question amont dont ce lien se voulait l'élément de réponse ? S'il s'agissait d'évaluer l'évolution de la criminalité, alors on retombe exactement dans les écueils du point précédent. S'il s'agissait d'expliquer l'évolution de la population carcérale, alors il faut se donner les moyens de répondre un peu mieux que par simple préjugé ou syllogisme ! En effet, bien des facteurs suffisent largement à expliquer cette croissance, à commencer par l'allongement objectif de la durée des peines pour un même délit (contrairement au mythe urbain du laxisme de la justice. Par ailleurs, une meilleure élucidation des affaires pourrait également faire augmenter les incarcérations même avec une criminalité en baisse !).
Une difficulté plus subtile est la comparaison ou l'articulation de différentes statistiques. Par exemple, certaines portent sur les foyers, les familles, ou les individus vivant en France. Le problème est qu'on ne peut pas re-ventiler 100% des habitants sous forme de foyers ou familles (étudiants mineurs ou majeurs, sans abris, célibataires, communautés (ex, religieuses), pensionnaires de maison de retraite ou d'établissements hospitaliers divers), ou alors il faut bien regarder comment afin s'assurer que l'impact est négligeable ou que l'exploitation du chiffre est compatible avec la question posée !
Une difficulté particulière porte sur la population des jeunes, en situation charnière entre études et travail, vie autonome ou chez les parents. Le chômage avant tout emploi n'est pas toujours comptabilisé comme les autres, les stages d'études ou de vacances sont une forme de travail bien particulière... Pour corser le tout, les études n'utilisent pas toujours les même fourchettes: les 15-20 ans, les 18-25 ans, les 18-30 ans mesurent des populations assez différentes ! S'agissant de comparer des tranches d'age, outre que si les nombres sont absolus il faut s'assurer que les tranches ont la même taille, la notion de "chômage des jeunes" suppose qu'on s’intéresse aux actifs (non étudiants)... qui sont une très faible proportion des 15-18 ans, par exemple. Ces comparaisons sont donc souvent épineuses... Raison de plus pour s’intéresser au fond, plutôt qu'à l’ersatz que représente souvent le commentaire aussi facile que sans recul de chiffres bruts pris pour le réel...

Toujours dans les statistiques, il est facile de comparer des choses non-comparables. L'épidémiologie, qui vise à objectiver la réalité, l'importance et l'évolution de marqueurs sociaux (par exemple des maladies) est rompue à l'éviction des biais, dans lesquels tombent facilement l'homme de la rue comme le journaliste et le politique (ce qui est plus grave, vu leurs fonctions).

A quelle référence faut-il comparer la criminalité de tel quartier ? à la moyenne française ? aux autres villes, quartiers ou populations comparables, selon un critère à définir ? (En tout cas un chiffre brut, ni ramené à la taille de sa population, ni comparé à rien, est un non-sens certain. Sans parler du détail variable de ce qui entre dans les statistiques de criminalité et délinquance).
Concernant les gendarmes, les agriculteurs, ou telle catégorie de travailleur, à quoi comparer un taux de maladie ou de suicide ?
On ne peut raisonnablement comparer qu'à une population de même structure, faut de quoi on risque soit d'inventer, soit de rater, un phénomène statistique. Dans le cas des gendarmes, ce taux est a peu près le double de la population générale. Un gendarme est-il, métier mis a part, un français exactement comme n'importe lequel ? En fait, non: il n'y a pas d'enfants, de retraité, et peu de femmes, contrairement à ce qu'on trouve dans la "population moyenne". Mais voila, il se trouve qu'enfants et personnes âgées se suicident moins que les actifs, et que le suicide est sur-représenté chez les hommes. Ainsi, la sous-population des hommes actifs connait une incidence de suicide à peu près double de celle de la population générale... a peu près égale à celle des gendarmes. L'anomalie statistique est donc vraisemblablement inexistante (ce qui n’enlève rien en soi à la réalité d'un malaise social).

Concernant le décompte des causes de mortalité, là aussi les pièges sont nombreux:

Il faut s'efforcer de distinguer cause directe et cause indirecte, facteur principal, co-facteur, et facteur aggravant.
En particulier en matière épidémiologique, une mort fauchant un jeune ou un actif en pleine santé n'est pas du tout la même chose que les "décès prématurés" ou "pertes de jours de vie" de personnes en fin de vie très fragiles ou au pronostic déjà naturellement engagé. Ainsi la canicule de 2003 a entraîné un pic de mortalité de 15000 morts... probablement suivie d'un déficit de mortalité les semestres suivant. Sans rien enlever au drame d'une mort, une perte de quelques jours ou mois de vie n'est pas la même chose que la perte de toute une vie active, alors que la perception de danger qu'induit le chiffre brut induit en erreur.
En matière de comparaisons, il faut s'assurer que les statistiques des différents pays ou époques comptabilisent à l'identique (il est des pays où l'on meurt "de vieillesse" là où ailleurs on appellerait ça "syndrome cardio-vasculaire").

Il ne s'agissait ici que de quelques exemples princeps... A vous maintenant de jouer à soupeser les affirmations qui vous sont assénées dans les médias, dans l'entourage... ou qu'il vous est arrivé de propager !

Pour en savoir plus

Plusieurs exemples ont été inspirés du livre "Plus vite que son nombre: déchiffrer l'information" (S. Gasquet), qui en contient bien d'autres.
"Why People Believe Weird Things" de Michael Shermer. Page wikipedia
Ou en français, tout Gérald Bronner . Page wikipedia
La thèse "pour une didactique de l'esprit critique" (R. Monvoisin)
"Impostures intellectuelles en 10 leçons" (M. de Pracontal)
"Petit cours d'auto-defense intellectuelle" (N. Baillargeon)
Dans le cours d'Henri Broch, liste des différentes facettes des mauvais raisonnements, et effets et postures faisant raisonner faux.

Les grandeurs ne sont pas équiprobables ! L'étrange loi de Benford.

Lu / entendu

Avez vous remarqué: qu'il s'agisse de million de dollars, d'habitants ou de kilomètres, les chiffres que l'on entend commencent souvent par 1 ?
Fiction, simplification, oreille sélective, ou... réalité ?

Il est, parait-il, des bonimenteurs qui vous laissent choisir une statistique géographique ou financière au hasard, et parient sur le 1, 2 ou 3 en tête, vous laissant la mise si le premier chiffre est supérieur à 3.

On pourrait pourtant se dire que, pris au hasard parmi toutes les distances, montants ou nombres, les chiffres devraient se répartir uniformément au hasard, comme le jet de dé parmi les 6 faces, ou les numéros du loto ! Si chacun des 9 chiffres est équiprobable, il a 1 chance sur 9 de sortir (11.11%), et le bonimenteur ne devrait gagner qu'1 fois sur 3.
Ne serait-ce pas le cas ?

Regardons ce qu'il en est pour quelques grandeurs dont on peut facilement trouver les chiffres sur le web (on a mis en couleur la proportion cumulée pour un premier chiffre de 1, 2 ou 3):

Longueurs de 130 fleuves de France métropolitaine, en km:
1er chiffre : 1 2 3 4 5 6 7 8 9
fleuves dans ce cas: 32 22 17 18 7 11 9 9 5
pourcentage: 25% 17% 13% 14% 5% 8% 7% 7% 4%
pourcentage cumulé: 25% 42% 55% 69% 74% 82%89%96%100%

Population des 192 pays du monde:
1er chiffre : 1 2 3 4 5 6 7 8 9
pays dans ce cas: 56 34 23 22 13 16 11 12 5
pourcentage: 29% 18% 12% 11% 7% 8% 6% 6% 3%
pourcentage cumulé: 29% 47% 59% 70% 77% 85% 91%97%100%

Taux de changes de 117 monnaies (en euro)
1er chiffre : 1 2 3 4 5 6 7 8 9
monnaie dans ce cas: 43 23 14 6 11 4 4 6 6
pourcentage: 37% 20% 12% 5% 9% 3% 3% 5% 5%
pourcentage cumulé: 37% 57% 69% 74% 83% 86% 89%94%100%

Distances au soleil des 8 planètes en km
1er chiffre : 1 2 3 4 5 6 7 8 9
planètes dans ce cas: 3 2 1 1 1
pourcentage: 38% 25% 12.5% 12.5% 12.5%
pourcentage cumulé: 38% 63% 76% 88% 100%

PIB des 211 pays en dollars
1er chiffre : 1 2 3 4 5 6 7 8 9
pays dans ce cas: 65 47 20 24 17 10 16 7 5
pourcentage: 31% 22% 10% 11% 8% 4% 8% 3% 2%
pourcentage cumulé: 38% 53% 63% 74% 82% 86% 94%97%100%

Chaque fois, le 1 est de loin le plus probable, environ 3 fois plus qu'il devait avec un hasard uniforme, et les chiffres suivants ont de moins en moins de chance d'être le premier chiffre des grandeurs mesurées. Et le score cumulé des chiffres 1, 2, 3 est toujours assez voire très supérieur à 50% des "tirages", au lieu d'une chance sur trois: le bonimenteur n'est pas fou, bien que les chiffres ne soient pas truqués. Cette répartition paradoxale est dénommée loi de Benford.
Mais comment est-ce possible ?

Analyse

Evidemment, cette étrange propriété ne peut s'appliquer qu'aux grandeurs autorisant une amplitude vaste: la taille d'un humain adulte ne varie pas d'un facteur 1 à 9, ni sa pointure de chaussures. Les angles sont limités à 360° (sauf à compter en tours); quant aux numéros de téléphones, leur premier chiffre est déterminé artificiellement (opérateur ou région).

Pour ce qui concerne les grandeurs à "échelle ouverte", allant de l'infiniment petit à l'infiniment grand, du moins, s'étalant sur plusieurs ordres de grandeur (car il est difficile de caser une rivière d'1 million de km sur Terre, et on dénomme rarement "fleuve" un écoulement millimétrique), la propriété ne dépend pas non plus des unités de mesure choisies, ni de la base.

Mais que veut dire "prendre un nombre au hasard" pour une grandeur à échelle ouverte ?

Pour examiner une affirmation avec esprit critique, il est important que chaque terme et notion soit précis:

Probabilité d'un nombre, ou de son 1er chiffre, est-ce que ça change quelque chose ?
Oui et non: un 1er chiffre correspond juste à un intervalle de nombres possibles, par exemple entre 100 et 199 pour un '1' de centaines. Mais de toutes façons quand une infinité de valeurs exactes sont possibles, la probabilité de chacune est zero; il est donc plus commode de considérer des "lots", c'est à dire des intervalles de valeurs.
Le 1er chiffre peut correspondre à des dizaines, centaines, milliers... Est-ce qu'on peut impunément ne retenir que le chiffre et oublier sa position ?
Oui, puisqu'on peut raisonnable supposer que ce qui compte tant qu'on est loin des limites physiques de taille, ce sont les rapports et proportions plus que les valeurs absolues (a fortiori avec une unité de mesure arbitraire): peut être qu'il y a plus de rivières courtes que longues, peut être que la proportion de rivières 10%, 2 fois ou 10 fois plus longue qu'une référence donnée est inégale, par contre on voit mal pourquoi ces proportions changeraient selon que la référence soit le kilomètre ou la centaine de kilomètres (tant qu'on n'est pas gêné par les limites du continent, ou de ce qu'on appelle ou non "rivière").

Cette considération sur les "égales proportions" est en fait la clé du mystère:

Pour des grandeurs à échelle ouverte, ce qui est raisonnablement comparable, ce sont les proportions et non les valeurs absolues: "une rivière deux fois plus longue" n'a pas la même significativité que "une rivière 10% plus longue". L'intervalle de 1 à 2 est plus "vaste" que de 1 à 1.1, indépendamment de s'il s'agit de dizaines ou de milliers. Or l'intervalle des nombres dont le 1er chiffre est 9 couvre un écart allant de 9 à 10 (non compris), c'est à dire de 11%, alors que celui correspondant au chiffre 1 couvre un écart allant de 1 à 2 (non compris), c'est à dire de 100%. Comme il y a la même proportion entre 1 et 2 (1er chiffre = 1) qu'entre 2 et 4 (1er chiffre = 2 ou 3) ou qu'entre 4 et 8 (1er chiffre = 4, 5, 6 ou 7), on comprend alors pourquoi les nombres n'ont pas la même significativité selon que leur premier chiffre est 1 ou 9, d'où la fréquence des premiers et la rareté des derniers (sauf sur les prix, quand ils veulent se signifier comme en dessous d'une barre symbolique :-) ).

Pour boucler la boucle et obtenir une prédiction quantitative que l'on puisse comparer à nos observations, il nous reste à "peser" le dernier intervalle de 8 à 10 (non-compris), par rapport aux trois autres. Comment calculer cela ? Comme les humains préfèrent manipuler des grandeurs "linéaires", c'est a dire dont les graduations sont égales, alors que la physique traite nombre de grandeurs naturelles à échelle ouverte ou "exponentielles" (un exemple typique étant les fréquences musicales, où un octave est un rapport 2 et un demi-ton un rapport de 13/12ème, ou encore les décibels pour les intensités sonores), les mathématiciens ont introduit la fonction logarithme (le contraire de l'exponentielle) qui permet cet "aplanissement" des grandeurs: le log transforme les proportions en différences (donc en "écarts") et les multiplications en additions. A logarithme égal, les intervalles auront la même significativité (et donc la même probabilité), c'est donc en échelle logarithmique (compensant la nature "exponentielle") que les grandeurs sont réparties uniformément. Ce qui nous permet de "peser" toute taille d'intervalle, et en particulier, de "normaliser" l'intervalle de 1 à 2 par rapport à celui de 1 à 10 regroupant toute la succession de 1 à 9 des 1er chiffres (en base 10): le premier "pèse" log(2)-log(1), et le second log(10)-log(1), ce qui donne la probabilité d'un intervalle de 1 à 2 : 0.30 et des poussières. L'intervalle correspondant au chiffre n (de n à n+1 non compris), a donc pour probabilité log(n+1)-log(n) divisé par log(10)-log(1) (ce que les matheux simplifient en log10(1+1/n) ). On obtient ainsi la probabilité de chaque 1er chiffre:

1er chiffre : 1 2 3 4 5 6 7 8 9
probabilité: 30% 18% 12% 10% 8% 7% 6% 5% 5%
probabilité cumulée:30% 48% 60% 70% 78% 85% 91%96%100%

Ce qui colle de très près à nos observation: le mystère est expliqué ! Et ce qui confirme le gain du bonimenteur, qui pour le coup n'est pas menteur mais exploite les faiblesses de nos intuitions...

NB:
Cette repartition inintuitive a une application pratique inattendue: elle permet de détecter des comptabilités bidon et des expériences scientifiques falsifiées. En effet, les humains voulant inventer des montants ou des valeurs physiques ont du mal à reproduire la vraie répartition naturelle, aussi, si les chiffres fournis sont assez nombreux pour que les variations aléatoires normales soient lissées, une répartition non-conforme à la loi de Benford est louche.
Et si l'on craint un maquillage de chiffres qui en tiendrait compte, il est également possible de caractériser une loi de répartition du second chiffre, plus subtile mais tout aussi mesurable.

Pour en savoir plus:

Loi de Benford sur wikipedia.
Celle ci à fait l'objet de nombreux articles de vulgarisation (par exemple dans Pour la Science) comme d'articles scientifiques. Voir par exemple Pourquoi la loi de Benford n'est pas mystérieuse et Splendeurs et misères de la loi de Benford.
Octaves et leur équivalence théorisée par Rameau.

samedi 5 avril 2014

ça augmente ou ça baisse ? Les pièges des effets de structure.

Lu / entendu

"Depuis 20 ans, le salaire moyen a progressé dans l'entreprise", dit le directeur. "Mais non, depuis 20 ans le salaire moyen des ouvriers comme des ingénieurs n'a cessé de baisser dans l'entreprise", rétorquent les syndicalistes.

Qui a tord, qui a raison ?
Les deux affirmations semblent contradictoires... mais est-ce forcément le cas ?

Untel est le premier de la classe, alors qu'il n'est premier dans aucune matière.

Telle équipe de foot a totalisé le plus de buts, alors qu'elle a perdu tout ses matchs.

En moyenne les ministères ont fortement réduit leurs dépenses, et pourtant au total on constate une augmentation.

Y aurait-il de la triche ?

Chez les instits, dans chaque classe d'age les hommes sont (un peu) mieux payés en moyenne que les femmes. Mais pourtant sur l'ensemble des instits, le salaire moyen des hommes est inférieur à celui des femmes.

Comment cela est-il possible ? Erreur dans les tableaux de chiffre, ou y a t'il une grosse différence fondamentale entre les deux mesures ?

Selon les uns, l'accès à l'Université est devenu plus égalitaire. Selon les autres, la proportion d'enfants d'ouvriers y baisse.

Selon les uns, telle région est devenue sous-dotée en médecins. Selon les autres, leur nombre n'a pourtant fait que croître.

Selon les uns, le PIB par habitant de tel pays croît, alors que le pays connait une décroissance persistante.

Selon les uns, les accidents domestiques sont devenu la première cause de mortalité dans telle catégorie de population. Selon les autres, les accidents domestiques n'y ont jamais été aussi peu nombreux.

Que conclure ?

Analyse

Oui, toutes ces affirmations sont justes simultanément, et il n'y a aucune contradiction. Notre entendement se fait avoir parce qu'il est aveugle aux effets de structure: on ne peut bien comparer que si un seul paramètre varie, toutes choses égales par ailleurs. Or dans tout ces cas, on fait des comparaisons bien plus complexes: des proportions au cours du temps ou des catégories, alors que les effectifs diffèrent. Ainsi,

Si le taux de cadres (mieux payés que les ouvriers) augmente dans une entreprise, cela augmente mécaniquement le salaire moyen, même si le salaire des deux catégories baisse.
Si la pyramide des ages est plus jeune chez les hommes que chez les femmes à l'éducation nationale, alors mécaniquement le salaire moyen des hommes est plus faible (le salaire y étant très lié à l'ancienneté), quand bien même ils seraient un peu mieux payé dans chaque tranche d'age. La moyenne de comparaisons catégorielles n'a pas de sens si leur structure est très différente.
Si la première cause de mortalité chute, la seconde cause peut devenir la première tout en ayant elle-même baissé. En matière de chiffres annuels, le commentaire des podiums est souvent piégeux.
Si la proportion d'ouvriers décroit, alors la proportion des enfants d'ouvriers à l'Université peut baisser même si le taux d'études longues croît parmi les enfants d'ouvriers. A noter qu'ici, toutes les références peuvent varier: lLu / entendue nombre d'ouvriers, la population totale, le nombre d'étudiants, la fécondité par classe sociale, le degré d'étude par classe sociale, etc, chacune pouvant impacter la mesure dans un sens ou dans l'autre.
Si une population augmente, alors tout taux d'équipement par habitant peut baisser quand bien même ce nombre d'équipements augmente, si c'est moins vite que la population. Réciproquement si la population décroit à PIB constant, alors le PIB par habitant augmente.
Certains ministères pèsent bien plus que d'autres sur le budget: le score des ministères "en moyenne" revient a mettre à égalité le poids de celui de la culture et de l'éducation nationale. Or, même 50% de coupes sombres du premier ne compenseraient pas 3% d'augmentations du second ! La moyenne de résultats catégoriels n'a pas de sens si leurs tailles sont très différentes.

Pour en savoir plus

Effets de structure
Budget de l'Etat
"Plus vite que son nombre: déchiffrer l'information" . Analyse par les Cahiers Pédagogiques.