Elections présidentielles avec Machin à 27%
Nous sommes à un peu plus d’un an des élections présidentielles, les seules élections qui passionnent vraiment les français. Et les sondages pour prédire qui sera le nouveau chef de l’Etat ou si on garde l'actuel vont aller bon train.
“Machin à 27%” au 1er tour, dit l’institut de sondage à une semaine du scrutin. “Oui mais quel est le pourcentage d’erreur?" demande le journaliste fier de montrer son scepticisme, et qu'on ne lui fait pas le coup, à lui
Supposons qu’à cette question l’institut de sondage réponde du tac au tac 2%.
Qu’est-ce que cela veut dire ?
-Ben que Machin sera entre 26 et 28
Sûr ? Et si finalement Machin est à 25, à 29 ou à 30 le sondage est-il une arnaque ? Ils se sont alors trompés donc on ne peut pas faire confiance aux sondages
Ah non, en fait cela veut dire que l'institut de sondage a 2% de chance de se tromper.
Un peu facile, il n’y a qu’un seul scrutin de 1er tour, et si l’institut de sondage se trompe il dira qu’il reste dans les 2% d’erreur sans qu’on puisse vérifier ces 2% avec un très grand nombre d’essais, car il n'y a qu'une seule épreuve. C'est ballot.
Par ailleurs, si l'élection donne Machin à 27,8% ou à 26,7% l’institut de sondage s’est-il trompé parce que ça ne fait pas exactement 27?
On sent bien deux choses. D’abord si on dit que c’est 27, avec une incertitude de + ou - 20 c’est à dire que Machin fera entre 7 et 47 on a peu de chances de se tromper.
Ensuite, si on affirme que Machin fera entre 26,95 et 27,05 ... ça a toutes le chances de ne pas se réaliser,
En fait, on ne peut se contenter de deux chiffres sur la précision d'un sondage. il nous faut :
1/ La fourchette probable du score (ce n’est pas une marge d’erreur)
2/ La confiance qu’on a dans cette fourchette qui devient l’intervalle de confiance.
On donne un intervalle par exemple + ou - 3 % avec une probabilité d’exactitude de cet intervalle de confiance de 95%, soit 5% de chances de ne pas être dans cet intervalle.
Imaginons que cet intervalle soit donné sur la base d’un échantillon représentatif de 1000 sondés.
95% est la probabilité que le sondage dise vrai, et c’est la probabilité proposée la plupart du temps.
On peut estimer cette probabilité pas suffisante et que pour être crédible on exige 99%,
C’est possible, mais alors on ne pourra pas garantir la même fourchette, le même intervalle de confiance. Il faudra l’agrandir à + ou - 4%.
Si on juge cet intervalle trop vague, il n’y a pas de miracle, la seule solution sera de faire porter le sondage sur un nombre de sondés plus grand. Et ça coûte cher.
Par exemple avec 10 000 sondés on pourra faire réduire l’intervalle de confiance à + ou - 1,3% avec une probabilité de 99%
Les instituts de sondages choisissent en général une confiance à 95% et donne un intervalle de valeurs associé à cette confiance.
Si le résultat n’est pas dans l’intervalle, il n’y a rien de scandaleux, cela arrive dans 5% des cas. En théorie. Et si le sondage est honnête.
Cas d’école Machin est à 27 +/- 2% et Truc est 25 +/- 2%
Machin est plus fort que Truc avec un recouvrement des intervalles de confiance de moitié.
Machin reste plus fort que Truc mais Truc a une chance sur 4 de gagner face à Machin.
Le tableau a été réalisé sur la base de résultats donnés par une distribution normale, autour d'une moyenne, extension de la loi binomiale. La loi binomiale devient inexploitable dès que l'échantillon devient supérieur à 200,