Statistiques descriptives

Statistiques descriptives

11

  • Savoir manipuler un indicateur de tendance centrale d’une série statistique : la moyenne pondérée.

  • Connaître les propriétés de linéarité de la moyenne pondérée.

  • Savoir manipuler des indicateurs de dispersion d’une série statistique : écart interquartile et écart type.

  • Décrire verbalement les différences entre deux séries statistiques, en s’appuyant sur des indicateurs ou sur des représentations graphiques données.

Vocabulaire

Définition

  • Une série statistique est un ensemble de valeurs , ordonnées ou non.

  • L’effectif d’une donnée est le nombre de fois où elle apparaît dans cette série.

  • L’effectif total est la somme de tous les effectifs.

  • La fréquence d’une donnée est le quotient de son effectif par l’effectif total.

Julie a regroupé ses dernières notes obtenues en mathématiques : ; ; ; ; .

La série de nombres ci-dessus est une série de données dont l’effectif total est . L’effectif de la note est , et sa fréquence est .

Indicateurs statistiques

Moyenne pondérée

Définition

On considère une série statistique constituée de valeurs affectées de coefficients . Alors, la moyenne pondérée de cette série est

Voici les ventes réalisées un samedi par la pizzeria Del Piero.

Prix (en €)
Nombre de pizzas vendues

Calculer le prix moyen des pizzas vendues.


Le prix moyen des pizzas vendues est donc €.

Propriété

On considère une série statistique de moyenne . Soient . Alors :

  • La série statistique a pour moyenne .

  • La série statistique a pour moyenne .

  • La série statistique a pour moyenne .

  1. Un commerçant achète des articles dont le prix moyen est de €. Il les revend en multipliant les prix par pour avoir un bénéfice. Quelle est la nouvelle moyenne des prix de vente ?

  2. Dans un autre magasin, le prix moyen d’un article est de €. Pour liquider son stock, le gérant décide de baisser les prix de tous les articles de €. Quelle est la nouvelle moyenne des prix de vente ?

Écart type

Définition

On considère une série statistique de moyenne .

  • L’écart type de cette série est le nombre

  • Dans le cas où cette série est pondérée par des coefficients , son écart type est égal à

L’écart type d’une série statistique est un indicateur de dispersion de cette série autour de la moyenne. Concrètement, il donne une certaine mesure de l’écart entre les valeurs de la série et la moyenne de celle-ci :

  • plus l’écart type d’une série est petit, plus les valeurs de la série sont concentrées autour de la moyenne, donc plus la série est homogène ;

  • plus l’écart type d’une série est grand, plus les valeurs de la série sont écartées de la moyenne, donc moins la série est homogène.

On considère deux entreprises de employés dans lesquelles le salaire moyen est € :

  • l’entreprise dans laquelle employés gagnent € et employés gagnent € par mois.

  • l’entreprise dans laquelle employés gagnent € et employé gagne € par mois.

  1. Pour chacune des deux entreprises, déterminer l’écart type de la série des salaires.

    1. Entreprise .

    2. Entreprise .

  2. Interpréter la différence entre ces deux écarts-types.



    1. L’écart type est de €.

    2. L’écart type est de €.

  1. On constate que l’écart type des salaires de l’entreprise est beaucoup moins élevé (environ fois moins) que celui de l’entreprise : cela indique que la grille des salaires est plus homogène dans l’entreprise . Les employés de l’entreprise ont globalement des salaires proches du salaire moyen, €, alors que dans l’entreprise , les salaires sont éloignés de € (soit plus bas, soit plus haut).

Quartiles

Définition

  • Le premier quartile d’une série statistique est la plus petite valeur de la série telle qu’au moins % des valeurs de la série lui soient inférieures ou égales.

  • La médiane d’une série statistique est la plus petite valeur de la série telle qu’au moins % des valeurs de la série lui soient inférieures ou égales.

  • Le troisième quartile d’une série statistique est la plus petite valeur de la série telle qu’au moins % des valeurs de la série lui soient inférieures ou égales.

tikzpicture-1

Pour déterminer ces indicateurs, on a souvent recours aux effectifs cumulés croissants. Pour une donnée, il s’agit du nombre de valeurs inférieures ou égales à sa valeur.

Un service de streaming vidéo a mené une enquête portant sur comptes répartis selon le nombre d’utilisateurs. Les résultats sont donnés ci-dessous.

Nombre d’utilisateurs
Effectif
Effectifs cumulés croissants
  1. La ligne Effectifs cumulés croissants n’est remplie que partiellement. Compléter les cellules restantes.

    1. Quel est l’effectif total de la série ?

    2. Calculer les indicateurs suivants.

      • Médiane.

      • Premier quartile.

      • Troisième quartile.

  1. Nombre d’utilisateurs
    Effectif
    Effectifs cumulés croissants
    1. L’effectif total de cette série est .

      • : la médiane est la e valeur. C’est .

      • : le premier quartile est la e valeur. C’est .

      • : le troisième quartile est la e valeur. C’est .

Définition

L’écart interquartile d’une série est la différence entre son troisième et son premier quartile.

Il s’agit là encore d’un indicateur de dispersion. Plus cet écart est petit, plus les valeurs de la série qui sont dans l’intervalle sont proches les unes des autres. Les valeurs en dehors de n’ont pas d’influence sur celui-ci.

On donne le tableau résumant les temps d’entraînement, en secondes, d’un coureur sur m sur deux mois.

Mois Premier quartile Médiane Troisième quartile
Mois
Mois

Calculer les écarts interquartiles correspondants, et interpréter la différence.




Pour le premier mois, l’écart interquartile vaut Et pour le deuxième mois, l’écart interquartile vaut Il est passé de sec à sec : on peut dire que le coureur a gagné en régularité.

Notons également que le premier quartile du premier mois est égal à la médiane du deuxième mois : sec. Cela veut dire qu’il court sec ou moins environ % des courses le premier mois, et environ % des courses le second mois. Il a donc amélioré ses résultats.