MetMat

Comment calculer les indicateurs statistiques d'un échantillon en Python ?

En chargeant un fichier csv via pandas.read_csv puis en utilisant describe, head, shape, sort_values sur le DataFrame

L'objectif

Charger un fichier csv, visualiser les premières lignes, calculer un résumé statistique et trier les données avec pandas.

Le principe

pandas.read_csv renvoie un DataFrame ; df.shape donne (n, p), df.head() affiche les premières lignes, df.describe() renvoie pour chaque colonne numérique count,mean,std,min,Q1,median,Q3,max\mathrm{count}, \mathrm{mean}, \mathrm{std}, \min, Q_1, \mathrm{median}, Q_3, \max, et df.sort_values(by=...) trie selon une colonne.

La méthode
  1. 1
    J'importe pandas : import pandas as pd.
  2. 2
    Je charge le fichier : df = pd.read_csv('fichier.csv').
  3. 3
    J'explore : df.shape (taille), df.head() (5 premières lignes), df.columns (noms).
  4. 4
    J'applique df.describe() pour le résumé statistique et df.sort_values(by='col') pour trier.

Exemple corrigé

Difficulté croissante de 1 à 3

Exercices aujourd'hui0 / 3

Prêt à t'entraîner ?

Génère un exercice personnalisé sur cette méthode et entraîne-toi avec la correction IA.