Plus une méthode statistique est simple, plus elle est efficace parce que tout le monde comprend les résultats. Le plus simple finalement, ce sont les représentations graphiques. Le seul inconvénient des méthodes graphiques, c’est qu’elles prennent beaucoup de place.
Nous verrons successivement comment représenter graphiquement la distribution de variables qualitatives puis de variables quantitatives. Nous verrons plus précisément:
Pour la démonstration nous utilisons le fichier smp (santé mentale en prison), cette étude réalisée en 2004 a porté sur 799 détenus masculins tirés au sort dans les prisons de France métropolitaine. Nous avons récupéré un extrait de 9 variables dont:
Pour charger les données dans R:
# Afficher le répertoire de travail getwd() # Modifier le répertoire de travail setwd("~/dev/R") # Charger les données du fichier smp1.csv smp.c <- read.csv2("smp1.csv") # Valider l'importation des données str(smp.c) 'data.frame': 799 obs. of 9 variables: $ age : int 31 49 50 47 23 34 24 52 42 45 ... $ prof : Factor w/ 8 levels "agriculteur",..: 3 NA 7 6 8 6 3 2 6 6 ... $ dep.cons : int 0 0 0 0 1 0 1 0 1 0 ... $ scz.cons : int 0 0 0 0 0 0 0 0 0 0 ... $ grav.cons: int 1 2 2 1 2 1 5 1 5 5 ... $ n.enfant : int 2 7 2 0 1 3 5 2 1 2 ... $ rs : int 2 2 2 2 2 1 3 2 3 2 ... $ ed : int 1 2 3 2 2 2 3 2 3 2 ... $ dr : int 1 1 2 2 2 1 2 2 1 2 ...