Accueil > R et RStudio > Etude d’une variable quantitative avec R

Etude d’une variable quantitative avec R

jeudi 2 octobre 2014, par Denis LE FUR

Un fichier de données

Travaillons sur une enquête de satisfactions dans un hôpital, récupéré lors d’un cours de FUN (France Unité Numérique). Les fichiers sont disponibles ici.

Par la suite, ces données seront stockées dans la variable satis .

Dans ces données comme souvent, les observations sont en lignes et les variables en colonnes.

La commande summary

Cette commande peut s’appliquer à un tableau de données (data frame) comme à une seule variable.

   service           sexe             age          profession    amelioration.sante
Min.   :1.000   Min.   :0.0000   Min.   :18.00   Min.   :1.000   Min.   :0.000    
1st Qu.:3.000   1st Qu.:0.0000   1st Qu.:45.00   1st Qu.:3.000   1st Qu.:2.000    
Median :5.000   Median :0.0000   Median :60.00   Median :4.000   Median :2.000    
Mean   :4.549   Mean   :0.4981   Mean   :58.21   Mean   :4.431   Mean   :2.231    
3rd Qu.:7.000   3rd Qu.:1.0000   3rd Qu.:72.00   3rd Qu.:5.500   3rd Qu.:3.000    
Max.   :8.000   Max.   :1.0000   Max.   :97.00   Max.   :8.000   Max.   :3.000    
                                 NA's   :6       NA's   :107     NA's   :158      
amelioration.moral  recommander    score.relation  score.information
Min.   :0.000      Min.   :0.000   Min.   :13.00   Min.   :13.00    
1st Qu.:1.000      1st Qu.:1.000   1st Qu.:33.00   1st Qu.:28.00    
Median :1.000      Median :2.000   Median :36.00   Median :33.00    
Mean   :1.679      Mean   :1.625   Mean   :35.22   Mean   :31.91    
3rd Qu.:3.000      3rd Qu.:2.000   3rd Qu.:39.00   3rd Qu.:38.00    
Max.   :3.000      Max.   :2.000   Max.   :40.00   Max.   :40.00    
NA's   :151        NA's   :129     NA's   :185     NA's   :176  

Pour l’âge :

  Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's
 18.00   45.00   60.00   58.21   72.00   97.00       6

La commande describe

Cette commande demande charger la librairie prettyR.
Le paramètre num.desc prend la liste des paramètres souhaités :

- mean : moyenne
- sd : écart-type
- median : médiane
- valid.n : nombre de valeurs attribuées (non NA)
- min : minimum
- max : maximum

Description of satis

Numeric
                        mean        sd    median   valid.n       min       max
service                 4.549     2.277         5       534         1         8
sexe                   0.4981    0.5005         0       534         0         1
age                     58.21     17.81        60       528        18        97
profession              4.431      1.75         4       427         1         8
amelioration.sante      2.231    0.7675         2       376         0         3
amelioration.moral      1.679     0.951         1       383         0         3
recommander             1.625    0.5606         2       405         0         2
score.relation          35.22     4.624        36       349        13        40
score.information       31.91     6.793        33       358        13        40

Les quartiles ne sont pas prévus. On peut les rajouter par la création de deux fonctions Q1 et Q3 :

Description of satis

Numeric
                         min        q1    median        q3       max
service                     1         3         5         7         8
sexe                        0         0         0         1         1
age                        18        45        60        72        97
profession                  1         3         4       5.5         8
amelioration.sante          0         2         2         3         3
amelioration.moral          0         1         1         3         3
recommander                 0         1         2         2         2
score.relation             13        33        36        39        40
score.information          13        28        33        38        40

Les commandes séparées

Pour la moyenne :

[1] 58.21212

Pour la médiane :

[1] 60

Pour l’écart-type :

[1] 17.80925

Pour Q1 :

25%
45

Pour Q3 :

75%
72

Pour le minimum :

[1] 18

Pour le maximum :

[1] 97

Pour le nombre de valeurs valides (non NA) :

[1] 528

Pour le nombre de valeurs totales :

[1] 534

NB : la commande valid.n fait partie de la librairie prettyR.

SPIP | | Plan du site | Suivre la vie du site RSS 2.0