Ateliers R Trucs et Astuces

1/3/26 · Ex = la fonction `select()` sélectionne des colonnes, la fonction `filter()` filtre les données par colonne.

library(starwarsdb)

people <- starwarsdb::people
people %>%
  slice(1:2)
people %>%
  slice(1:2) %>%
  select(name, height, mass)
ma_selection <- people %>%
  slice(1:2) %>%
  select(name, height, mass, species, gender, homeworld)
ma_selection %>%
  slice(1) %>%
  select(name, species, gender, height, mass, homeworld)
ma_selection %>%
  slice(1) %>%
  select(species, everything())
ma_selection %>%
  relocate(gender, .before=height)
people %>%
  dplyr::select(name, height, mass) %>%
  rename(nom = name,
         taille = height,
         poids = mass) %>%
  slice(1:7)
people %>%
  dplyr::select(name, height, mass) %>%
  filter(height > 200,
         between(mass, 120,150))
people %>%
  dplyr::select(name, height, mass) %>%
  filter(is.na(height))
people %>%
  dplyr::select(name, height, mass) %>%
  arrange(height) %>%
  slice(1:2)
people %>%
  dplyr::select(name, height, mass) %>%
  arrange(desc(height)) %>%
  slice(1:2)
people %>%
  dplyr::select(name, height, mass) %>%
  mutate(imc = mass/(height/100)^2) %>%
  slice(1:10)
people %>%
  summarise(nbre_individu = n_distinct(name),
            poids_moyen = mean(mass, na.rm = T),
            poids_mediant = median(mass, na.rm = T),
            poids_sd = sd(mass, na.rm = T)) %>%
  slice(1:10)
people %>%
  group_by(species) %>%
  summarise(nbre_individu = n_distinct(name),
            poids_moyen = mean(mass, na.rm = T),
            poids_mediant = median(mass, na.rm = T),
            poids_sd = sd(mass, na.rm = T)) %>%
  arrange(desc(nbre_individu)) %>%
  slice(1:5)
people %>%
  dplyr::select(name, species, mass) %>%
  group_by(species) %>%
  mutate(nbre_individu = n_distinct(name),
            poids_moyen = mean(mass, na.rm = T),
            poids_mediant = median(mass, na.rm = T),
            poids_sd = sd(mass, na.rm = T)) %>%
  ungroup() %>%
  slice(1:4)
people %>%
  dplyr::select(name, species, mass) %>%
  group_by(species) %>%
  filter(mass == max(mass)) %>%
  ungroup() %>%
  slice(1:4)
people %>%
  distinct(species) %>%
  pull()
 [1] "Human"          "Droid"          "Wookie"         "Rodian"        
 [5] "Hutt"           "Yoda's species" "Trandoshan"     "Mon Calamari"  
 [9] "Ewok"           "Sullustan"      "Neimodian"      "Gungan"        
[13] "Toydarian"      "Dug"            "Zabrak"         "Twi'lek"       
[17] "Aleena"         "Vulptereen"     "Xexto"          "Toong"         
[21] "Cerean"         "Nautolan"       "Tholothian"     "Iktotchi"      
[25] "Quermian"       "Kel Dor"        "Chagrian"       "Geonosian"     
[29] "Mirialan"       "Clawdite"       "Besalisk"       "Kaminoan"      
[33] "Skakoan"        "Muun"           "Togruta"        "Kaleesh"       
[37] "Pau'an"        
people %>%
  arrange(mass) %>%
  dplyr::select(name, species) %>%
  mutate(species = recode(species, "Human" = "H", "Yoda's species" = "Y")) %>%
    slice(1:10)
people %>%
  arrange(mass) %>%
  dplyr::select(name, species) %>%
  mutate(species = recode(species, "Human" = "H", "Yoda's species" = "Y", .default = "Autre")) %>%
  slice(1:10)
people %>%
  dplyr::select(name, height) %>%
  mutate(categorie = case_when(
    height < quantile(height, 0.25, na.rm = T) ~ "petit",
    between(height, quantile(height, 0.25, na.rm = T), quantile(height, 0.75, na.rm = T)) ~ "moyen",
    height >= quantile(height, 0.75, na.rm = T) ~ "grand",
    TRUE ~"indefini")) %>%
  slice(1:8)
starwarsdb::planets %>%
  slice(1:2)
people %>%
  dplyr::select(name, height, mass, homeworld) %>%
  slice(1:2)
people %>%
  dplyr::select(name, height, mass, homeworld) %>%
  left_join(starwarsdb::planets %>%
              select(name, population), by= join_by(homeworld == name))
people %>%
  dplyr::select(name, height, mass) %>%
  pivot_longer(cols = c(height, mass), names_to = "indice", values_to ="valeur") %>%
  arrange(name)
people %>%
  dplyr::select(homeworld, sex) %>% 
  group_by(homeworld, sex) %>%
  summarize(n = n()) %>%
  ungroup() %>%
  pivot_wider(names_from = sex, values_from = n) %>%
  arrange(desc(male)) %>%
  filter(!is.na(homeworld)) %>%
  slice(1:8)

name	height	mass	hair_color	skin_color	eye_color	birth_year	gender	homeworld	species	sex
Luke Skywalker	172	77	blond	fair	blue	19	masculine	Tatooine	Human	male
C-3PO	167	75	NA	gold	yellow	112	masculine	Tatooine	Droid	none

name	height	mass
Luke Skywalker	172	77
C-3PO	167	75

nom	taille	poids
Luke Skywalker	172	77
C-3PO	167	75
R2-D2	96	32
Darth Vader	202	136
Leia Organa	150	49
Owen Lars	178	120
Beru Whitesun lars	165	75

name	height	mass
Darth Vader	202	136
Tarfful	234	136

name	height	mass
Yarael Poof	264	NA
Tarfful	234	136

name	height	mass	imc
Luke Skywalker	172	77	26.02758
C-3PO	167	75	26.89232
R2-D2	96	32	34.72222
Darth Vader	202	136	33.33007
Leia Organa	150	49	21.77778
Owen Lars	178	120	37.87401
Beru Whitesun lars	165	75	27.54821
R5-D4	97	32	34.00999
Biggs Darklighter	183	84	25.08286
Obi-Wan Kenobi	182	77	23.24598

Fonction	Code
Moyenne	`mean()`
Médiane	`median()`
Ecart-type	`sd()`
Minimum	`min()`
Maximum	`max()`
Valeur de la première valeur	`first()`

Fonction	Code
Valeur de la dernière valeur	`last()`
Nombre de lignes	`n()`
Nombre de valeurs distinctes	`n_distinct()`
Somme	`sum()`
Somme cumulée	`cumsum()`

species	nbre_individu	poids_moyen	poids_mediant	poids_sd
Human	35	81.26957	79.0	20.278928
Droid	5	69.75000	53.5	51.031853
Gungan	3	74.00000	74.0	11.313709
Kaminoan	2	88.00000	88.0	NA
Mirialan	2	53.10000	53.1	4.384062

name	species	mass
Greedo	Rodian	74
Jabba Desilijic Tiure	Hutt	1358
Yoda	Yoda’s species	17
Bossk	Trandoshan	113

name	species
Ratts Tyerel	Aleena
Yoda	Y
Wicket Systri Warrick	Ewok
R2-D2	Droid
R5-D4	Droid
Sebulba	Dug
Padmé Amidala	H
Dud Bolt	Vulptereen
Wat Tambor	Skakoan
Sly Moore	H

name	species
Ratts Tyerel	Autre
Yoda	Y
Wicket Systri Warrick	Autre
R2-D2	Autre
R5-D4	Autre
Sebulba	Autre
Padmé Amidala	H
Dud Bolt	Autre
Wat Tambor	Autre
Sly Moore	H

name	height	categorie
Luke Skywalker	172	moyen
C-3PO	167	moyen
R2-D2	96	petit
Darth Vader	202	grand
Leia Organa	150	petit
Owen Lars	178	moyen
Beru Whitesun lars	165	petit
R5-D4	97	petit

name	rotation_period	orbital_period	diameter	climate	gravity	terrain	surface_water	population
Tatooine	23	304	10465	arid	1 standard	desert	1	2e+05
Alderaan	24	364	12500	temperate	1 standard	grasslands, mountains	40	2e+09

name	height	mass	homeworld	population
Luke Skywalker	172	77	Tatooine	2.0e+05
C-3PO	167	75	Tatooine	2.0e+05
R2-D2	96	32	Naboo	4.5e+09
Darth Vader	202	136	Tatooine	2.0e+05
Leia Organa	150	49	Alderaan	2.0e+09
Owen Lars	178	120	Tatooine	2.0e+05
Beru Whitesun lars	165	75	Tatooine	2.0e+05
R5-D4	97	32	Tatooine	2.0e+05

Organisation
Utilisation générale
Les principales fonctions `dplyr`
Graphiques avec `ggplot2` et `palmerpenguins`
Et pleins d’exercices !

Les différentes familles de fonction
Remodeler ses données avec `rename`, `relocate`, `spread`, `gather`, et `arrange`
Trier ses données `select`, `filter`, `distinct`, `slice` et `sample_n`
Créer de nouvelles variables avec `mutate`
Synthétiser ses données avec `summarize` et `group_by`
Recoder ses données avec `recode`, `case_when`
Réaliser des jointures entre tables avec `left_join`, `right_join`, `inner_join`, `full_join`

name	indice	valeur
Ackbar	height	180
Ackbar	mass	83
Adi Gallia	height	184
Adi Gallia	mass	50
Anakin Skywalker	height	188
Anakin Skywalker	mass	84
Arvel Crynyd	height	NA
Arvel Crynyd	mass	NA

homeworld	female	male	none	hermaphroditic
Naboo	3	7	1	NA
Tatooine	2	6	2	NA
Alderaan	1	2	NA	NA
Corellia	NA	2	NA	NA
Kamino	1	2	NA	NA
Kashyyyk	NA	2	NA	NA
Aleen Minor	NA	1	NA	NA
Bespin	NA	1	NA	NA

Ateliers R Trucs et Astuces

Utilisation générale

Packages nécessaires

Utilisation générale

Utilisation générale

SELECT

SELECT

SELECT

SELECT

SELECT

RELOCATE

RELOCATE

RENAME

FILTER

FILTER

ARRANGE

ARRANGE

A VOUS DE CODER

MUTATE

MUTATE

SUMMARISE

SUMMARISE

GROUP_BY

GROUP_BY + SUMMARIZE

GROUP_BY + MUTATE

GROUP_BY + FILTER

A VOUS DE CODER

RECODE

RECODE

RECODE

RECODE

CASE_WHEN

CASE_WHEN

DISTINCT

A VOUS DE CODER

Les jointures

Les jointures

Les jointures

PIVOT_LONGER

PIVOT_LONGER

PIVOT_WIDER

PIVOT_WIDER

A VOUS DE CODER

Resources