library(tidyverse)
## ── Attaching packages ────────────────────────────────────────────────── tidyverse 1.3.0 ──
## ✓ ggplot2 3.2.1 ✓ purrr 0.3.3
## ✓ tibble 2.1.3 ✓ dplyr 0.8.4
## ✓ tidyr 1.0.2 ✓ stringr 1.4.0
## ✓ readr 1.3.1 ✓ forcats 0.4.0
## ── Conflicts ───────────────────────────────────────────────────── tidyverse_conflicts() ──
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
tekstid <- read_csv("http://www.tlu.ee/~kais/Kvant_digihum/keeletasemed200.csv")
## Parsed with column specification:
## cols(
## kood = col_character(),
## eksam = col_character(),
## keeletase = col_character(),
## sonad = col_double(),
## spikkus = col_double(),
## lpikkus = col_double(),
## lemmad = col_double(),
## yld_kaanded = col_double()
## )
Käänete arv keeleoskustasemeti:
tekstid %>%
group_by(keeletase) %>%
summarise(kaanded_kesk=mean(yld_kaanded), kaanded_min=min(yld_kaanded), kaanded_maks=max(yld_kaanded))
## # A tibble: 4 x 4
## keeletase kaanded_kesk kaanded_min kaanded_maks
## <chr> <dbl> <dbl> <dbl>
## 1 A2 6.35 4 10
## 2 B1 8.18 5 12
## 3 B2 9.08 7 13
## 4 C1 10.8 9 13
A2-taseme eksamite võrdlus:
tekstid %>%
filter(keeletase=="A2") %>%
group_by(eksam) %>%
summarise_if(is.numeric, c(kesk=mean))
## # A tibble: 4 x 6
## eksam sonad_kesk spikkus_kesk lpikkus_kesk lemmad_kesk yld_kaanded_kesk
## <chr> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 2018_I 50 5.01 5.59 35.3 6.87
## 2 2018_II 47.6 4.61 6.36 35.1 6.4
## 3 2018_III 44.3 4.64 5.54 32.1 6
## 4 2018_IV 44.9 5.28 5.64 29.9 6.13
B1-taseme eksamite võrdlus:
tekstid %>%
filter(keeletase=="B1") %>%
group_by(eksam) %>%
summarise_if(is.numeric, c(kesk=mean))
## # A tibble: 4 x 6
## eksam sonad_kesk spikkus_kesk lpikkus_kesk lemmad_kesk yld_kaanded_kesk
## <chr> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 2018_I 123. 4.65 9.17 64.7 8.67
## 2 2018_II 103. 4.82 6.91 62.9 7.8
## 3 2018_III 99.2 5.57 7.51 59.5 8.6
## 4 2018_IV 105. 5.43 8.62 59.7 7.67
B2-taseme eksamite võrdlus:
tekstid %>%
filter(keeletase=="B2") %>%
group_by(eksam) %>%
summarise_if(is.numeric, c(kesk=mean))
## # A tibble: 4 x 6
## eksam sonad_kesk spikkus_kesk lpikkus_kesk lemmad_kesk yld_kaanded_kesk
## <chr> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 2018_I 170. 5.23 10.6 96.7 9.87
## 2 2018_II 161. 5.37 11.0 94 8.27
## 3 2018_III 162. 5.21 11.2 89.2 9.07
## 4 2018_IV 170. 5.35 13.1 96 9.13
C1-taseme eksamite võrdlus:
tekstid %>%
filter(keeletase=="C1") %>%
group_by(eksam) %>%
summarise_if(is.numeric, c(kesk=mean))
## # A tibble: 8 x 6
## eksam sonad_kesk spikkus_kesk lpikkus_kesk lemmad_kesk yld_kaanded_kesk
## <chr> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 2017_I 263. 6.54 14.5 169 11
## 2 2017_II 267. 6.29 12.8 154 12
## 3 2017_III 270. 6.52 12.7 152. 10.4
## 4 2017_IV 258. 5.90 11.8 134. 9.8
## 5 2018_I 264. 5.91 15.7 136 11
## 6 2018_II 240. 6.36 13.3 144 10.4
## 7 2018_III 252. 6.37 13.5 152. 11
## 8 2018_IV 251 6.32 12.1 138. 10.6