library(tidyverse)
## ── Attaching packages ────────────────────────────────────────────────── tidyverse 1.3.0 ──
## ✓ ggplot2 3.2.1     ✓ purrr   0.3.3
## ✓ tibble  2.1.3     ✓ dplyr   0.8.4
## ✓ tidyr   1.0.2     ✓ stringr 1.4.0
## ✓ readr   1.3.1     ✓ forcats 0.4.0
## ── Conflicts ───────────────────────────────────────────────────── tidyverse_conflicts() ──
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
tekstid <- read_csv("http://www.tlu.ee/~kais/Kvant_digihum/keeletasemed200.csv")
## Parsed with column specification:
## cols(
##   kood = col_character(),
##   eksam = col_character(),
##   keeletase = col_character(),
##   sonad = col_double(),
##   spikkus = col_double(),
##   lpikkus = col_double(),
##   lemmad = col_double(),
##   yld_kaanded = col_double()
## )

Käänete arv keeleoskustasemeti:

tekstid %>% 
  group_by(keeletase) %>% 
  summarise(kaanded_kesk=mean(yld_kaanded), kaanded_min=min(yld_kaanded), kaanded_maks=max(yld_kaanded))
## # A tibble: 4 x 4
##   keeletase kaanded_kesk kaanded_min kaanded_maks
##   <chr>            <dbl>       <dbl>        <dbl>
## 1 A2                6.35           4           10
## 2 B1                8.18           5           12
## 3 B2                9.08           7           13
## 4 C1               10.8            9           13

A2-taseme eksamite võrdlus:

tekstid %>% 
     filter(keeletase=="A2") %>%
     group_by(eksam) %>% 
     summarise_if(is.numeric, c(kesk=mean))
## # A tibble: 4 x 6
##   eksam    sonad_kesk spikkus_kesk lpikkus_kesk lemmad_kesk yld_kaanded_kesk
##   <chr>         <dbl>        <dbl>        <dbl>       <dbl>            <dbl>
## 1 2018_I         50           5.01         5.59        35.3             6.87
## 2 2018_II        47.6         4.61         6.36        35.1             6.4 
## 3 2018_III       44.3         4.64         5.54        32.1             6   
## 4 2018_IV        44.9         5.28         5.64        29.9             6.13

B1-taseme eksamite võrdlus:

tekstid %>% 
     filter(keeletase=="B1") %>%
     group_by(eksam) %>% 
     summarise_if(is.numeric, c(kesk=mean))
## # A tibble: 4 x 6
##   eksam    sonad_kesk spikkus_kesk lpikkus_kesk lemmad_kesk yld_kaanded_kesk
##   <chr>         <dbl>        <dbl>        <dbl>       <dbl>            <dbl>
## 1 2018_I        123.          4.65         9.17        64.7             8.67
## 2 2018_II       103.          4.82         6.91        62.9             7.8 
## 3 2018_III       99.2         5.57         7.51        59.5             8.6 
## 4 2018_IV       105.          5.43         8.62        59.7             7.67

B2-taseme eksamite võrdlus:

tekstid %>% 
     filter(keeletase=="B2") %>%
     group_by(eksam) %>% 
     summarise_if(is.numeric, c(kesk=mean))
## # A tibble: 4 x 6
##   eksam    sonad_kesk spikkus_kesk lpikkus_kesk lemmad_kesk yld_kaanded_kesk
##   <chr>         <dbl>        <dbl>        <dbl>       <dbl>            <dbl>
## 1 2018_I         170.         5.23         10.6        96.7             9.87
## 2 2018_II        161.         5.37         11.0        94               8.27
## 3 2018_III       162.         5.21         11.2        89.2             9.07
## 4 2018_IV        170.         5.35         13.1        96               9.13

C1-taseme eksamite võrdlus:

tekstid %>% 
     filter(keeletase=="C1") %>%
     group_by(eksam) %>% 
     summarise_if(is.numeric, c(kesk=mean))
## # A tibble: 8 x 6
##   eksam    sonad_kesk spikkus_kesk lpikkus_kesk lemmad_kesk yld_kaanded_kesk
##   <chr>         <dbl>        <dbl>        <dbl>       <dbl>            <dbl>
## 1 2017_I         263.         6.54         14.5        169              11  
## 2 2017_II        267.         6.29         12.8        154              12  
## 3 2017_III       270.         6.52         12.7        152.             10.4
## 4 2017_IV        258.         5.90         11.8        134.              9.8
## 5 2018_I         264.         5.91         15.7        136              11  
## 6 2018_II        240.         6.36         13.3        144              10.4
## 7 2018_III       252.         6.37         13.5        152.             11  
## 8 2018_IV        251          6.32         12.1        138.             10.6