# Grammatilised tunnused grammatical_feats = ['compounds', 'A' ,'D', 'I', 'J', 'K', 'N', 'P', 'S', 'S_Prop', 'V', 'n_cases', 'Nom', 'Gen', 'Par', 'Add', 'Ill', 'AddIll', 'Ine', 'Ela', 'Allative', 'Ade', 'Abl', 'Tra', 'Ter', 'Ess', 'Abe', 'Com', 'Plur', 'S_cases', 'S_Nom', 'S_Gen', 'S_Par', 'S_Add', 'S_Ill', 'S_AddIll', 'S_Ine', 'S_Ela', 'S_All', 'S_Ade', 'S_Abl', 'S_Tra', 'S_Ter', 'S_Ess', 'S_Abe', 'S_Com', 'S_Plur', 'A_cases', 'A_Nom', 'A_Gen', 'A_Par', 'A_Ill', 'A_Ine', 'A_Ela', 'A_All', 'A_Ade', 'A_Abl', 'A_Tra', 'A_Ter', 'A_Ess', 'A_Abe', 'A_Com', 'A_Sing', 'A_Plur', 'A_Pos', 'A_Cmp', 'A_Sup', 'P_cases', 'P_Nom', 'P_Gen', 'P_Par', 'P_Ill', 'P_Ine', 'P_Ela', 'P_All', 'P_Ade', 'P_Abl', 'P_Tra', 'P_Ter', 'P_Ess', 'P_Abe', 'P_Com', 'P_Plur', 'P_Prs', 'P_Reflex', 'P_Dem', 'P_Ind', 'P_IntRel', 'P_Rcp', 'V_Fin', 'V_Ind', 'V_Cnd', 'V_Imp', 'V_Prs1', 'V_Prs2', 'V_Prs3', 'V_Pres', 'V_Past', 'V_Sing', 'V_Plur', 'V_Neg', 'V_Pass', 'V_NonFin', 'V_Inf', 'V_Part', 'V_Conv', 'J_Crd', 'J_Sub', 'K_Prep', 'K_Post'] # Sõnavara tunnused lexical_feats = ['lemma_count', 'TTR', 'RTTR', 'Uber' , 'Maas', 'CVV', 'LD', 'SV_ratio', 'Findex', 'A_TTR', 'D_TTR', 'J_TTR', 'P_TTR', 'S_TTR', 'V_TTR', 'S_abstr', 'rare_5000', 'rare_4000', 'rare_3000', 'rare_2000', 'rare_1000', 'MTLD'] # Teksti keerukuse tunnused complexity_feats = ['word_count', 'sent_count', 'word_len', 'sent_len', 'LIX', 'SMOG', 'F-K', 'poly_ratio', 'syllables'] # Keelevigadega seotud tunnused error_feats = ['spell_error_ratio', 'spell_error_sent_ratio', 'spell_errors_per_sent', 'avg_spell_error_ratio', 'error_word_ratio', 'error_sent_ratio', 'errors_per_word', 'errors_per_sent' ,'avg_error_word_ratio']