-
Notifications
You must be signed in to change notification settings - Fork 0
Expand file tree
/
Copy pathstats.xml
More file actions
129 lines (129 loc) · 12.5 KB
/
stats.xml
File metadata and controls
129 lines (129 loc) · 12.5 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
<?xml version="1.0" encoding="UTF-8"?>
<treebank>
<!-- tokens means "surface tokens", e.g. Spanish "vámonos" counts as one token
words means "syntactic words", e.g. Spanish "vámonos" is split to two words, "vamos" and "nos"
fused is the number of tokens that are split to two or more syntactic words
The words and fused elements can be omitted if no token is split to smaller syntactic words. -->
<size>
<total><sentences>540</sentences><tokens>5733</tokens><words>5926</words><fused>193</fused></total>
<train><sentences>0</sentences><tokens>0</tokens><words>0</words><fused>0</fused></train>
<dev><sentences>0</sentences><tokens>0</tokens><words>0</words><fused>0</fused></dev>
<test><sentences>540</sentences><tokens>5733</tokens><words>5926</words><fused>193</fused></test>
</size>
<lemmas unique="1111" /><!-- η, ., ,, ιγώ, τσι, να, μ, σι, δεν, έχου, είμι, λέγου, απού, που, ένας -->
<forms unique="1984" /><!-- ., ,, του, να, τα, σ, τσι, τ’, το, η, απ’, μ’, θα, δεν, που -->
<fusions unique="86" /><!-- στου, στο, στα, στ’, στη, στς, γιεμ, κουρούδαμ, κόρημ, μπάτσι, πας, στον, στουν, στους, στ’ν -->
<!-- Statistics of universal POS tags. The comments show the most frequent lemmas. -->
<tags unique="16">
<tag name="ADJ">155</tag><!-- καλός, μιγάλους, δκός, καημένους, κακός, άγιους, μαύρους, Τούρκους, μκρός, ξένους -->
<tag name="ADP">296</tag><!-- σι, απού, για, μι, απί, μέσα, μέχρ, κατά, προς, παρά -->
<tag name="ADV">323</tag><!-- που, πουλύ, τώρα, πια, πιο, κουμμάτ, πάνου, πέρα, ύστιρα, μέσα -->
<tag name="AUX">190</tag><!-- είμι, θα, να, έχου, ας -->
<tag name="CCONJ">253</tag><!-- τσι, αλλά, κι, όμους, ούτι, άρα, δλαδή, μα, ή, και -->
<tag name="DET">906</tag><!-- η, ένας, αυτός, ούλους, εύτους, κανένας, ου, άλλους, έγιουτους, πουλύς -->
<tag name="INTJ">99</tag><!-- ε, μουρός, όχ, ναι, βρε, α, άγι, ω, αχ, βουρός -->
<tag name="NOUN">788</tag><!-- σπίτ, χουριό, άνθρουπους, μουρό, μάνα, μέρα, χρόνους, γναίκα, πράμα, χέρ -->
<tag name="NUM">55</tag><!-- ένας, δύου, τρία, 100, 1912, 9, 12, 120, 13, 17 -->
<tag name="PART">125</tag><!-- δεν, μην, όχ, να, μπα, δα, δλαδή, μπας -->
<tag name="PRON">461</tag><!-- ιγώ, μ, που, τι, ποιος, τις, μι -->
<tag name="PROPN">154</tag><!-- Γιάννς, Καλλουνή, Μυτιλήν, Ρουζαλία, θιός, Ανθή, Απουστόλς, Ατζιλικό, Δησέφς, Μπουτέλ -->
<tag name="PUNCT">900</tag><!-- ., ,, ;, !, -, «, », ..., :, ( -->
<tag name="SCONJ">236</tag><!-- να, άμα, γιατί, πους, που, ότ, αφού, μόλς, σαν, τι -->
<tag name="VERB">977</tag><!-- έχου, λέγου, κάνου, πγαίνου, έρχουμι, βλέπου, ξέρου, θέλου, παίρνου, γίνουμι -->
<tag name="X">8</tag><!-- _, 1916, Facebook, αναδράμου, εις, κουμπγιούτερ, υγείαν -->
</tags>
<!-- Statistics of features and values. The comments show the most frequent word forms. -->
<feats unique="49">
<feat name="Aspect" value="Imp" upos="AUX,VERB">567</feat><!-- ήνταν, είχε, έχ’, ήταν, είνι, λέει, έχουν, είν’, έπρεπε, είχαν -->
<feat name="Aspect" value="Perf" upos="VERB">459</feat><!-- έλα, πάρ’, πω, ήρτι, είπε, είπι, κάνου, κάν’, κάτσι, πήγι -->
<feat name="Case" value="Acc" upos="ADJ,DET,INTJ,NOUN,NUM,PRON,PROPN,SCONJ,VERB">1454</feat><!-- του, τα, το, τ’, τουν, τι, μια, ένα, αυτό, μι -->
<feat name="Case" value="Gen" upos="ADJ,DET,NOUN,PRON,PROPN">235</feat><!-- μ’, τ’, μας, σ’, τ’ς, μ, τς, ντ, ιμ, ς -->
<feat name="Case" value="Nom" upos="ADJ,DET,INTJ,NOUN,NUM,PRON,PROPN,SCONJ,VERB">781</feat><!-- η, του, τα, γη, οι, γιου, το, μάνα, που, ένας -->
<feat name="Case" value="Voc" upos="ADJ,INTJ,NOUN,PROPN">61</feat><!-- μουρή, γιε, μάνα, Ρουζαλία, βουρή, θρώπ’, κυρά, μουρ, μουρά, Αγιά -->
<feat name="Definite" value="Def" upos="DET">672</feat><!-- του, τα, η, τ’, το, γη, οι, τουν, γιου, τ’ς -->
<feat name="Definite" value="Ind" upos="DET">40</feat><!-- μια, ένα, ένας, έναν, έν’, καμιά -->
<feat name="Degree" value="Aug" upos="ADJ,ADV,NOUN">14</feat><!-- πουρνό, ταχτέρ, άνια, ίσια, γύρου, λίγα, μπέλι, μπούτσια, παλιουπουτανάρα, χειρούκλις -->
<feat name="Degree" value="Cmp" upos="ADV">12</feat><!-- πιο -->
<feat name="Degree" value="Dim" upos="ADV,NOUN,PROPN">41</feat><!-- Μπουτέλ, Ατζιλικό, κουρούδα, Ασπασέλ’, Ατζιλικο, Γληγουρέλ’, Κατιρίνη, Μαριγώ, Ν’κουλέλ’, Ξινέλ’ -->
<feat name="ExtPos" value="ADP" upos="ADP,ADV,VERB">24</feat><!-- μες, πάν’, ίσια, μέσα, πα, πριν, Ύστιρα, Απάνου, ανάμισα, απ -->
<feat name="ExtPos" value="ADV" upos="ADJ,ADV,NUM,PART,SCONJ">13</feat><!-- άλλου, μπά, 100, Λίγου, Μπα, Σαν, Σιγά, καλού, μες, μο -->
<feat name="ExtPos" value="CCONJ" upos="ADV">1</feat><!-- ακόμα -->
<feat name="ExtPos" value="INTJ" upos="X">1</feat><!-- Εις -->
<feat name="ExtPos" value="SCONJ" upos="ADP,SCONJ">13</feat><!-- για, παρόλο, που -->
<feat name="Gender" value="Fem" upos="ADJ,DET,INTJ,NOUN,NUM,PRON,PROPN,VERB">647</feat><!-- η, τ’, μια, τ’ς, τς, γη, μάνα, μέρα, τν, τ’ν -->
<feat name="Gender" value="Masc" upos="ADJ,DET,INTJ,NOUN,NUM,PRON,PROPN,VERB">628</feat><!-- του, τ’, τουν, η, οι, γιου, τον, ένας, ο, γη -->
<feat name="Gender" value="Neut" upos="ADJ,DET,INTJ,NOUN,NUM,PRON,PROPN,SCONJ,VERB">1061</feat><!-- του, τα, το, τ’, τι, αυτό, ούλα, ένα, σπίτ’, μουρό -->
<feat name="Mood" value="Imp" upos="VERB">47</feat><!-- έλα, κάτσι, Σώπα, άγι, βάλι, πάνι, στρώσε, Άκου, Έχε, Ακ’σι -->
<feat name="Mood" value="Ind" upos="AUX,VERB">995</feat><!-- ήνταν, είχε, έχ’, ήταν, είνι, είναι, λέει, έχουν, κάν’, είν’ -->
<feat name="Number" value="Plur" upos="ADJ,AUX,DET,INTJ,NOUN,NUM,PRON,PROPN,VERB">818</feat><!-- τα, μας, οι, ούλα, δυο, τς, έχουν, τ’ς, χρόνια, που -->
<feat name="Number" value="Sing" upos="ADJ,AUX,DET,INTJ,NOUN,NUM,PRON,PROPN,SCONJ,VERB">2756</feat><!-- του, τ’, το, η, μ’, τουν, τι, μια, ήνταν, γη -->
<feat name="NumType" value="Card" upos="NUM">53</feat><!-- δυο, ένα, μια, 100, τρία, 1912, 9, 12, 120, 13 -->
<feat name="Person" value="1" upos="AUX,PRON,VERB">363</feat><!-- μ’, μας, μι, μ, γω, ιμ, ‘γού, ‘μείς, ’γώ, κάνου -->
<feat name="Person" value="2" upos="AUX,PRON,VERB">226</feat><!-- σ’, συ, σι, έλα, ς, λέγ’ς, ξέρ’ς, κάτσι, σ, σας -->
<feat name="Person" value="3" upos="AUX,DET,PRON,VERB">870</feat><!-- τ’, τα, ήνταν, του, είχε, τουν, έχ’, ήταν, το, είνι -->
<feat name="Polarity" value="Neg" upos="INTJ,PART">129</feat><!-- δεν, δε, εν, όχ’, ε, μη, μην, Όχι, Ένι, Όχ -->
<feat name="Polarity" value="Pos" upos="INTJ">11</feat><!-- ναι -->
<feat name="Poss" value="Yes" upos="PRON">149</feat><!-- μ’, τ’, μας, μ, σ’, ντ, ιμ, ς, τ’ς, ντουν -->
<feat name="PronType" value="Art" upos="DET">712</feat><!-- του, τα, η, τ’, το, γη, οι, μια, τουν, γιου -->
<feat name="PronType" value="Dem" upos="ADV,DET">89</feat><!-- αυτό, αυτός, φτος, έγιουτα, έφτου, έφτα, αυτή, τούτους, φκοι, Φτη -->
<feat name="PronType" value="Ind" upos="ADV,DET">35</feat><!-- άλλου, πουλλά, πουλύ, άλλους, κάκ’, κάτ’, κανέ, που, άλλα, άλλο -->
<feat name="PronType" value="Int" upos="ADV,DET,PRON,SCONJ">62</feat><!-- τι, πού, πότι, γιατί, πώς, τίλιγια, τί, Ποια, Τίλια, Τις -->
<feat name="PronType" value="Neg" upos="ADV,DET">21</feat><!-- κανείς, καμιά, κανέναν, τίπουτα, κάνα, κίποτα, καμιάν, κανέ, κανένας, ντου -->
<feat name="PronType" value="Prs" upos="PRON">407</feat><!-- μ’, τ’, τα, μας, του, τουν, σ’, μι, το, μ -->
<feat name="PronType" value="Rel" upos="ADV,DET,PRON,SCONJ">52</feat><!-- που, π’, ό,τ’, πού, όπως, όποιους, Όσις, Όσου, όποιος, όσα -->
<feat name="PronType" value="Tot" upos="ADV,DET">43</feat><!-- ούλα, ούλου, ούλ’, πάντα, ούλ, κάθι, ουλ’, κάθα, κάθε, καθένας -->
<feat name="Style" value="Arch" upos="X">1</feat><!-- αναδράμου -->
<feat name="Tense" value="Fut" upos="AUX">51</feat><!-- θα, α -->
<feat name="Tense" value="Past" upos="AUX,VERB">491</feat><!-- ήνταν, είχε, ήταν, έπρεπε, είχαν, έπρεπ’, ήρτι, είπε, είπι, είχι -->
<feat name="Tense" value="Pres" upos="AUX,VERB">330</feat><!-- έχ’, είνι, είναι, λέει, έχουν, είν’, είμαι, λέγ’ς, ξέρ’ς, θέλου -->
<feat name="Typo" value="Yes" upos="ADJ,ADP,ADV,AUX,CCONJ,DET,INTJ,NOUN,PART,PRON,PROPN,SCONJ,VERB">215</feat><!-- πού, τσ’, ’γώ, γη, τό, γι, ι, κουμάτ, μέσ’, ν-τουν -->
<feat name="VerbForm" value="Conv" upos="VERB">3</feat><!-- γιλώντας, κλέγουντας, τραγδώντας -->
<feat name="VerbForm" value="Fin" upos="AUX,VERB">1042</feat><!-- ήνταν, είχε, έχ’, ήταν, είνι, είναι, λέει, έχουν, κάν’, έλα -->
<feat name="VerbForm" value="Inf" upos="VERB">7</feat><!-- ακούσ’, διαβάσ’, μείν’, πάει, πάρ’, πέρνη, φύγ’ -->
<feat name="VerbForm" value="Part" upos="VERB">19</feat><!-- Ευχαριστημέν’, Παντρεμένος, αγαπμέν, αγισμένους, γεννμέν’, καμωμένα, καμωμένο, λαδουμένου, λοιμ’τσιασμένους, μιτσ’μένους -->
<feat name="Voice" value="Act" upos="AUX,VERB">828</feat><!-- είχε, έχ’, λέει, έχουν, κάν’, έπρεπε, είχαν, κάνου, λέγ’ς, ξέρ’ς -->
<feat name="Voice" value="Pass" upos="AUX,VERB">242</feat><!-- ήνταν, ήταν, είνι, είναι, έλα, είν’, είμαι, ήρτι, κάτσι, ένι -->
</feats>
<!-- Statistics of universal dependency relations. -->
<deps unique="39">
<dep name="acl">2</dep>
<dep name="acl:relcl">36</dep>
<dep name="advcl">132</dep>
<dep name="advcl:relcl">8</dep>
<dep name="advmod">355</dep>
<dep name="amod">61</dep>
<dep name="appos">21</dep>
<dep name="aux">90</dep>
<dep name="case">283</dep>
<dep name="cc">251</dep>
<dep name="ccomp">78</dep>
<dep name="compound">3</dep>
<dep name="compound:redup">13</dep>
<dep name="conj">217</dep>
<dep name="cop">89</dep>
<dep name="csubj">18</dep>
<dep name="det">806</dep>
<dep name="discourse">98</dep>
<dep name="dislocated">9</dep>
<dep name="expl">45</dep>
<dep name="fixed">62</dep>
<dep name="flat">7</dep>
<dep name="goeswith">2</dep>
<dep name="iobj">30</dep>
<dep name="mark">221</dep>
<dep name="nmod">196</dep>
<dep name="nsubj">335</dep>
<dep name="nsubj:pass">8</dep>
<dep name="nummod">34</dep>
<dep name="obj">435</dep>
<dep name="obl">304</dep>
<dep name="obl:agent">1</dep>
<dep name="orphan">12</dep>
<dep name="parataxis">128</dep>
<dep name="punct">900</dep>
<dep name="reparandum">4</dep>
<dep name="root">540</dep>
<dep name="vocative">45</dep>
<dep name="xcomp">47</dep>
</deps>
</treebank>