Етап №3. Аналіз роботи автоматичного морфологічного аналізатора.
Виконання 3 етапу я здійснювала за такими кроками:
Скопіювала файли ukrainian.yaml ukrainian.lex в директорію з програмою kimmo.py;
Переглянула та проаналізувала вміст файлів ukrainian.yaml та ukrainian.lex;
Запустила програму kimmo.py зазначеним нижче способом: в IDLE (Python GUI) виконала наступну послідовність дій:
>>> from kimmo import * >>> k=load("ukrainian.yaml ")
>>> k.gui()
4. Розробила програму морфологічного аналізу всіх граматичних форм наступних слів: рука, ткаля, миша, село, коваль, горіх, піч, лоша, летіти, свистіти, писати, тесати, топтати, радіти, бити, смажити, дружити. Здійснила морфологічний аналіз всіх граматичних форм вказаних слів.
Попередньо у файлі ukrainian.rec зберегла всі граматичні форми.
>>>from kimmo import * >>>k = KimmoRuleSetload('ukraiman.yamV) >>>recfile = open('ukrainian.rec') >>>for line in recfile: line = line.strip() if not line: continue if line.startswith(';'): print line continue
print list(k.recognize(line)), '< = ', line >>>recfile.close()
UKRAINIAN.REC
ruka
gorihiv
pySemo
byty
ruky
goriham
pySete
b'U
ruci
gorihamy
pySutB
b'ES
ruku
gorihah
pysav
b'E
rukoU
piC
pysala
b'Emo
ruko
peCi
pysalo
b'Ete
ruk
piCCU
pysaly
b'UtB
rukam
peCej
pysatymu
byv
rukamy
peCam
pysatymeS
byla
rukah
peCamy
pysatyme
bylo
tkalA
peCah
tesaty
byly
tkali
loSa
teSu
bytymu
tkalU
loSaty
teSeS
bytymeS
tkaleU
loSati
teSe
bytyme
tkale
loSam
teSemo
smaZyty
tkalB
loSata
teSete
smaZu
tkalAm
loSat
teSutB
smaZyS
tkalAmy
loSatam
tesav
smaZutB
tkalAh
loSatamy
tesala
smaZymo
mySa
loSatah
tesalo
smaZyte
mySi
letity
tesaly
smaZatB
mySu
leCu
tesatymu
smaZyv
mySeU
letyS
tesatymeS
smaZyla
mySe
letytB
tesatyme
smaZylo
mySej
letymo
toptaty
smaZyly
mySam
letyte
topCu
smaZytymu
mySamy
letAtB
topCeS
smaZytymeS
mySah
letiv
topCe
smaZytyme
selo
letila
topCemo
druZyty
sela
letilo
topCete
druZu
selu
letily
topCutB
druZyS
selom
letitymu
toptav
druZytB
seli
letitymeS
toptala
druZymo
sil
letityme
toptalo
druZyte
selam
svystity
toptaly
druZatB
selamy
svyHu
toptatymu
druZyv
selah
svystyS
toptatymeS
druZyla
kovalB
svystytB
toptatyme
druZylo
kovalA
svystymo
radity
druZyly
kovalU
svystyte
radiU
druZytymu
kovalem
svystAtB
radiES
druZytymeS
kovali
svystiv
radiE
druZytyme
kovaliv
svystila
radiEmo
kovalAm
svystilo
radiEte
kovalAmy
svystily
radiUtB
kovalAh
svystitymu
radiv
gorih
svystitymeS
radila
goriha
svystityme
radilo
gorihu
pysaty
radily
gorihom
pySu
raditymu
gorisi
pySeS
raditymeS
gorihy
pySe
radityme
>>> from kimmo import * >>> k = KimmoRuleSet.load('ukrainian.yaml') >>> recfile = open('ukrainian.rec') >>> for line in recfile: line = line.stripO if not line: continue if line.startswith(';'): print line continue
print list(k.recognize(line)), '<=', line
[('ruk+a', 'Noun_1_Tv(ruk)+a_Nominative case,sg')] <= ruka [('ruk+y', 'Noun_1_Tv(ruk)+y_')] <= ruky [] <= ruci
[('ruk+u', 'Noun_1_Tv(ruk)+u_accusative case,sg')] <= ruku
[('ruk+oU', 'Noun_1_Tv(ruk)+oU_possesive case,sg')] <= rukoU [('ruk+o', 'Noun_1_Tv(ruk)+o_vocative case,sg')] <= ruko [] <= ruk
[('ruk+am', 'Noun_1_Tv(ruk)+am_dative case,pl')] <= rukam [('ruk+amy', 'Noun_1_Tv(ruk)+amy_possesive case,pl')] <= rukamy [('ruk+ah', 'Noun_1_Tv(ruk)+ah_locative case,pl')] <= rukah [('tkal+A', 'Noun_1_Mj(tkal)+A_Nominative case,sg')] <= tkalA [('tkal+i', 'Noun_1_Mj(tkal)+i_')] <= tkali [('tkal+U', 'Noun_1_Mj(tkal)+U_accusative case,sg')] <= tkalU [('tkal+eU', 'Noun_1_Mj(tkal)+eU_possesive case,sg')] <= tkaleU [('tkal+e', 'Noun_1_Mj(tkal)+e_vocative case,sg')] <= tkale [('tkal+B', 'Noun_1_Mj(tkal)+B_genitive case,pl')] <= tkalB [('tkal+Am', 'Noun_1_Mj(tkal)+Am_dative case,pl')] <= tkalAm [('tkal+Amy', 'Noun_1_Mj(tkal)+Amy_possesive case,pl')] <= tkalAmy [('tkal+Ah', 'Noun_1_Mj(tkal)+Ah_locative case,pl')] <= tkalAh [('myS+a', 'Noun_1_Mi(myS)+a_Nominative case,sg')] <= mySa [('myS+i', 'Noun_1_Mi(myS)+i_')] <= mySi [('myS+u', 'Noun_1_Mi(myS)+u_accusative case,sg')] <= mySu [('myS+eU', 'Noun_1_Mi(myS)+eU_possesive case,sg')] <= mySeU [('myS+e', 'Noun_1_Mi(myS)+e_vocative case,sg')] <= mySe [('myS+ej', 'Noun_1_Mi(myS)+ej_pl')] <= mySej [('myS+am', 'Noun_1_Mi(myS)+am_dative case,pl')] <= mySam [('myS+amy', 'Noun_1_Mi(myS)+amy_possesive case,pl')] <= mySamy [('myS+ah', 'Noun_1_Mi(myS)+ah_locative case,pl')] <= mySah
[('sel+o', 'Noun_2_Tv(sel)+o_sg')] <= selo
[('sel+a', 'Noun_2_Tv(sel)+a_Genitive case,sg')] <= sela
[('sel+u', 'Noun_2_Tv(sel)+u_Genitive case,sg'), ('sel+u', 'Noun_2_Tv(sel)+u_Dative case,sg')] <= selu
[('sel+om', 'Noun_2_Tv(sel)+om_possesive case,sg')] <= selom [('sel+i', 'Noun_2_Tv(sel)+i_locative case,sg')] <= seli
[] <= sil
[('sel+am', 'Noun_2_Tv(sel)+am_dative case,pl')] <= selam [('sel+amy', 'Noun_2_Tv(sel)+amy_possesive case,pl')] <= selamy [('sel+ah', 'Noun_2_Tv(sel)+ah_locative case,pl')] <= selah
[('koval+B', 'Noun_2_Mj(koval)+B')] <= kovalB [('koval+A', 'Noun_2_Mj(koval)+A')] <= kovalA [('koval+U', 'Noun_2_Mj(koval)+U_sg')] <= kovalU
[('koval+em', 'Noun_2_Mj(koval)+em_possesive case,sg')] <= kovalem
[('koval+i', 'Noun_2_Mj(koval)+i')] <= kovali
[('koval+iv', 'Noun_2_Mj(koval)+iv_pl')] <= kovaliv
[('koval+Am', 'Noun_2_Mj(koval)Am')] <= kovalAm
[('koval+Amy', 'Noun_2_Mj(koval)+Amy_possesive case,pl')] <= kovalAmy
[('koval+Ah', 'Noun_2_Mj(koval)+Ah_locative case,pl')] <= kovalAh
[] <= gorih
[] <= goriha
[] <= gorihu
[] <= gorihom
[] <= gorisi
[] <= gorihy
[] <= gorihiv
[] <= goriham
[] <= gorihamy
[] <= gorihah
[] <= piC
[] <= peCi
[('piC+U', 'Noun_3(piC)+U_Possesive case,sg')] <= piCCU [] <= peCej [] <= peCam [] <= peCamy
[] <= peCah [] <= loSa
[('loS+at+y', 'Noun_4(loS)+at_+y_Genitive case,sg')] <= loSaty [('loS+at+i', 'Noun_4(loS)+at_+i_sg.')] <= loSati
[] <= loSam
[('loS+at+a', 'Noun_4(loS)+at_+a_')] <= loSata
[] <= loSat
[('loS+at+am', 'Noun_4(loS)+at_+am_'), ('loS+at+am', 'Noun_4(loS)+at_+am_')] <= loSatam
[('loS+at+amy', 'Noun_4(loS)+at_+amy_possesive case.pl')] <= loSatamy [('loS+at+ah', 'Noun_4(loS)+at_+ah_locative case.pl')] <= loSatah [] <= letity [] <= leCu [] <= letyS [] <= letytB
[('let+y+mo', 'Verb(let)+y_+mo_ imperative. pl. 1 pers'), ('let+y+mo', 'Verb(let)+y_+mo_ imperative. pl. 1 pers')] <= letymo
[('let+y+te', 'Verb(let)+y_+te_imperative. pl. 2 pers'), ('let+y+te', 'Verb(let)+y_+te_imperative. pl. 2 pers')] <= letyte
[] <= letAtB
[('let+i+v', 'Verb(let)+i_+v_sg.past'), ('let+i+v', 'Verb(let)+i_+v_sg.m.past'), ('let+i+v',
'Verb(let)+i_+v_sg.m.past'), ('let+i+v', 'Verb(let)+i_+v_sg.past')] <= letiv
[('let+i+la', 'Verb(let)+i_+la_sg.fem.past'), ('let+i+la', 'Verb(let)+i_+la_sg.fem.past'), ('let+i+la',
'Verb(let)+i_+la_sg.fem.past'), ('let+i+la', 'Verb(let)+i_+la_sg.fem.past')] <= letila
[('let+i+lo', 'Verb(let)+i_+lo_sg'), ('let+i+lo', 'Verb(let)+i_+lo_sg.n.past'), ('let+i+lo',
'Verb(let)+i_+lo_sg.n.past'), ('let+i+lo', 'Verb(let)+i_+lo_sg')] <= letilo
[('let+i+ly', 'Verb(let)+i_ly_pl.past'), ('let+i+ly', 'Verb(let)+i_+ly_pl.past'), ('let+i+ly',
'Verb(let)+i_+ly_pl.past'), ('let+i+ly', 'Verb(let)+i_+ly_pl.past')] <= letily
[('let+ity+mu', 'Verb(let)+ity_mu_sg.1 pers. future'), ('let+ity+mu', 'Verb(let)+ity_+mu_sg.1 pers. future'), ('let+ity+mu', 'Verb(let)+ity_+mu_sg.1 pers. future'), ('let+ity+mu', 'Verb(let)+ity_+mu_sg.1 pers. future')] <= letitymu
[('let+ity+meS', 'Verb(let)+ity_+meS_sg.2 pers. future'), ('let+ity+meS', 'Verb(let)+ity_+meS_sg.2 pers. future'), ('let+ity+meS', 'Verb(let)+ity_+meS_sg.2 pers. future'), ('let+ity+meS', 'Verb(let)+ity_+meS_sg.2 pers. future')] <= letitymeS
[('let+ity+me', 'Verb(let)+ity_+me_sg.3 pers. future'), ('let+ity+me', 'Verb(let)+ity_+me_sg.3 pers.
future'), ('let+ity+me', 'Verb(let)+ity_+me_sg.3 pers. future'), ('let+ity+me',
'Verb(let)+ity_+me_sg.3 pers. future')] <= letityme
[] <= svystity
[] <= svyHu
[] <= svystyS
[] <= svystytB
[] <= svystymo
[] <= svystyte
[] <= svystAtB
[] <= svystiv
[] <= svystila
[] <= svystilo
[] <= svystily
[] <= svystitymu
[] <= svystitymeS
[] <= svystityme [] <= pysaty [] <= pySu
[] <= pySeS
[] <= pySe [] <= pySemo [] <= pySete [] <= pySutB
[] <= pysav [] <= pysala [] <= pysalo
[] <= pysaly
[] <= pysatymu [] <= pysatymeS [] <= pysatyme [] <= tesaty
[] <= teSu [] <= teSeS [] <= teSe
[] <= teSemo [] <= teSete [] <= teSutB
[] <= tesav [] <= tesala [] <= tesalo [] <= tesaly [] <= tesatymu [] <= tesatymeS [] <= tesatyme [] <= toptaty
[] <= topCu [] <= topCeS [] <= topCe
[] <= topCemo
[] <= topCete [] <= topCutB
[('topt+a+v', 'Verb(topt)+a_+v_sg.past'), ('topt+a+v', 'Verb(topt)+a_+v_sg.m.past'), ('topt+a+v', 'Verb(topt)+a_+v_sg.m.past'), ('topt+a+v', 'Verb(topt)+a_+v_sg.past')] <= toptav [('topt+a+la', 'Verb(topt)+a_+la_sg.fem.past'), ('topt+a+la', 'Verb(topt)+a_+la_sg.fem.past'), ('topt+a+la', 'Verb(topt)+a_+la_sg.fem.past'), ('topt+a+la', 'Verb(topt)+a_+la_sg.fem.past')] <= toptala
[('topt+a+lo', 'Verb(topt)+a_+lo_sg'), ('topt+a+lo', 'Verb(topt)+a_+lo_sg.n.past'), ('topt+a+lo',
'Verb(topt)+a_+lo_sg.n.past'), ('topt+a+lo', 'Verb(topt)+a_+lo_sg')] <= toptalo
[('topt+a+ly', 'Verb(topt)+a_ly_pl.past'), ('topt+a+ly', 'Verb(topt)+a_+ly_pl.past'), ('topt+a+ly',
'Verb(topt)+a_+ly_pl.past'), ('topt+a+ly', 'Verb(topt)+a_+ly_pl.past')] <= toptaly
[('topt+aty+mu', 'Verb(topt)+aty_mu_sg.1 pers. future'), ('topt+aty+mu', 'Verb(topt)+aty_+mu_sg.1
pers. future'), ('topt+aty+mu', 'Verb(topt)+aty_+mu_sg.1 pers. future'), ('topt+aty+mu',
'Verb(topt)+aty_+mu_sg.1 pers. future')] <= toptatymu
[('topt+aty+meS', 'Verb(topt)+aty_+meS_sg.2 pers. future'), ('topt+aty+meS',
'Verb(topt)+aty_+meS_sg.2 pers. future'), ('topt+aty+meS', 'Verb(topt)+aty_+meS_sg.2 pers.
future'), ('topt+aty+meS', 'Verb(topt)+aty_+meS_sg.2 pers. future')] <= toptatymeS
[('topt+aty+me', 'Verb(topt)+aty_+me_sg.3 pers. future'), ('topt+aty+me', 'Verb(topt)+aty_+me_sg.3
pers. future'), ('topt+aty+me', 'Verb(topt)+aty_+me_sg.3 pers. future'), ('topt+aty+me',
'Verb(topt)+aty_+me_sg.3 pers. future')] <= toptatyme
[] <= radity [] <= radiU
[] <= radiES [] <= radiE
[] <= radiEmo
[] <= radiEte
[] <= radiUtB
[] <= radiv [] <= radila [] <= radilo [] <= radily
[('radi+ty+mu', 'Verb(radi)+ty_mu_sg.1 pers. future'), ('radi+ty+mu', 'Verb(radi)+ty_+mu_sg.1 pers. future'), ('radi+ty+mu', 'Verb(radi)+ty_+mu_sg.1 pers. future'), ('radi+ty+mu', 'Verb(radi)+ty_+mu_sg.1 pers. future'), ('radi+ty+mu', 'Verb(radi)+ty_mu_sg.1 pers. future'), ('radi+ty+mu', 'Verb(radi)+ty_+mu_sg.1 pers. future'), ('radi+ty+mu', 'Verb(radi)+ty_+mu_sg.1 pers. future'), ('radi+ty+mu', 'Verb(radi)+ty_+mu_sg.1 pers. future')] <= raditymu [('radi+ty+meS', 'Verb(radi)+ty_+meS_sg.2 pers. future'), ('radi+ty+meS',
'Verb(radi)+ty_+meS_sg.2 pers. future'), ('radi+ty+meS', 'Verb(radi)+ty_+meS_sg.2 pers. future'), ('radi+ty+meS', 'Verb(radi)+ty_+meS_sg.2 pers. future'), ('radi+ty+meS', 'Verb(radi)+ty_+meS_sg.2 pers. future'), ('radi+ty+meS', 'Verb(radi)+ty_+meS_sg.2 pers. future'), ('radi+ty+meS', 'Verb(radi)+ty_+meS_sg.2 pers. future'), ('radi+ty+meS', 'Verb(radi)+ty_+meS_sg.2 pers. future')] <= raditymeS
[('radi+ty+me', 'Verb(radi)+ty_+me_sg.3 pers. future'), ('radi+ty+me', 'Verb(radi)+ty_+me_sg.3 pers. future'), ('radi+ty+me', 'Verb(radi)+ty_+me_sg.3 pers. future'), ('radi+ty+me', 'Verb(radi)+ty_+me_sg.3 pers. future'), ('radi+ty+me', 'Verb(radi)+ty_+me_sg.3 pers. future'), ('radi+ty+me', 'Verb(radi)+ty_+me_sg.3 pers. future'), ('radi+ty+me', 'Verb(radi)+ty_+me_sg.3 pers. future'), ('radi+ty+me', 'Verb(radi)+ty_+me_sg.3 pers. future')] <= radityme [] <= byty
[] <= b'U [] <= b'ES [] <= b'E [] <= b'Emo [] <= b'Ete [] <= b'UtB
[('b+y+v', 'Verb(b)+y_+v_sg.past'), ('b+y+v', 'Verb(b)+y_+v_sg.m.past'), ('b+y+v', 'Verb(b)+y_+v_sg.m.past'), ('b+y+v', 'Verb(b)+y_+v_sg.past'), ('b+y+v', 'Verb(b)+y_+v_sg.past'), ('b+y+v', 'Verb(b)+y_+v_sg.m.past'), ('b+y+v', 'Verb(b)+y_+v_sg.m.past'), ('b+y+v', 'Verb(b)+y_+v_sg.past')] <= byv
[('b+y+la', 'Verb(b)+y_+la_sg.fem.past'), ('b+y+la', 'Verb(b)+y_+la_sg.fem.past'), ('b+y+la', 'Verb(b)+y_+la_sg.fem.past'), ('b+y+la', 'Verb(b)+y_+la_sg.fem.past'), ('b+y+la', 'Verb(b)+y_+la_sg.fem.past'), ('b+y+la', 'Verb(b)+y_+la_sg.fem.past'), ('b+y+la', 'Verb(b)+y_+la_sg.fem.past'), ('b+y+la', 'Verb(b)+y_+la_sg.fem.past')] <= byla [('b+y+lo', 'Verb(b)+y_+lo_sg'), ('b+y+lo', 'Verb(b)+y_+lo_sg.n.past'), ('b+y+lo', 'Verb(b)+y_+lo_sg.n.past'), ('b+y+lo', 'Verb(b)+y_+lo_sg'), ('b+y+lo', 'Verb(b)+y_+lo_sg'), ('b+y+lo', 'Verb(b)+y_+lo_sg.n.past'), ('b+y+lo', 'Verb(b)+y_+lo_sg.n.past'), ('b+y+lo',
'Verb(b)+y_+lo_sg')] <= bylo
[('b+y+ly', 'Verb(b)+y_ly_pl.past'), ('b+y+ly', 'Verb(b)+y_+ly_pl.past'), ('b+y+ly',
'Verb(b)+y_+ly_pl.past'), ('b+y+ly', 'Verb(b)+y_+ly_pl.past'), ('b+y+ly', 'Verb(b)+y_ly_pl.past'),
('b+y+ly', 'Verb(b)+y_+ly_pl.past'), ('b+y+ly', 'Verb(b)+y_+ly_pl.past'), ('b+y+ly', 'Verb(b)+y_+ly_pl.past')] <= byly
[('b+yty+mu', 'Verb(b)+yty_mu_sg.1 pers. future'), ('b+yty+mu', 'Verb(b)+yty_+mu_sg.1 pers. future'), ('b+yty+mu', 'Verb(b)+yty_+mu_sg.1 pers. future'), ('b+yty+mu', 'Verb(b)+yty_+mu_sg.1 pers. future'), ('b+yty+mu', 'Verb(b)+yty_mu_sg. 1 pers. future'), ('b+yty+mu',
'Verb(b)+yty_+mu_sg.1 pers. future'), ('b+yty+mu', 'Verb(b)+yty_+mu_sg.1 pers. future'), ('b+yty+mu', 'Verb(b)+yty_+mu_sg.1 pers. future')] <= bytymu
[('b+yty+meS', 'Verb(b)+yty_+meS_sg.2 pers. future'), ('b+yty+meS', 'Verb(b)+yty_+meS_sg.2
pers. future'), ('b+yty+meS', 'Verb(b)+yty_+meS_sg.2 pers. future'), ('b+yty+meS',
'Verb(b)+yty_+meS_sg.2 pers. future'), ('b+yty+meS', 'Verb(b)+yty_+meS_sg.2 pers. future'),
('b+yty+meS', 'Verb(b)+yty_+meS_sg.2 pers. future'), ('b+yty+meS', 'Verb(b)+yty_+meS_sg.2 pers.
future'), ('b+yty+meS', 'Verb(b)+yty_+meS_sg.2 pers. future')] <= bytymeS
[('b+yty+me', 'Verb(b)+yty_+me_sg.3 pers. future'), ('b+yty+me', 'Verb(b)+yty_+me_sg.3 pers.
future'), ('b+yty+me', 'Verb(b)+yty_+me_sg.3 pers. future'), ('b+yty+me', 'Verb(b)+yty_+me_sg.3
pers. future'), ('b+yty+me', 'Verb(b)+yty_+me_sg.3 pers. future'), ('b+yty+me',
'Verb(b)+yty_+me_sg.3 pers. future'), ('b+yty+me', 'Verb(b)+yty_+me_sg.3 pers. future'),
('b+yty+me', 'Verb(b)+yty_+me_sg.3 pers. future')] <= bytyme
[] <= smaZyty
[] <= smaZu
[] <= smaZyS
[] <= smaZutB
[] <= smaZymo
[] <= smaZyte
[] <= smaZatB
[] <= smaZyv
[] <= smaZyla
[] <= smaZylo
[] <= smaZyly
[] <= smaZytymu
[] <= smaZytymeS
[] <= smaZytyme
[] <= druZyty
[] <= druZu [] <= druZyS [] <= druZytB
[] <= druZymo [] <= druZyte
[] <= druZatB
[] <= druZyv [] <= druZyla [] <= druZylo [] <= druZyly [] <= druZytymu [] <= druZytymeS [] <= druZytyme
>>> recfile.close()
Оцінка результатів аналізу
Під час виконання 3 етапу наступним кроком є оцінка результатів аналізу, знаходження помилок та пояснення причин їх вининення. Для того, щоб здійснити морфологічний аналіз всіх граматичних форм наступних слів: рука, ткаля, миша, село, коваль, горіх, піч, лоша, летіти, свистіти, писати, тесати, топтати, радіти, бити, смажити, дружити я зберегла всі граматичні форми даних слів у файлі ukrainian.rec, транслітеруючи їх, оскільки програма працює лише з літерами латинського алфавіту. В результаті морфологічного аналізу були знайдені нерозпізнані слова, неправильно розпізнані або частково нерозпізнані словоформи.
Аналіз іменників
iw Аналізуючи всі граматичні форми слова «ruka» система не розпізнала словоформу
ruci і ruk і частково розпізнало словоформу гику.
Правило заміни букви «к» на «ц» при аналізі словоформи ruci не спрацювало, хоча воно і
записане в файлі ukrainian.yaml:
k to c: | FSA
k i @
c i @ 1: 2 1 1 2: 0 1 0
Також система не розпізнала форму ruk, хоча у файлі ukrainian. lex записано основу слова N_ROOT_1_TV:
ruk AfterNoun_1_Tv Noun_1_Tv(ruk), та вказано на нульове закінчення в іменника 1 відміни твердої групи в Родовому відмінку множини +0 AfterNounEnding genitive case,pl.
Частково розпізнала система словоформу ™ку, оскільки ця форма притаманна Родовому відмінку однини та Називному відмінку множини. В цьому випадку розпізнало лише основу та закінчення,
N_ROOT_1_TV:
ruk AfterNoun_1_Tv Noun_1_Tv(ruk) - основа N_ENDING_1_TV:
+y AfterNounEnding +y_ - закінчення іменника І відміни твердої групи.
але даних про відповідну форму множини та відмінок однини у файлі ukrainian.lex немає.
Інші словоформи були розпізнані.
[('ruk+a', 'Noun_1_Tv(ruk)+a_Nominative case,sg')] <= ruka [('ruk+y', 'Noun_1_Tv(ruk)+y_')] <= ruky [] <= ruci
[('ruk+u', 'Noun_1_Tv(ruk)+u_accusative case,sg')] <= ruku [('ruk+oU', Noun_1_Tv(ruk)+oU_possesive case,sg')] <= rukoU [('ruk+o', 'Noun_1_Tv(ruk)+o_vocative case,sg')] <= ruko
[] <= ruk
[('ruk+am', 'Noun_1_Tv(ruk)+am_dative case,pl')] <= rukam [('ruk+amy', 'Noun_1_Tv(ruk)+amy_possesive case,pl')] <= rukamy [('ruk+ah', 'Noun_1_Tv(ruk)+ah_locative case,pl')] <= rukah
it Аналізуючи всі граматичні форми слова «tkalA» система розпізнала все, але частково розпізнала «tkali» оскільки ця форма притаманна Родовому відмінку однини та Називному відмінку множини.
[('tkal+i', 'Noun_1_Mj(tkal)+i_')] <= tkali
В цьому випадку розпізнало лише основу та закінчення,
N_ROOT_1_MJ:
tkal AfterNoun_1_Mj Noun_1_Mj(tkal) - основа N_ENDING_1_MJ:
+i AfterNounEnding +i_ - закінчення іменника І відміни м'якої групи.
але даних про відповідну форму множини та відмінок однини у файлі ukrainian.lex немає.
Інші словоформи були розпізнані.
© Те саме спостерігається з словоформою «mySi».
[('myS+i', 'Noun_1_Mi(myS)+i_')] <= mySi
В файлі ukrainian.lex вказані дані лише про основу іменника та про можливість додавання закінчення -і до основи іменника І відміни мішаної групи.
N_ROOT_1_MI:
myS AfterNoun_1_Mi Noun_1_Mi(myS) - основа
N_ENDING_1_MI:
+i AfterNounEnding +i_ - закінчення іменника І відміни мішаної групи.
А також частково розпізнана словоформа «mySej».
[('myS+ej', 'Noun_1_Mi(myS)+ej_pl')] <= mySej
Вказано лише закінчення та форму множини,тому що дані про це записані у файлі ukrainian.lex
N_ROOT_1_MI:
myS AfterNoun_1_Mi Noun_1_Mi(myS) - основа
+ej AfterNounEnding +ej_pl - вказано закінчення множини іменника І відміни
мішаної групи, але не вказано, що це форма родового відмінка.
© Аналізуючи граматичні форми слова «selo» система не розпізнала називий відмінок
іменника, бо це вказано в файлі ukrainian.lex неправильно : N_ENDING_2_TV:
+0 AfterNounEnding _sg.Nominative case - вказано нульове закінчення однини іменника ІІ відміни твердої групи, як закінчення називного відмінку.
+o AfterNounEnding +o_sg - а при додаванні закінчення «о» до основи, називний відмінок словоформи не вказаний.
Це саме стосується Знахідного відмінка однини, адже форми слова «село» Називного і Знахідного відмінка співпадають - «selo».
Форма «sete» розпізнана частково, тому що при аналізі упущено, що ця форма крім родового відмінка однини має форму називного відмінка множини. [('sel+a', 'Noun_2_Tv(sel)+a_Genitive case,sg')] <= sela
Форму selu система розпізнала, як словоформу двох різних відмінків : давального і родового, хоча словоформа родового відмінка звучить як «sela».
[('sel+u', 'Noun_2_Tv(sel)+u_Genitive case,sg'), ('sel+u', 'Noun_2_Tv(sel)+u_Dative case,sg')] <= selu
Причиною є те, що так записано у файлі ukrainian.lex. N_ROOT_2_TV:
sel AfterNoun_2_Tv Noun_2_Tv(sel)
+u AfterNounEnding +u_Dative case,sg
+u AfterNounEnding +u_Dative case,sg
Словоформа «sil» не була розпізнана. Правило зміни «е» на «і» не виконалось, хоча воно
записане у файлі ukrainian.yaml:
e to i: | FSA
e l # @
i l # @ 1: 2 1 1 1 2: 0 3 0 0
3: 0 0 1 0
[('sel+o', 'Noun_2_Tv(sel)+o_sg')] <= selo
[('sel+a', 'Noun_2_Tv(sel)+a_Genitive case,sg')] <= sela
[('sel+u', 'Noun_2_Tv(sel)+u_Genitive case,sg'), ('sel+u', 'Noun_2_Tv(sel)+u_Dative case,sg')] <= selu
[('sel+om', 'Noun_2_Tv(sel)+om_possesive case,sg')] <= selom [('sel+i', 'Noun_2_Tv(sel)+i_locative case,sg')] <= seli
[] <= sil
[('sel+am', 'Noun_2_Tv(sel)+am_dative case,pl')] <= selam [('sel+amy', 'Noun_2_Tv(sel)+amy_possesive case,pl')] <= selamy [('sel+ah', 'Noun_2_Tv(sel)+ah_locative case,pl')] <= selah
it При аналізі слова «kovalB» система розпізнала всіх граматичні форми, але через наявність помилок у файлі ukrainian.lex не всі граматичні форми були розпізнані повністю. Не вистачає деяких відмінків.
[('koval+B', 'Noun_2_Mj(koval)+B')] <= kovalB - Називний відм. одн. [('koval+A', 'Noun_2_Mj(koval)+A')] <= kovalA -Родовий відм. одн. [('koval+U', 'Noun_2_Mj(koval)+U_sg')] <= kovalU - Давальний відм. одн. [('koval+i', 'Noun_2_Mj(koval)+i')] <= kovali - Називний відм. множ. [('koval+iv', 'Noun_2_Mj(koval)+iv_pl')] <= kovaliv -Родовий відм. множ. [('koval+Am', 'Noun_2_Mj(koval)Am')] <= kovalAm - Давальний відм. множ.
Ці словоформи розпізнані повністю:
[('koval+em', 'Noun_2_Mj(koval)+em_possesive case,sg')] <= kovalem [('koval+Amy', 'Noun_2_Mj(koval)+Amy_possesive case,pl')] <= kovalAmy [('koval+Ah', 'Noun_2_Mj(koval)+Ah_locative case,pl')] <= kovalAh
і* Аналізуючи слово «gorih» система не розпізнала жодної словоформи. Це пов'язано з тим, що у файлі ukrainian.lex воно не правильно транслітеровано горіх => goiyri.
N_ROOT_2_MI:
goryh AfterNoun_2_Mi Noun_2_Mi(horyH)
[] <= gorih [] <= goriha [] <= gorihu [] <= gorihom [] <= gorisi [] <= gorihy [] <= gorihiv [] <= goriham [] <= gorihamy [] <= gorihah
iw Аналізуючи всі граматичні форми слова «piC» система розпізнала лише словоформу в
орудному відмінку однини : [('piC+U', 'Noun_3(piC)+U_Possesive case,sg')] <= piCCU
В даному випадку використовувалось правило подвоєння «ч» в основах перед «ю», записане в файлі ukrainian.yaml:
0 to C: |
FSA
0 U @
C U @ 1: 2 1 1
2: 0 1 0
Форма називного відмінка однини «piC» не була розпізнана, хоча в файлі ukrainian.lex є такі дані:
N_ROOT_3:
piC AfterNoun_3 Noun_3(piC) - основа іменника ІІІ відміни
N_ENDING_3:
+0 AfterNounEnding +0,sg - додавання нульового закінчення до основи, однина ( але не вказано, який це відмінок: називний або знахідний).
Всі інші словоформи також не були розпізнані в зв'язку з тим ,що в основі слова відбулось заміна голосної «і» на «е», а в файлі ukrainian.yaml немає правила на заміну «і» на «е» перед приголосною «ч». Ось і результат.
[] <= piC
[] <= peCi
[('piC+U', 'Noun_3(piC)+U_Possesive case,sg')] <= piCCU [] <= peCej
[] <= peCam [] <= peCamy
[] <= peCah
iw Іменник «кгёа» належить до IV відміни іменників. Ці дані, як і дані про основу цього слова вказані у файлі ukrainian.lex. N_ROOT_4:
loS AfterNoun_4 Noun_4(loS)
Та під час відмінювання у іменників IV відміни з'являється суфікс. В нашому випадку це суфікс «^ty» :
N_SUFFIX_4:
+at NounEnding +at_
При аналізі граматичних форм слова «IoSh» виникли помилки. Система не розпізнала форми слів у яких до основи іменника не додано суфікса «^ty» (в IV відміні іменників).
[] <= loSa [] <= loSam [] <= loSat
В інших словоформах, які утворені за допомогою цього суфіксу не вистарчає деяких відмінків:
[('loS+at+i', 'Noun_4(loS)+at_+i_sg.')] <= loSati - Давальний відм. одн.
[('loS+at+a', 'Noun_4(loS)+at_+a_')] <= loSata - множина, називний відм.
[('loS+at+am', 'Noun_4(loS)+at_+am_'), ('loS+at+am', 'Noun_4(loS)+at_+am_')] <= loSatam - вказано двічі, тому що це помилка у файлі ukrainian.lex і це давальний відмінок множини.
Ці словоформи правильні і розпізнані.
[('loS+at+y', 'Noun_4(loS)+at_+y_Genitive case,sg')] <= loSaty [('loS+at+ah', 'Noun_4(loS)+at_+ah_locative case.pl')] <= loSatah
Аналіз дієслів
iw При аналізі всіх граматичних форм слова «letity» система не розпізнала інфінітив, форми leCu, letyS, letytB та частково інші форми.
У файлі ukrainian.lex записано, що основою слова є «let», а суфіксом є «-ity», хоча суфіксом є «-і».
V_ROOT_PREF_1:
let AfterVerb Verb(let) - основа дієслова «летіти»
V_SUFFIX_1:
+ity AfterVerbSuffix +ity_ - суфікс до дієслова І відміни
Словоформу «leCu» система не розпізнала, хоча у ній відбулась заміна «т» на «ч» , а
правило записане у файлі ukrainian.yaml:
t to CO: | FSA
t u @
C u @ 1: 2 1 1 2: 0 1 0
Словоформи letyS, letytB, letAtB не розпізнані, хоча у файлі вказані закінчення вірні. V_ENDING_1:
+yS AfterVerbEnding +yS_2 sg present +ytB AfterVerbEnding +ytB_3 sg present +AtB AfterVerbEnding +AtB_3 pl present
Це також пов'язано із даним суфіксом. Система додає закінчення лише, коли до основи додано суфікс, тобто до невірної форми. Це помилки у файлі ukrainian.lex. Таких форм в українській мові не існує.
let+ity+yS (Verb(let)+ity_+yS_2 sg present), let+ity+yS (Verb(let)+ity_+yS_2 sg present)
Словоформа «letily» не до кінця проаналізована, тому, що не вказана жодна особа. Хоча це 1-а, 2-а, 3-я особи множини.
[('let+i+ly', 'Verb(let)+i_ly_pl.past')
Я вважаю , що недоліком є також повторний запис, або дублювання проаналізованих словоформ.
Наприклад:
[('let+ity+meS', 'Verb(let)+ity_+meS_sg.2 pers. future'), ('let+ity+meS',
'Verb(let)+ity_+meS_sg.2 pers. future'), ('let+ity+meS', 'Verb(let)+ity_+meS_sg.2 pers. future'), ('let+ity+meS', 'Verb(let)+ity_+meS_sg.2 pers. future')] <= letitymeS
it При аналізі слова «svystity» жодна з словоформ не була розпізнана.
Хоча у файлі ukrainian.lex записані дані про основу та можливий суфікси та закінчення, система не «бачить» жодну з словоформ.
V_ROOT_PREF_1:
let AfterVerb Verb(let) svyst AfterVerb Verb(svyst)
V_SUFFIX_1:
+ity AfterVerbSuffix +ity_
+i AfterVerbSuffix +i_
+0 AfterVerbSuffix _
V_ENDING_1:
+u AfterVerbEnding +u _1 sg present
+yS AfterVerbEnding +yS_2 sg present
+ytB AfterVerbEnding +ytB_3 sg present
+ymo AfterVerbEnding +ymo_1 pl present
+yte AfterVerbEnding +yte_2 pl present
+AtB AfterVerbEnding +AtB_3 pl present
+v AfterVerbEnding +v_sg.past
+la AfterVerbEnding +la_sg.fem.past
+lo AfterVerbEnding +lo_sg
+ly AfterVerbEnding ly_pl.past
+mu AfterVerbEnding mu_sg. 1 pers. future
+meS AfterVerbEnding +meS_sg.2 pers. future
+me AfterVerbEnding +me_sg.3 pers. future
+memo AfterVerbEnding +memo_pl.1 pers. future
+mete AfterVerbEnding +mete_pl.2 pers. future
+mutB AfterVerbEnding +mutB_pl.3 pers. future
+0 AfterVerbEnding _infinityv
it Те саме стосується слів «pysaty», «tesaty», «smaZyty». Жодна з словоформ не
розпізнана, хоча в файлі ukrainian.lex є всі необхідні дані для розпізнання - основа, суфікси та закінчення, а також транслітерація є вірною.
При аналізі слова «toptaty» не розпізнались форми теперішнього часу.
[] <= topCu [] <= topCeS [] <= topCe
[] <= topCemo [] <= topCete [] <= topCutB
Це пов'язано з тим, що правило зміни «т» на «ч» перед «е» не виконується, хоча в файлі ukrainian.yaml воно записане для зміни «т» на «ч» перед голосною «у» :
t to C0: |
FSA
t u @
C u @ 1: 2 1 1
2: 0 1 0
Словоформа «toptaly» не до кінця проаналізована, тому, що не вказана жодна особа. Хоча це 1-а, 2-а, 3-я особи множини.
[('topt+a+ly', 'Verb(topt)+a_ly_pl.past') <= toptaly
При аналізі слова «radity» усі граматичні форми теперішнього і минулого часу є не розпізнані. У цьому слові суфікс додається лише в формах майбутнього часу. Це стало причиною того, що вони не розпізнані. Тому форма інфінітиву також під час аналізу розпізнана не була, тому що до основи раді+ додалось закінчення, а не суфікс.
V_ROOT_PREF_3:
radi AfterVerb Verb(radi)
V_SUFFIX_3:
+ty AfterVerbSuffix +ty_
При аналізі дієслова «byty» система не розпізнала інфінітив та форми теперішнього часу. Причиною є те, що система не розпізнала закінчення, а замість того в файлі ukrainian.lex записано до основи b_ додавання суфіксу -yty.
V_ROOT_PREF_3:
b AfterVerb Verb(b)
V_SUFFIX_3:
+yty AfterVerbSuffix +yty_
Крім того в файлі ukrainian.yaml немає правила на зміну «и» на голосні «ю», «є», «ю», хоча є правило про вживання апострофа:
0 to ': | FSA
0 Apost @ ' Apost @ 1: 2 1 1
2: 0 1 0
Словоформа «byly» не до кінця проаналізована, тому, що не вказана жодна особа. Хоча це
1-а, 2-а, 3-я особи множини.
[('b+y+ly', 'Verb(b)+y_ly_pl.past')] <= byly
При аналізі всіх граматичних форм слова «druZyty» система не розпізнала жодного слова, оскільки в файлі ukrainian.lex сама основа слова записана невірно - неправильна транслітерація слова.
V_ROOT_PREF_4:
druz AfterVerb Verb(druz)
Оцінка результатів синтезу
Наступним кроком 3 етапу є оцінка результатів синтезу, знаходження помилок та пояснення причин їх вининення.
Синтез іменників
® При синтезі всіх граматичних форм слова система просинтезувала такі
словоформи як : 11114;!, ruky, гисі, гики, гикоіі, ruko, гик, rukam, rukamy, rukah. Слова гика, гики, гико, гик, гикат, гикату, гukah перевірялись на такі правила:
заміна букви «к» на «ч», перед голосними «и», «у», «е»;
додавання апострофа перед голосними «я», «ю», «ї», «є»;
подвоєння букви «ч» («С») перед голосною «ю»;
заміна букви «к» на «ц», перед голосними «и», «у», «е»; Жодне з правил не застосувалось.
Система перевірила словоформу гику на правила заміни букви «к» на «ц» та букву «к» на «ч» та створила нову словоформу гиСу. Такого слова в українському лексиконі немає, але до нього застосувалось правило заміни «к» на «ч» , яке записано в файлі Ukra.inian.yaml: k to C: |
k Ss @
C Ss @ 1: 2 1 1 2: 0 1 0
Словоформа пш перевірялась на правила : додавання апострофа перед голосними «я», «ю», «ї», «є»; заміна букви «і» на «о», перед приголосною «с»; заміна букви «і» на «е», перед приголосною «ч» при додавання до неї «е», «а»,«і» ; подвоєння букви «ч» («С») перед голосною «ю»; Жодне правило не застосувалось. Не застосувалось також правило заміна букви «к» на «ц», тому, що в файлі икгаіпіап.уаті в правилі заміни не вказана буква «і» в наявності якої правило застосується.
При синтезі словоформа гикои перевірялась на правила заміни букви «к» на «ч та заміни букви «к» на «ц». Правила не використались. Але правило про додавання апострофа та правило подвоєння букви «ч» («С») перед голосною «ю» були вжиті і система створила словоформи гиСои, гико'и. Хоча в українській мові таких словоформ не існує, вони створені за правилами поданими у файлі икгаіпіап.уаті і написані без помилок. Крім того під час синтезу система не звертає увагу на те, чи існує таке слово в словнику даної мови, тому це не є помилкою.
íí При синтезі всіх граматичних форм слова tkalA система просинтезувала такі
словоформи : tkalA, tkali, tkalU, tkaleU, tkale, tkalB, tkalAm, tkalAmy, tkalAh.
При синтезі словоформ система перевірила їх на правила заміна букви «к» на «ч», «к» на «ц», додавання апострофа та подвоєння букви «ч». З них застосувалось лише правило апострофа, в результаті чого система утворила форми tkal'A, tkal'U, tkale'U, tkal'Amy, tkal'Ah, а також правило додавання букви «ч» перед голосною «ю» в словоформах tkaleU, tkalU - з яких система утворила словоформи tkaleCU, tkalCU. Помилок у цьому випадку в роботі системи немає, але слів в українській мові таких також не існує. Це пов'язано з тим, що система лише використовує на словах дані їй правила. Також словоформи tkaleU, tkale перевірялись ще на правило заміни букви «е» на «і», яке теж не було застосовано.
iw Словоформи іменника mySa перевірялись на подвоєння букви «ч» та додавання апострофа.
При цьому це правило у словоформах mySa, mySu, mySam, mySamy, mySah не застосувалось. Словоформ mySi перевірялась крім того на правило заміни «і» на «о», що також не виконалось.
Словоформи mySeU, mySe, mySej перевірялись на подвоєння букви «ч» та додавання апострофа, а також на заміну букви «е» на «і». Система використала правило використання букви «ч», створивши словоформи mySeCU та вставила апостроф перед голосною «ю» у словоформі mySe'U.
Помилок у цьому випадку в роботі системи немає, але слів в українській мові таких також не існує. Це пов'язано з тим, що система лише використовує на словах дані їй правила.
Синтезуючи всі граматичні форми слова selo система перевірила їх на такі правила :
Словоформи sela, selu, selam, selamy, selah на правило заміни букви «с» на «ш». Правило не виконалось. Крім того саме правило в файлі Ukrainian.yaml записано не вірно. Згідно праила заміна відбудеться не на букву «ш» а на «с».
Словоформи selom, sil, selo на правила заміни букви «с» на «ш», додавання апострофа, подвоєння букви «ч». Правила не застосувались.
Словоформа seli перевірилась на правила заміни букви «с» на «ш», додавання апострофа, подвоєння букви «ч», заміни букви «і» на «о». Правила не застосувались.
При синтезі всіх граматичних форм слова kovalB на правила додавання апострофа, заміни букви «к» на «ч», заміни букви «к» на «ц», подвоєння букви «ч» перевірялись такі словоформи : коуаІБ, коуаІЛ, коуаіи, коуаіет, коуаіі, коуаііу, коуаІЛт, коуаІЛту, koуalЛh.
Крім того словоформа коуаіет ще перевірялась на правило заміни букви «е» на «і», а словоформи к)уаІі, к)уаІіу на правила заміни букви «і» на «о» та заміни букви «і» на «е».
З усіх правил, на які перевірялись словоформи виконались лише два правила:
подвоєння букви «ч» («С») перед голосною «ю»;
додавання апострофа перед голосними «я», «ю», «ї», «є»;
В результаті система створила словоформи коуаІ'Л, коуаі'и, коуаІ'Лт, коуаІ'Лту, koуal'Лh, на перше з двох правил, та коуаіСи на друге правило.
Таких слів в українському лексиконі немає, але до них застосувалось правило додавання апострофа після голосних «я», «ю», «ї», «є» та правило вживання букви «ч», які записано в файлі икгаіпіап.уаті :
0 Ю С: | 0 Ю ': |
0 и @ 0 Appost @
С И @ ' Appost @
1: 2 1 1 1: 2 1 1
2: 0 1 0 2: 0 1 0
© При синтезі всіх граматичних форм слова ІшгШ не була розпізнана жодна з них. Це було пов'язано з неправильною транслітерацією словоформ у файлі икгаіпіап.іех.Під час синтезу словоформ ми не стикнулись з такою проблемою, тому що система слідкує за тими правилами, які записані у файлі икгаіпіап.уаті. Отже словоформи перевірялись на такі правила:
додавання апострофа;
подвоєння букви «ч»;
заміна букви «і» на «о»;
Жодне з правил не було застосоване до словоформ goгih, goгiha,goгihu, goгihom, goгihy, goгihiу, goгiham, goгihamy, gorihah. Словоформа gorisi не була розпізнана під час синтезу взагалі. Мабуть це пов'язано з тим, що у файлі икгаіпіап.уаті немає правила на заміну «х» на «с».
© При синтезі таких словоформ слова piC, як реСе], реСат, реСату, peCah система перевіряла їх на правила подвоєння букви «ч», додавання апострофа, заміни букви «е» на «і». Правила не виконались. Словоформа реСі крім вище зазначених правил ще перевірялась на правило заміни букви «і» на «о» але воно теж не виконалось.
Словоформи piC, piCCU перевірялись на правила заміни букви «і» на «о», подвоєння букви «ч» («С»), додавання апострофа. Під час синтезу словоформи piCCU виконалось лише правило подвоєння букви «ч», яке згідно з файлом Ukraiman.yaml виконується, якщо перед буквою «ч» стоїть голосна «ю»: 0 го С: |
о и @
С и @ 1: 2 1 1 2: 0 1 0
Крім того система створила ще одну словоформу ріСС'и. Правило подвоєння «ч» та додавання апострофа здійснюється, хоча такого слова в українському лексиконі немає.
іі При синтезі всіх граматичних форм слова loSa жодне з правил на які перевірялось слово не виконалось : додавання апострофа, подвоєння букви «ч», заміна букви «і» на «о».
Синтез дієслів:
іі При синтезі таких граматичних форм слова ієШу, як іє^, letyS, letytB, ієгупю, letyte, letAtB система перевіряла ї на такі правила:
заміна букви «е» на «і»;
додавання апострофа;
подвоєння букви «ч»;
Жодне з правил не застосувалось, крім правила на додання апострофа у словоформі Хоча ІегАВ - система утворила нову словоформу 1е<:'АіВ - правило виконалось, ле слова такого в українській мові не існує. А Словоформа ІеСи повинна виконуватись за правилами заміни «т» на «ч» , перед голосними «и», «у», «е», але цього не відбулось. Словоформи Letity, letiv, ієіііп, letilo, letily, ієШупш, letitymeS, letityme перевірялись крім вище згаданих правил ще на правило заміни «і» на букву «о». Але правило не виконалось на жодну з словоформ.
іі Всі граматичні форми слова svystity такі як: svystity, svyHu, svystyS, svystytB, svystymo, svystyte, svystAtB, svystiv, svystila, svystilo, svystily, svystitymu, svystitymeS, svystitymeне були просинтезовані, хоча система все одно перевіряла їх на правила заміни «с» на «ш», додавання апострофа, подвоєння букви «ч», які не виконалися.
© При синтезі таких граматичних форм слова pysaty, як pySu, pySutB система перевіряля їх на такі правила:
додавання апострофа;
подвоєння букви «ч»;
Словоформи ру8е8, ру8е, ру8ето, ру8е1е перевірялись ще на правило заміни букви «е» на «і». Жодне правило не було застосовано до цих словоформ, а також жодна з них не перевірялась на правило заміни «с» на «ш».
Такі словоформи, як руваїу, pysaу, ру8аіа, ру8аіо, ру8аіу, рузаіути, ру8а1уте8, ру8а1уте взагалі система не просинтезувала, хоча вони перевірялись на правило заміни букви «с» на «ш», подвоєння букви «ч», додавання апострофа, які не були виконані.
іі При синтезі граматичних форм слова Іеваїу, таких як 1е8и, 1е8е8, 1е8е, 1е8ето, 1е8е1е, 1е8иіБ не виконалось жодне з правил:
заміна букви «т» на «ч», перед голосною «у»;
заміна букви «т» на «ч», перед голосними «и», «у», «е»;
заміна букви «е» на «і»;
додавання апострофа;
подвоєння букви «ч»;
заміна «с» на «ш»;
Праивло, що дозволяє замінити букву «с» на «ш» перед голосними «и», «у», «е» взагалі не виконується, що пов'язано із неправильним написанням даних у файлі икгаіпіап.уаті:
s ю S: | FSA s Ss @ s Ss @ 1: 2 1 1
2: 0 1 0
Буква «с» за цим правилом змінюється на «с», замість «ш». Це і стало причиною помилки. Крім того словоформи Іеваїу, Іевау, 1е8аіа, Іеваіо, 1е8аіу, 1е8а1ути, 1е8а1уте8, 1е8а1уте система взагалі не розпізнала під час синтезу, хоча перевірила на попередньо вказані правила також.
И При синтезі таких словоформ слова <:ор1а1у, як Іоріаіу, <:ор1ау, Іяріаіа, Іоріаіо, <:ор1аіу, <:ор1а1уііш, 1ор1а1уте8, Іоріаіуте система перевіряла їх на такі правила :
додавання апострофа перед голосними «я», «ю», «ї», «є»;
подвоєння букви «ч» («С») перед голосною «ю»;
Жодне з правил не було застосовано, оскільки для цих словоформ правил непотрібно. Слова :)рСи, :)рСе8, :)рСе, :)рСет), :)рСе:е перевірялись ще на правило заміни букви «е» на «і», та правило заміни «т» на «ч». Жодне з правил не застосувалось до даних словоформ, в звязку з неправильно попередньо записаними даними правил в файлі Ukrainian.yaml.
ії Такі словоформи слова radity перевірялись ситемою на використання правил : radity, radiU, radiES, radiE, radiEmo, radiEte, radiUtB, radiv, пиШл, radilo, radily, raditymu, raditymeS, radityme. Правила на які вони перевірялись:
заміна букви «і» на «о»;
додавання апострофа;
подвоєння букви «ч»;
заміна букви «е» на «і» ( для слів гаскЧутеБ, гасШуте)
Правила не виконались. Хоча при перевірці на правило подвоєння «ч» система видала нові результати - radiСU, radiCUtB. А при перевірці на правило вживання апострофа -radi'U, radi'ES, radi'E, radi'Emo, radi'Ete, radi'UtB. Це можна не вважати помилкою, адже правила дійсно можуть бути застосовані таким чином, хоча таких слів в українській мові не існує.
ІІ Синтез словоформ Ьугу, Ь% b'ES , b'E, b'Emo, b'Ete, b'UtB, byv, byla, bylo, Ьуіу, bytymu, bytymeS, bytyme перевіряв ці слова на правила:
подвоєння букви «ч»;
додавання апострофа;
заміна букви «е» на «і» ( для словоформ ЬуІутеБ, Ьуіуте)
Правила не були виконані. Але система створила нові слова за правилом подвоєння «ч» -Ь'СТ, b'CUtB, та за правилом вживання апострофа - b'CU, , bмE, bмEmo, bмEte. Таких слів в українському лексиконі немає, але до них застосувалось правило додавання апострофа, тому система їх і створила.
іі При синтезі таких словоформ, як smaZyty, smaZu, smaZyS, smaZutB, smaZymo, smaZyte, smaZatB, smaZyv, smaZyla, smaZylo, smaZyly, smaZytymu, smaZytymeS, smaZytyme жодне з правил не виконалось і система не просинтезувала ці слова взагалі. А перевірялись слова на правила:
заміна букви «с» на «ш»;
додавання апострофа;
подвоєння букви «ч» («С»).
ії Під час синтезу таких граматичних форм слова druZyty, як druZyty, druZu, druZyS, druZytB, druZymo, druZatB, druZyv, druZyla, druZylo, druZyly, druZytymu всі словоформи були розпізнані, на відміну від аналізу і система перевірила їх на використання таких правил:
додавання апострофа;
подвоєння букви «ч» («С»);
Словоформи dгuZytyme8, dгuZytyme, dгuZyte крім вище згаданих правил перевірялись ще на правило заміни букви «е» на «і». Але жодне з правил не виконалось.
Отже, після синтезу даних нам словоформ, можна зробити висновок, що помилки виникають через невірно написані, або взагалі не написані правила у файлі ukra.inian.yaml, що і є основною причиною проблем, пов'язаних з синтезуванням слів.
Перелік правил необхідний для реалізації морфологічного аналізатора з врахуванням слів з індивідуального завдання
Правила, записані згідно вимог програми КЄЕК та згенеровані стани скінченного перетворювача