Ukrainos žiniasklaidos tekstų automatinės stilometrinės analizės sistema „TextAttributor 1.0“ (metodai, priemonės, funkcionalumas)
Esminiai žodžiai:
kompiuterinė lingvistika, ukrainiečių kalba, jausmingumo analizė, autorystės priskyrimas, stilometrija, teksto klasifikavimasAnotacija
Šiame straipsnyje pristatoma straipsnio autorių sukurtos automatinės sistemos „TextAttributor“, skirtos statistiniam ukrainiečių kalbos tekstų parametrizavimui naudojant daugiaparametrinį statistinių rodiklių rinkinį, apibūdinantį autoriaus teksto stilių ir taikomą autorystės atribucijos uždaviniams, struktūra, algoritmai, įdiegimas ir eksperimentiniai rezultatai. Sukurtų lingvistinių išteklių ir programinės įrangos pagrindu sistema generuoja lingvistinę analizę pagal apskaičiuotus statistinius indeksus ir atlieka dviejų tekstų lyginamąją analizę. Papildomas statistinio indeksavimo kriterijus yra neigiamas nuotaikas sukeliančio teksto indeksas, apskaičiuojamas taikant žodinio neigiamų nuotaikų identifikavimo
metodą. Autorystės ir pagiežos nustatymo užduotys sprendžiamos dviem metodais: žodynu ir taisyklėmis pagrįstais statistiniais skaičiavimais ir mašininiu mokymusi. Dabartiniai rezultatai, gauti naudojantis „TextAttributor“ beta versija, išsamiai išnagrinėti.
