Ukrainos žiniasklaidos tekstų automatinės stilometrinės analizės sistema „TextAttributor 1.0“ (metodai, priemonės, funkcionalumas)

Autoriai

  • Nataliia Darchuk , , ,
  • Oksana Zuban , , ,
  • Valentyna Robeiko , , ,
  • Yuliia Tsyhvintseva , , ,
  • Victor Sorokin , , ,
  • Mykola Sazhok , , ,

Esminiai žodžiai:

kompiuterinė lingvistika, ukrainiečių kalba, jausmingumo analizė, autorystės priskyrimas, stilometrija, teksto klasifikavimas

Anotacija

Šiame straipsnyje pristatoma straipsnio autorių sukurtos automatinės sistemos „TextAttributor“, skirtos statistiniam ukrainiečių kalbos tekstų parametrizavimui naudojant daugiaparametrinį statistinių rodiklių rinkinį, apibūdinantį autoriaus teksto stilių ir taikomą autorystės atribucijos uždaviniams, struktūra, algoritmai, įdiegimas ir eksperimentiniai rezultatai. Sukurtų lingvistinių išteklių ir programinės įrangos pagrindu sistema generuoja lingvistinę analizę pagal apskaičiuotus statistinius indeksus ir atlieka dviejų tekstų lyginamąją analizę. Papildomas statistinio indeksavimo kriterijus yra neigiamas nuotaikas sukeliančio teksto indeksas, apskaičiuojamas taikant žodinio neigiamų nuotaikų identifikavimo
metodą. Autorystės ir pagiežos nustatymo užduotys sprendžiamos dviem metodais: žodynu ir taisyklėmis pagrįstais statistiniais skaičiavimais ir mašininiu mokymusi. Dabartiniai rezultatai, gauti naudojantis „TextAttributor“ beta versija, išsamiai išnagrinėti.

Atsisiuntimai

Išleista

2024-12-20

Numeris

Skyrius

Straipsniai