Page 25 - Fister jr., Iztok, and Andrej Brodnik (eds.). StuCoSReC. Proceedings of the 2018 5th Student Computer Science Research Conference. Koper: University of Primorska Press, 2018
P. 25
ZAKLJUCˇ EK veˇc kot 300 ljudi, a zaznati je upad tega ˇzalostnega
dejanja, 2017.
V tem delu smo se osredotoˇcili na klasifikacijo samomoril- [12] J. Russel. A collection of suicide notes & letters -
nih pisem. Program pisma analizira postopoma. Najprej nad russel’s cyber journal, 2008.
korpusom izvedemo predprocesiranje besedila, da dobimo [13] stephenhky. Flesch-kincaid readability measure -
ˇcisto besedilo (same male ˇcrke, brez ostalih znakov). Nato everything about data analytics big data, data
se izvede oblikoslovno oznaˇcevanje besed in statistika posa- analytics, 2016.
meznih pisem. Opravili smo tudi test berljivosti besedila, ki [14] Wikipedia. Suicide, 2018.
ga uporabimo pri strojnem uˇcenju. Analiziramo tudi ˇcustva,
nato pa vse skupaj zdruˇzimo v datoteko CSV in izvedemo
nadzorovano strojno uˇcenje.

Kot je razvidno iz rezultatov smo zadani projekt razpoz-
nave pristnih poslovilnih pisem uspeˇsno izvedli. Po podat-
kih avtorjev ˇclanka [10] so strokovnjaki s podroˇcja psiholo-
gije dosegli 63% natanˇcnost, medtem ko naˇsa metoda vraˇca
rezultate z 68% natanˇcnostjo.

Tukaj je pomembno opozoriti, da v naˇsem ˇclanku nismo upo-
rabili istega nabora pisem, kot so ga avtorji prej omenjenega
ˇclanka. Poslediˇcno rezultatov naˇsih eksperimentov ni mogoˇce
neposredno primerjati z rezultati v sorodnih ˇclankih. Pri-
dobitev pristnih in laˇznih pisem, ki ustrezajo pogojem, je
izredno zapleteno opravilo, pri katerem bi za veˇcjo zaneslji-
vost pri zagotavljanju norm potrebovali ustrezno usposobl-
jene osebe, ki bi obenem imele dostop do tovrstnih arhivov.

V prihodnosti bi lahko metodo razˇsirili tako, da ne bi bila
omejena samo na angleˇski jezik. Izboljˇsave bi tudi prinesla
veˇcja mnoˇzica pisem in dodatne metode za ocenjevanje struk-
ture besedila.

7. VIRI

[1] L. A. L. L. Cha´vez-Herna´ndez AM1, P´aramo D.
Suicide notes in mexico: what do they tell us? Suicide
Life Threat Behav, 36:709–15, December 2006.

[2] L. D. Handelman LD. The content of suicide notes
from attempters and completers. Oxford University
Press, 28:102–104, 2007.

[3] J. Harper. A collection of real suicide notes | historic
mysteries, 2015.

[4] A. A. Leenaars. Suicide notes in the courtroom. 1999.

[5] C. Michard. clemtoy/wnaffect a python module to get
the emotion of a word., 2017.

[6] O. P. M. Mukta Rani, Shalini Girdhar. Suicide note:
The last words. 2015.

[7] NIJZ. Svetovni dan prepreˇcevanja samomora: ”vzemi
si trenutek, reˇsi ˇzivljenje”, 2017.

[8] NLTK. Natural language toolkit, 2017.

[9] F. Pedregosa, G. Varoquaux, A. Gramfort, V. Michel,
B. Thirion, O. Grisel, M. Blondel, P. Prettenhofer,
R. Weiss, V. Dubourg, J. Vanderplas, A. Passos,
D. Cournapeau, M. Brucher, M. Perrot, and
E. Duchesnay. Scikit-learn: Machine learning in
Python. Journal of Machine Learning Research,
12:2825–2830, 2011.

[10] J. Pestian, H. Nasrallah, P. Matykiewicz, A. Bennett,
and A. Leenaars. Suicide note classification using
natural language processing: A content analysis.
Biomedical Informatics Insights, 2010:19–28, August
2010.

[11] Politikis. Zaradi samomora vsako leto v sloveniji umre

StuCoSReC Proceedings of the 2018 5th Student Computer Science Research Conference 25
Ljubljana, Slovenia, 9 October
   20   21   22   23   24   25   26   27   28   29   30