Page 19 - Fister jr., Iztok, and Andrej Brodnik (eds.). StuCoSReC. Proceedings of the 2015 2nd Student Computer Science Research Conference. Koper: University of Primorska Press, 2015
P. 19
liza sentimenta z uporabo emotikonov in besednih
zvez

Tadej Jerovšek Tadej Ganza

Fakulteta za elektrotehniko Fakulteta za elektrotehniko

racˇunalništvo in informatiko racˇunalništvo in informatiko

Smetanova ulica 17, 2000 Smetanova ulica 17, 2000

Maribor Maribor

Maribor, Slovenija Maribor, Slovenija

tadej.jerovsek@student.um.si
tadej.ganza@student.um.si

Tomaž Cebek Martin Kraner Borko Boškovic´

Fakulteta za elektrotehniko Fakulteta za elektrotehniko Fakulteta za elektrotehniko

racˇunalništvo in informatiko racˇunalništvo in informatiko racˇunalništvo in informatiko

Smetanova ulica 17, 2000 Smetanova ulica 17, 2000 Smetanova ulica 17, 2000

Maribor Maribor Maribor

Maribor, Slovenija Maribor, Slovenija Maribor, Slovenija

tomaz.cebek@student.um.si martin.kraner1@student.um.si borko.boskovic@um.si

POVZETEK Splošni pojmi

V ˇclanku smo obravnavali analizo sentimenta kratkih sporo- Therory
ˇcil popularnega spletnega druˇzbenega omreˇzja Tweeter1, oz. Languages
”tweetov”. Sentimentalno analizo smo izvajali nad lematizi- Experimentation
ranimi besedami sporoˇcila z uporabo ustaljenih metod. Ker
so sporoˇcila kratka (omejena na 140 znakov), je sentiment 1. UVOD
teˇzko oceniti. Da bi dobili veˇc informacij, smo v algoritem
vkljuˇcili emotikone (“hashtag“), ter bazo fraz in besednih Ljudje v digitalni dobi vse pogosteje objavljajo svoje misli
zvez, ki pri analizi po besedah dajejo napaˇcen rezultat. Po- in kaj poˇcnejo na javnih spletnih mestih. Med temi informa-
sebej smo analizirali sentiment besedila in emotikonov in ga cijami podajo svoje mnenje glede doloˇcenih dogodkov, izdel-
nato s pomoˇcjo uteˇzi zdruˇzili v eno konˇcno oceno. Pred- kov, politikov in podobno. Analiza sentimenta se ukvarja z
stavljen algoritem smo primerjali z algoritmom iz literature ekstrakcijo teh informacij, kar omogoˇca hitro in lahko ugota-
v veˇcih kategorijah, kot so samo analiza besedila, analiza vljanje mnenja velikega ˇstevila ljudi glede doloˇcene tematike.
z emotikoni ter naˇsa izboljˇsana reˇsitev. Dobljeni rezultati Primer tega so lahko tudi moˇznosti zmage na volitvah, kar
kaˇzejo, da je naˇs algoritem dosegel za 1,35% boljˇso oceno se v ˇcasu volitev na medijih “prodaja“ kot med.
metrike F1.
Pri tem je veˇc pristopov, ki pa v veliki veˇcini temeljijo na
Kategorije in opisi teme besedilni analizi. Slabost tega pristopa je, da je praktiˇcno
nemogoˇce ugotoviti informacije, ki bi jih v naravnem govoru
H.4 [Information Systems Applications]: Miscellane- sporoˇcevalec podal s telesnim govorom. Tako kaj hitro na-
ous; H.3.1 [Information Storage and Retrieval]: Con- paˇcno razvrstimo sentiment, ko govorec uporabi sarkazem
tent Analysis and Indexing—Linguistic processing ali kakˇsno drugo retoriˇcno obliko.
; I.2.7 [Artificial intelligence]: Natural Language Proces-
sing—Language parsing and understanding, Text analysis Kot dopolnilo klasiˇcnemu pisanju je profesor Scott Fahlman
leta 1982 poskusil uporabiti prva emotikona ”:-)”in ”:-(”. S
1Dostopno na spletnem naslovu http://www.tweeter.com tema je predlagal, da bi pisec izraˇzal razliko med resno mi-
slijo, ali ˇsalo. Ta koncept je hitro postal zelo priljubljen
in se je razˇsiril po celotnem svetovnem spletu, kjer danes
emotikoni predstavljajo sploˇsen koncept izraˇzanja.

Zaradi uporabe emotikonov, je mogoˇce iz kratkih sporoˇcil iz-
vedeti precej bolj podrobno informacijo o sentimentu kakor
iz klasiˇcnih besedilnih sporoˇcil, vendar je na tem podroˇcju
malo poudarka.

StuCoSReC Proceedings of the 2015 2nd Student Computer Science Research Conference 19
Ljubljana, Slovenia, 6 October
   14   15   16   17   18   19   20   21   22   23   24