Page 135 - Lazar, Irena, Aleksander Panjek in Jonatan Vinkler. Ur. 2020. Mikro in makro. Pristopi in prispevki k humanističnim vedam ob dvajsetletnici UP Fakultete za humanistične študije, 2. knjiga. Koper: Založba Univerze na Primorskem.

P. 135

la contr ibution de la linguistique dans l‘analyse de la dynamique sociale

dynamique des marchés boursiers (Rao et Srivastava 2014; Smailović et al.
2014).

2. Approches d’analyse de la dynamique sociale à travers
la langue

Les débats autour de différents événements de la dynamique sociale pro-
duisent généralement des émotions polarisées : les usagers soutiennent ou
détestent avec plus ou moins d’énergie les gestes des promoteurs des chan-
gements sociaux. Très souvent, les commentaires postés en tant que réac-
tions aux mouvements sociaux dépassent la portée de ce geste isolé et se ré-
fèrent à une problématique politique et sociétale plus large (Zwitter Vitez et
Fišer, 2016). La recherche présentée dans cet article porte sur les domaines
de la langue des réseaux sociaux, de l’analyse de sentiment et de l’analyse
de l’opinion.

Le discours sur Twitter fait partie du discours électronique médié
(Panckhurst 2014). Il est doté de certaines spécificités lexicales, graphiques
et syntaxiques, comme émoticônes, abréviations et répétition de caractères
(Farzindar et al. 2013) et connaît un certain nombre d’ajustements à cause
de la limitation de la quantité de caractères dans un message (280 carac-
tères maximum, espaces compris). Même si le discours sur Twitter est gé-
néralement perçu comme spontané et créatif (Vidak et Ackiewicz 2016),
Longhi (2013) constate que « cette spontanéité n’est pas forcément mainte-
nue dans le cadre du discours politique » à cause de l’impact énorme des
tweets des politiciens auprès des usagers du réseau. Parmi les spécificités du
discours sur Twitter, il semble pertinent de souligner également sa dimen-
sion technolangagière (Paveau 2013) représentée par le mot-dièse (hashtag)
qui apporte une dimension affective aux messages (Cervulle et Pailler 2014)
et, très souvent, modifie l’aspect pragmatique des messages (Longhi 2013).

Dans le cadre de l’analyse de sentiment qui fait partie du traitement
automatique du langage (Pang et Lee 2008; Smailović et al. 2014), on utilise
avant tout les méthodes d’apprentissage automatique. Celles-ci reposent
sur un ensemble d’exemples annotés manuellement avec différentes caté-
gories de sentiments (e. g. positif, négatif, neutre). Cet ensemble d’exemples
sert de modèle pour les logiciels informatiques qui identifient les caracté-
ristiques distinctives des différents sentiments. Dans l’étape suivante, les
logiciels attribuent l’un des sentiments aux exemples non-catégorisés. Ces
modèles sont très utiles sur de grands ensembles de données mais four-
nissent très souvent des résultats sous forme de n-grammes (Jalam et

511

130 131 132 133 134 135 136 137 138 139 140