Page 138 - Lazar, Irena, Aleksander Panjek in Jonatan Vinkler. Ur. 2020. Mikro in makro. Pristopi in prispevki k humanističnim vedam ob dvajsetletnici UP Fakultete za humanistične študije, 2. knjiga. Koper: Založba Univerze na Primorskem.
P. 138
deux catégories contrastées parce que l’un des objectifs de notre étude
était d’élaborer une méthodologie utilisable également pour des analyses
de grandes quantités de textes. Nous nous rendons compte du fait qu’un
seul annotateur ne peut pas assurer une objectivité totale de catégorisation,
alors nous avons fait une attention particulière aux exemples qui n’étaient
pas clairement polarisés. Dans 4 exemples (13%), nous avons eu des doutes
avant de parvenir à la décision finale parce qu’ils impliquent des commen-
taires exprimant des sentiments différents (2) :
(2) je soutiens les gilets jaunes ; mais PAS LES CASSEURS
Dans ces 4 exemples, nous avons essayé de déterminer le sentiment
prédominant du message. Nous savons que les décisions sur le sentiment
prédominant restent subjectives et que les résultats auraient été plus fiables
si plusieurs annotateurs avaient réalisé l’annotation de sentiments.
3.3 Analyse linguistique
Nous avons analysé chaque message aux niveaux textuel, syntaxique et lexi-
cal comme suite au travail présenté dans Zwitter Vitez (2020 sous presse).
Au niveau textuel, nous avons examiné la longueur des tweets analysés (de
1 à 5 phrases). Au niveau syntaxique, nous avons d’abord examiné le type de
phrase (déclarative, exclamative, interrogative et injonctive). Ensuite, nous
avons déterminé la structure syntaxique de phrase (simple, complexe).
Dans l’étape suivante, nous avons identifié l’éventuelle présence d’éléments
lexicaux qui explicitent le sentiment de l’auteur (e. g. heureux, imbécile etc.).
Le tableau (1) présente les annotations linguistiques aux niveaux de la struc-
ture textuelle, syntaxique et lexicale du commentaire choisi.
Tableau 1. Les annotations linguistiques du commentaire choisi.
Opinion Toute la France est derrière vous !
Nombre de phrases Accord
Type de phrase 1
Structure Exclamation
Vocabulaire Simple
/
Une fois que tous les tweets ont été annotés, nous avons examiné les
deux catégories de sentiments (positive et négative) à tous les niveaux d’an-
514
était d’élaborer une méthodologie utilisable également pour des analyses
de grandes quantités de textes. Nous nous rendons compte du fait qu’un
seul annotateur ne peut pas assurer une objectivité totale de catégorisation,
alors nous avons fait une attention particulière aux exemples qui n’étaient
pas clairement polarisés. Dans 4 exemples (13%), nous avons eu des doutes
avant de parvenir à la décision finale parce qu’ils impliquent des commen-
taires exprimant des sentiments différents (2) :
(2) je soutiens les gilets jaunes ; mais PAS LES CASSEURS
Dans ces 4 exemples, nous avons essayé de déterminer le sentiment
prédominant du message. Nous savons que les décisions sur le sentiment
prédominant restent subjectives et que les résultats auraient été plus fiables
si plusieurs annotateurs avaient réalisé l’annotation de sentiments.
3.3 Analyse linguistique
Nous avons analysé chaque message aux niveaux textuel, syntaxique et lexi-
cal comme suite au travail présenté dans Zwitter Vitez (2020 sous presse).
Au niveau textuel, nous avons examiné la longueur des tweets analysés (de
1 à 5 phrases). Au niveau syntaxique, nous avons d’abord examiné le type de
phrase (déclarative, exclamative, interrogative et injonctive). Ensuite, nous
avons déterminé la structure syntaxique de phrase (simple, complexe).
Dans l’étape suivante, nous avons identifié l’éventuelle présence d’éléments
lexicaux qui explicitent le sentiment de l’auteur (e. g. heureux, imbécile etc.).
Le tableau (1) présente les annotations linguistiques aux niveaux de la struc-
ture textuelle, syntaxique et lexicale du commentaire choisi.
Tableau 1. Les annotations linguistiques du commentaire choisi.
Opinion Toute la France est derrière vous !
Nombre de phrases Accord
Type de phrase 1
Structure Exclamation
Vocabulaire Simple
/
Une fois que tous les tweets ont été annotés, nous avons examiné les
deux catégories de sentiments (positive et négative) à tous les niveaux d’an-
514