Η μεθοδολογία εργασίας, από τη συλλογή ως την ανάλυση των δεδομένων, στο πλαίσιο του έργου για την ανάλυση του προεκλογικού πολιτικού λόγου. Το iMEdD Lab ενώνει τις δυνάμεις του με το Datalab και τον Αντώνη Γαλανόπουλο, υποψήφιο διδάκτορα πολιτικής επιστήμης στο ΑΠΘ, ενσωματώνει το ChatGPT στη ροή των εργασιών και παρουσιάζει μια πειραματική συνεργασία ανθρώπων και τεχνητής νοημοσύνης.
Αναλύοντας τον προεκλογικό πολιτικό λόγο στην Ελλάδα
Με αλγόριθμους τεχνητής νοημοσύνης ανιχνεύουμε τα επίπεδα πόλωσης, λαϊκισμού και συναισθήματος στους λόγους των πολιτικών αρχηγών
Σε ποια θέματα αναφέρονται οι πολιτικοί αρχηγοί στον δημόσιο λόγο τους κατά τη διάρκεια της προεκλογικής περιόδου, σε ποια από αυτά εστιάζει περισσότερο ο καθένας τους και ποια είναι τα ποιοτικά χαρακτηριστικά του πολιτικού λόγου τους είναι τα κύρια ερευνητικά ερωτήματά μας στο πλαίσιο του έργου για την ανάλυση του προεκλογικού πολιτικού λόγου.
Ήδη από το στάδιο του πρώιμου σχεδιασμού της έρευνας, κρίναμε ότι, για τις ανάγκες του εν λόγω έργου, είναι σκόπιμο να μη βασιστούμε μόνο σε ανθρώπινες δυνάμεις: η τεχνητή νοημοσύνη έχει καταφέρει πολλά, υπόσχεται ακόμη περισσότερα και, βέβαια, πλέον είναι διαθέσιμη προς χρήση από οποιονδήποτε στην πιο εκλαϊκευμένη και επαναστατική έκδοσή της μέχρι σήμερα, μέσω του διαλογικού μοντέλου ChatGPT. Αυτό από μόνο του ήταν αρκετό για να σκεφτούμε ότι η χρήση του τελευταίου ως συστατικού εργαλείου της έρευνας, αφενός, θα μείωνε δραστικά τις ταχύτητες διεξαγωγής τής ανάλυσης και, αφετέρου, σταδιακά θα έδινε απαντήσεις σε παράλληλα ερωτήματά μας σχετικά με τις δυνατότητες και τους περιορισμούς αυτής της πολυσυζητημένης τεχνολογίας. Επομένως, συνολικά το έργο σχεδιάστηκε και υλοποιείται ως μια πειραματική συνεργασία μεταξύ ανθρώπων (προερχόμενων από τη δημοσιογραφία, τον τομέα της πολιτικής θεωρίας και της επιστήμης των δεδομένων) και τεχνητής νοημοσύνης, με διττό σκοπό: αφενός, να αναλύουμε τον πολιτικό προεκλογικό λόγο καθώς αυτός εκφωνείται από τους αρχηγούς των κομμάτων και, αφετέρου, να εξερευνήσουμε τα όρια της σύγχρονης τεχνολογίας.
Η συλλογή των ομιλιών
Στο πλαίσιο του έργου, αντικείμενο μελέτης αποτελεί ο προεκλογικός λόγος των πολιτικών αρχηγών των έξι κομμάτων που βρίσκονταν στο ελληνικό κοινοβούλιο κατά την τελευταία κοινοβουλευτική περίοδο (ΙΗ’ Περίοδος, 17 Ιουλίου 2019 έως 22 Απριλίου 2023).
Πρόκειται για τους:
- Κυριάκο Μητσοτάκη, Πρωθυπουργό και Πρόεδρο της Νέας Δημοκρατίας
- Αλέξη Τσίπρα, Πρόεδρο του ΣΥΡΙΖΑ-ΠΣ
- Νίκο Ανδρουλάκη, Πρόεδρο του ΠΑΣΟΚ-ΚΙΝΑΛ
- Δημήτρη Κουτσούμπα, Γενικό Γραμματέα του ΚΚΕ
- Κυριάκο Βελόπουλο, Πρόεδρο της Ελληνικής Λύσης
- Γιάνη Βαρουφάκη, Γραμματέα του ΜέΡΑ25
Ως προεκλογικός λόγος έχει οριστεί, από την ομάδα εργασίας, οποιαδήποτε ομιλία των προαναφερθέντων πολιτικών αρχηγών λαμβάνει χώρα σε δημόσιο χώρο, παρουσία κοινού, από την ημερομηνία της επίσημης προκήρυξης των βουλευτικών εκλογών στην Ελλάδα (22 Απριλίου 2023) και έπειτα. Ολιγόλεπτες τοποθετήσεις ή δηλώσεις (για παράδειγμα, συντομότερες των 15 λεπτών) ή στιχομυθίες των πολιτικών αρχηγών με πολίτες δεν λαμβάνονται υπόψη ως προεκλογικές ομιλίες και δεν μελετώνται στο πλαίσιο του προκείμενου έργου. Επίσης, οι προεκλογικές ομιλίες αποτελούν αντικείμενο μελέτης εφόσον αυτές διατίθενται ολόκληρες −και όχι αποσπασματικά.
Κατ’ εξαίρεση, ελλείψει προεκλογικών ομιλιών όπως ορίζονται παραπάνω, στην περίπτωση του Κυριάκου Βελόπουλου, αναλύονται οι ομιλίες με τις οποίες έχουν εκκινήσει διαφορετικές συνεντεύξεις Τύπου που ο ίδιος έχει παραχωρήσει. Σημειώνεται ότι, καθώς αυτές δεν έχουν διεξαχθεί σε δημόσιο χώρο παρουσία κοινού (πλην παριστάμενων δημοσιογράφων), οι εν λόγω αναλύσεις δεν μπορούν να εκληφθούν ως άμεσα συγκρίσιμες με τις υπόλοιπες που αντιστοιχούν σε λοιπούς πολιτικούς αρχηγούς.
Για την ανάλυση των ομιλιών, «πρώτη ύλη» αποτελεί το γραπτό κείμενο του λόγου του εκάστοτε πολιτικού αρχηγού, όπως αυτό συλλέγεται ή/και διαμορφώνεται από την ομάδα εργασίας ως εξής:
- Εάν το γραπτό κείμενο της κάθε ομιλίας παρέχεται από το εκάστοτε κόμμα, τότε είναι αυτό που χρησιμοποιείται προς ανάλυση. Εάν αυτό το γραπτό κείμενο είναι ήδη παραγραφοποιημένο σύμφωνα με τη θεματική δομή του, τότε αυτή η παραγραφοποίηση διατηρείται από την ομάδα εργασίας. Σε περιπτώσεις όπου γραπτά κείμενα ομιλιών δεν είναι ήδη παραγραφοποιημένα ή έχουν παραγραφοποιηθεί με όρους προφορικότητας, τότε η ομάδα εργασίας επιμελείται το κείμενο και το διακρίνει σε παραγράφους ανάλογα με τη θεματική δομή του.
- Όταν οι ομιλίες των πολιτικών αρχηγών δεν παρέχονται γραπτώς από τα κόμματα, αλλά διατίθενται σε οπτικοακουστικά αρχεία, τότε αυτές απομαγνητοφωνούνται με τη βοήθεια τεχνητής νοημοσύνης −συγκεκριμένα, για τις ανάγκες της απομαγνητοφώνησης χρησιμοποιείται το εργαλείο Transkriptor. Σε αυτές τις περιπτώσεις, η ομάδα εργασίας επιμελείται το απομαγνητοφωνημένο κείμενο τόσο για τη διασφάλιση της ακρίβειας των λεγομένων όσο και για την παραγραφοποίησή του σύμφωνα με τη θεματική δομή του.
Σε κάθε περίπτωση, κύριες πηγές συλλογής των ομιλιών αποτελούν:
- Τα γραφεία Τύπου των έξι κομμάτων
- Τα διαδικτυακά κανάλια επικοινωνίας των έξι κομμάτων και των πολιτικών αρχηγών τους, δηλαδή οι ιστοσελίδες τους και οι λογαριασμοί τους στα μέσα κοινωνικής δικτύωσης, περιλαμβανομένων όσων σχετίζονται με την ψηφιακή παρουσία του (εκάστοτε) Πρωθυπουργού
- Το Αθηναϊκό – Μακεδονικό Πρακτορείο Ειδήσεων (ΑΠΕ-ΜΠΕ)
- Η ΕΡΤ
- Λοιπός Τύπος −κατ΄εξαίρεση και μόνο σε ελάχιστες περιπτώσεις όπου κάποια ομιλία μπορεί να μη διατίθεται ολόκληρη, σε καμία μορφή, από τις προαναφερθείσες πηγές, αλλά να έχει δημοσιευθεί από άλλα μέσα.
Αφού συλλεχθεί/διαμορφωθεί το γραπτό κείμενο κάθε ομιλίας, αυτό μεταφράζεται στα αγγλικά επίσης με τη βοήθεια τεχνητής νοημοσύνης −συγκεκριμένα, χρησιμοποιείται το API (Application Programming Interface, «διεπαφή προγραμματισμού εφαρμογών») του διαδικτυακού μεταφραστικού εργαλείου DeepL.
Το μεταφρασμένο αυτό κείμενο της ομιλίας είναι που καλείται να αναλύσει το ChatGPT, βασιζόμενο σε ορισμούς και επιλογές που η ομάδα εργασίας του υποδεικνύει.
Η ανάλυση των ομιλιών και η συνομιλία μας με το ChatGPT: τι του ζητάμε και πώς του το ζητάμε
Οι προεκλογικές ομιλίες των πολιτικών αρχηγών αναλύονται, σε επίπεδο παραγράφου, ως προς τα εξής:
- Εάν τα λεγόμενα του αρχηγού αφορούν κυρίως κριτική προς πολιτικούς αντιπάλους ή εάν αφορούν κυρίως την ατζέντα του κόμματος που εκπροσωπεί. Στο πλαίσιο του έργου, ιδέες, απόψεις, θέσεις, πρόγραμμα του κόμματος κλπ θεωρούνται ως «ατζέντα» από την ομάδα εργασίας.
- Το επικρατέστερο θέμα τους. Για τους σκοπούς της θεματικής ανάλυσης, από την ομάδα εργασίας έχει συγκροτηθεί μία λίστα θεμάτων, η οποία δύναται να εμπλουτιστεί, εάν χρειαστεί, κατά τη διάρκεια της προεκλογικής περιόδου. Κατόπιν δοκιμών, ελέγχων του περιεχομένου των ομιλιών, βελτιώσεων του θεματικού καταλόγου και σχετικών επανελέγχων, η ισχύουσα έκδοση της εν λόγω λίστας θεμάτων, η οποία και χρησιμοποιείται επί του παρόντος, περιλαμβάνει τα εξής θέματα: αγροτική πολιτική, ανθρώπινα δικαιώματα, αποχή από τις εκλογές, διαφάνεια, διαφθορά, δικαιοσύνη, δημοκρατία, δημόσιος τομέας, εθνική ασφάλεια, εκλογές, εκπαίδευση, ενέργεια, επιχειρηματικότητα, εξωτερική πολιτική, εργασία, Ευρώπη, ιδιωτικοποιήσεις, κοινωνικό κράτος, λογοδοσία, μεταναστευτικό, ΜΜΕ, οικονομία, πανδημία, περιβάλλον, πολιτισμός, προστασία των πολιτών, συνταξιούχοι, στέγαση, τουρισμός, υγεία, υποδομές, χρέος. Διατίθεται, επίσης, η κατηγορία «άλλα», για περιπτώσεις όπου το επικρατέστερο θέμα της παραγράφου δεν είναι κανένα από τα προαναφερθέντα.
- Το κυρίαρχο συναίσθημα που εντοπίζεται (sentiment analysis): είναι θετικός, ουδέτερος ή αρνητικός ο λόγος που εκφέρεται;
- Επίπεδο πολιτικής πόλωσης (polarization) που ανιχνεύεται στον λόγο
- Επίπεδο λαϊκισμού (populism) που ανιχνεύεται στον λόγο
- Οντότητες που κατονομάζονται (ονόματα, επωνυμίες, τοπωνύμια κλπ)
Με τη χρήση, αφενός, της γλώσσας προγραμματισμού Python και, αφετέρου, του ChatGPT API (gpt-3.5-turbo), «συνομιλούμε» προγραμματιστικά με το διαλογικό μοντέλο τεχνητής νοημοσύνης. Συγκεκριμένα, για καθεμία από τις παραγράφους της εκάστοτε μελετώμενης ομιλίας, ζητάμε από το ChatGPT να μας επιστρέψει:
- Την τιμή «criticism» ή την τιμή «political agenda», εάν θεωρεί ότι ο πολιτικός αρχηγός κυρίως ασκεί κριτική σε αντιπάλους ή κυρίως αναφέρεται σε θέσεις ή πρόγραμμα του κόμματος
- Από τη λίστα θεμάτων (την οποία παρέχουμε στο ChatGPT μεταφρασμένη στα αγγλικά), το θέμα το οποίο θεωρεί ως το πιθανότερο για το μελετώμενο απόσπασμα του πολιτικού λόγου
- Μία τιμή εντός του εύρους -1 έως 1 για το συναίσθημα (sentiment) του λόγου, όπου η τιμή -1 αντιστοιχεί σε αρνητικό συναίσθημα, η τιμή 0 σε ουδέτερο και η τιμή 1 σε θετικό
- Μία τιμή εντός του εύρους 0 έως 1 για το επίπεδο πολιτικής πόλωσης που ανιχνεύεται στον λόγο
- Μία τιμή εντός του εύρους 0 έως 1 για το επίπεδο λαϊκισμού που ανιχνεύεται στον λόγο
- Mία λίστα με τις οντότητες (entities) που κατονομάζονται στο κείμενο, εφόσον αυτές ανήκουν σε κάποιον από τους εξής τύπους: άτομο, ομάδα ατόμων, οργανισμός, πολιτικό κόμμα, τοποθεσία, χώρα, ημερομηνία
Στις εντολές (prompts) που δίνουμε στο ChatGPT παρέχεται από την ομάδα εργασίας περικείμενο (context), το οποίο το μοντέλο λαμβάνει υπόψη του, στις εξής περιπτώσεις:
- Όταν το ChatGPT καλείται να απαντήσει ποιο είναι το θέμα του λόγου, του παρέχεται περικείμενο από την ομάδα εργασίας, προκειμένου να γνωρίζει: α) το όνομα και την ιδιότητα του πολιτικού αρχηγού στον οποίο ανήκουν τα μελετώμενα λεγόμενα, β) περί τίνος πρόκειται όταν στα μελετώμενα λεγόμενα γίνεται αναφορά στα «Τέμπη». Το τελευταίο παρέχεται, ως μέρος του context που λαμβάνει υπόψη του το ChatGPT, για τα υπό μελέτη λεγόμενα όλων των πολιτικών αρχηγών. Αυτό κρίθηκε απαραίτητο μετά τις πρώτες δοκιμαστικές συνομιλίες μας με το μοντέλο, όταν διαπιστώθηκε ότι, μη γνωρίζοντας περί τίνος ακριβώς πρόκειται, το ChatGPT ερμήνευε λεγόμενα που σχετίζονται με την εν λόγω τραγωδία στην Ελλάδα ως θέματα οικονομίας.
Ως ενδεικτικά παραδείγματα, στις περιπτώσεις λεγομένων του Κυριάκου Μητσοτάκη και του Αλέξη Τσίπρα, το context που παρέχεται στο ChatGPT από την ομάδα εργασίας είναι κατ’ αντιστοιχία:
-«You are reading a passage from a pre-election speech of Greek Prime Minister Kyriakos Mitsotakis, leader of New Democracy political party. When you read the term Tempi, this responds to the tragic accident occurred in northern Greece when two trains collided in the village of Tempi, leaving 57 people dead». («Διαβάζεις απόσπασμα προεκλογικού λόγου του Έλληνα Πρωθυπουργού, Κυριάκου Μητσοτάκη, αρχηγού του πολιτικού κόμματος Νέα Δημοκρατία. Όταν διαβάζεις τον όρο “Τέμπη”, αυτός αφορά στο τραγικό ατύχημα που συνέβη στη βόρεια Ελλάδα, όπου δύο τρένα συγκρούστηκαν στο χωριό των Τεμπών, αφήνοντας νεκρούς 57 ανθρώπους».)
-«You are reading a passage from a pre-election speech of Alexis Tsipras, a Greek politician leader of the opposition party SYRIZA (Coalition of the Radical Left). When you read the term Tempi, this responds to the tragic accident occurred in northern Greece when two trains collided in the village of Tempi, leaving 57 people dead». («Διαβάζεις απόσπασμα προεκλογικού λόγου του Αλέξη Τσίπρα, Έλληνα πολιτικού και αρχηγού του κόμματος της αντιπολίτευσης ΣΥΡΙΖΑ (Συνασπισμός Ριζοσπαστικής Αριστεράς). Όταν διαβάζεις τον όρο “Τέμπη”, αυτός αφορά στο τραγικό ατύχημα που συνέβη στη βόρεια Ελλάδα, όπου δύο τρένα συγκρούστηκαν στο χωριό των Τεμπών, αφήνοντας νεκρούς 57 ανθρώπους».)
- Όταν το ChatGPT καλείται να απαντήσει, με μία τιμή εντός του εύρους 0 έως 1, σχετικά με το επίπεδο πόλωσης και το επίπεδο λαϊκισμού που ανιχνεύεται στον λόγο, του παρέχεται ως context, το οποίο λαμβάνει υπόψη του, ο ορισμός της πόλωσης και ο ορισμός του λαϊκισμού, όπως αυτοί συντάχθηκαν από τον πολιτικό επιστήμονα που είναι μέλος της ομάδας εργασίας. Συγκεκριμένα, οι ορισμοί που παρέχονται ως context στο ChatGPT κατά περίπτωση είναι:
«Polarization is considered an important feature of political systems. Although usually seen as a negative trait, it is important to recognise that a certain degree of polarization is reasonable and perhaps necessary. Political polarization represents the intensity of binary, opposing political ideologies and their respective party identities. Below are some critical features of a polarizing discourse:
1) Polarization occurs when a discourse promotes strong partisan or ideological divisions. This discourse promotes a representation of politics in dichotomous and binary terms, where society is divided into two major camps. A multitude of differences and contradictions are reduced to a single division. The remaining differences are downplayed.
2) The two political and ideological positions that this discourse constructs are presented as incompatible, and the political views and attitudes of citizens tend to diverge and cluster around these two opposing ideological positions. It creates a powerful and irreconcilable opposition between two camps, each challenging or even denying the legitimacy of the other. The political opponent becomes an enemy.
3) This discourse limits pluralism and fosters fanaticism. It results in the marginalization of intermediate or alternative views from the public sphere and, correspondingly, the squeezing and even the exclusion of smaller parties.
4) A discourse that increases polarization perceives and describes politics through the “us” vs. “them” distinction. There is no midpoint, everyone is asked to choose sides.
5) A discourse of polarization has a strong emotional dimension.
6) Polarizing discourse, in order to gain depth, often invokes deeply rooted social identities or social divisions that last over time and emphasizes opposing pairs of concepts and values (for example, modernization-tradition, progress-conservatism, workers-capitalists, right-left)».
Για τις ανάγκες της παρούσας δημοσίευσης, ο παραπάνω ορισμός παρατίθεται στα ελληνικά ως εξής:
Η πόλωση θεωρείται σημαντικό γνώρισμα των πολιτικών συστημάτων. Αν και συνήθως αντιμετωπίζεται ως αρνητικό γνώρισμα, είναι σημαντικό να αναγνωρίσουμε ότι ένας ορισμένος βαθμός πόλωσης είναι εύλογος και ίσως αναγκαίος. Η πολιτική πόλωση αντιπροσωπεύει την ένταση των δυαδικών, αντιθετικών πολιτικών ιδεολογιών και των αντίστοιχων κομματικών ταυτοτήτων τους. Παρακάτω παρουσιάζονται μερικά κρίσιμα χαρακτηριστικά ενός πολωτικού λόγου:
1) Η πόλωση εμφανίζεται όταν ένας λόγος προωθεί έντονες κομματικές ή ιδεολογικές διαιρέσεις. Ο λόγος αυτός προωθεί μια αναπαράσταση της πολιτικής με όρους διχοτομικούς και δυαδικούς, όπου η κοινωνία χωρίζεται σε δυο μεγάλα στρατόπεδα. Ένα πλήθος διαφορών και αντιθέσεων ανάγονται σε μια και μόνο διαίρεση. Οι υπόλοιπες διαφορές υποτιμούνται.
2) Οι δυο πολιτικές και ιδεολογικές θέσεις που οικοδομεί αυτός ο λόγος παρουσιάζονται ως ασυμβίβαστες και οι πολιτικές απόψεις και στάσεις των πολιτών τείνουν να αποκλίνουν και να συγκεντρώνονται γύρω από αυτές τις δυο αντιθετικές ιδεολογικές θέσεις. Δημιουργεί μια ισχυρή και ασυμβίβαστη αντίθεση μεταξύ δυο στρατοπέδων που το καθένα αμφισβητεί ή και αρνείται τη νομιμότητα του άλλου. Ο πολιτικός αντίπαλος μετατρέπεται σε εχθρό.
3) Ο λόγος αυτός περιορίζει την πολυφωνία και καλλιεργεί τον φανατισμό. Έχει ως αποτέλεσμα την περιθωριοποίηση των ενδιάμεσων ή εναλλακτικών απόψεων από τη δημόσια σφαίρα και αντίστοιχα τη συμπίεση έως και τον αποκλεισμό των μικρότερων κομμάτων.
4) Ένας λόγος που αυξάνει την πόλωση αντιλαμβάνεται και περιγράφει την πολιτική μέσα από τη διάκριση «εμείς» εναντίον «αυτοί». Δεν υπάρχει μέση θέση, όλοι καλούνται να επιλέξουν πλευρές.
5) Ο λόγος της πόλωσης έχει μια ισχυρή συναισθηματική διάσταση.
6) Ο πολωτικός λόγος, για να αποκτήσει βάθος, επικαλείται συχνά ριζωμένες κοινωνικές ταυτότητες ή κοινωνικές διαιρέσεις με διάρκεια στον χρόνο και δίνει έμφαση σε αντιθετικά ζεύγη εννοιών και αξιών (για παράδειγμα, εκσυγχρονισμός-παράδοση, πρόοδος-συντήρηση, εργάτες-καπιταλιστές, Δεξιά-Αριστερά).
Για τον δείκτη του λαϊκισμού:
«Populism is a type of political discourse that aims to construct the collective subject “the people”. In the context of the analysis it is understood as a neutral term. A populist discourse claims to express popular interests or demands against elites or the status quo. As such, it promotes an antagonistic, dichotomous representation of the social field between the people and the elites, the many and the few, the bottom and the top. There are two basic criteria that must be met in order for a discourse to be recognized as populist:
(a) People-centrism, i.e. the focus on the people: The signifier ‘people’ must be central to the discourse in question. This discourse refers to ‘the people’, regularly invokes ‘the people’ and attempts to represent them by representing their demands and interests.
(b) Anti-elitism: It refers to the dichotomous representation of society between an “us” (the people, the underprivileged, the subordinate and excluded classes) and a “them” (the status quo, the elites, the system, the power). Society is divided into two antagonistic camps.
Both criteria must be present for a discourse to be classified as populist».
Για τις ανάγκες της παρούσας δημοσίευσης, ο παραπάνω ορισμός παρατίθεται στα ελληνικά ως εξής:
«Ο λαϊκισμός είναι μια μορφή πολιτικού λόγου που στοχεύει στην οικοδόμηση του συλλογικού υποκειμένου «λαός». Στο πλαίσιο της ανάλυσης γίνεται κατανοητός ως ένας όρος ουδέτερος. Ένας λαϊκιστικός λόγος ισχυρίζεται ότι εκφράζει τα λαϊκά συμφέροντα ή αιτήματα απέναντι στις ελίτ ή το κατεστημένο. Ως εκ τούτου, προωθεί μια ανταγωνιστική, διχοτομική αναπαράσταση του κοινωνικού πεδίου μεταξύ του λαού και των ελίτ, των πολλών και των λίγων, των από κάτω και των από πάνω. Υπάρχουν δυο βασικά κριτήρια που πρέπει να πληρούνται ώστε να αναγνωριστεί ένας λόγος ως λαϊκιστικός:
α) ο λαοκεντρισμός, η εστίαση δηλαδή στον λαό. Το σημαίνον «λαός» πρέπει να έχει κεντρική θέση στον συγκεκριμένο λόγο. Ο λόγος αυτός αναφέρεται στον «λαό», επικαλείται τακτικά τον «λαό» και επιχειρεί να τον εκπροσωπήσει, αντιπροσωπεύοντας τα αιτήματα και τα συμφέροντά του.
β) ο αντι-ελιτισμός. Αναφέρεται στην διχοτομική αναπαράσταση της κοινωνίας μεταξύ ενός «εμείς» (ο λαός, οι μη προνομιούχοι, οι υποτελείς και αποκλεισμένες τάξεις) και ενός «αυτοί» (το κατεστημένο, οι ελίτ, το σύστημα, η εξουσία). Η κοινωνία χωρίζεται σε δύο ανταγωνιστικά στρατόπεδα.
Και τα δυο κριτήρια πρέπει να είναι παρόντα για να χαρακτηριστεί ένας λόγος ως λαϊκιστικός».
Ο έλεγχος και η διόρθωση των αποτελεσμάτων
Για κάθε μελετώμενη ομιλία, συγκροτείται σύνολο δεδομένων (dataset) το οποίο περιέχει γραμμές ισάριθμες με τις παραγράφους του εκάστοτε λόγου και στήλες ισάριθμες με τις υπό μελέτη μεταβλητές. Ακολούθως, τα αποτελέσματα του ChatGPT ελέγχονται και διορθώνονται όπως περιγράφεται παρακάτω.
Η κριτική, η πολιτική ατζέντα και το θέμα κάθε παραγράφου
Τουλάχιστον δύο δημοσιογράφοι διαβάζουν τις υπό ανάλυση παραγράφους και ελέγχουν τα αποτελέσματα του ChatGPT ως προς: α) εάν το εκάστοτε απόσπασμα του λόγου αποτελεί κριτική προς αντιπάλους ή θέσεις/πρόγραμμα του κόμματος που εκπροσωπεί ο αρχηγός, β) το θέμα αναφοράς. Σε περίπτωση που τα αποτελέσματα του ChatGPT δεν είναι ορθά, αυτά διορθώνονται αναλόγως από την ομάδα εργασίας. Παράγραφοι στις οποίες η προγραμματική θέση και η κριτική των αντιπάλων λαμβάνουν ίδια έκταση κατηγοριοποιούνται ως «ατζέντα», θεωρώντας ότι, εν μέσω προεκλογικού λόγου, ένας πολιτικός αρχηγός μπορεί να παρουσιάζει τις θέσεις του κόμματος που εκπροσωπεί σε αντιδιαστολή με θέσεις των αντίπαλων κομμάτων/αρχηγών.
Ως προς το θέμα αναφοράς, παράγραφοι στις οποίες θίγονται παραπάνω από ένα ζητήματα κατηγοριοποιούνται με βάση το επικρατέστερο θέμα. Στη θεματική κατηγορία «Εκλογές» εντάσσονται παράγραφοι που αφορούν τη διεξαγωγή των επερχόμενων εκλογών, τη συζήτηση για την απλή αναλογική, παροτρύνσεις των πολιτών, από τους πολιτικούς αρχηγούς, να συμπεριφερθούν με τον τάδε ή τον δείνα τρόπο πηγαίνοντας στην κάλπη και οποιαδήποτε άλλα αποσπάσματα λόγου καταφανώς «χτίζουν κλίμα» κατά την προεκλογική περίοδο, χωρίς να αναφέρονται σε άλλα συγκεκριμένα ζητήματα.
Επομένως, για παράδειγμα, παράγραφοι οι οποίες έχουν κατηγοριοποιηθεί ως «κριτική», από τη μία, και ως «εκλογές», από την άλλη, σχετίζονται με αρνητικές αναφορές σε πολιτικό αντίπαλο σχετικά με το εκλογικό σύστημα ή με το ζήτημα μετεκλογικών συνεργασιών κλπ.
Παράγραφοι στις οποίες διάφορες ιστορικές αναφορές επικρατούν (όπως, για παράδειγμα, σε αποσπάσματα της ομιλίας του Αλέξη Τσίπρα στο Μενίδι και του Δημήτρη Κουτσούμπα στην Καισαριανή −αμφότερες στις 30 Απριλίου 2023) έχουν κατηγοριοποιηθεί ως «ατζέντα», με θέμα «πολιτισμός».
Η θεματολογία των ομιλιών σε treemap
Ως προς το sentiment, την πόλωση και τον λαϊκισμό
Τουλάχιστον δύο μέλη της ομάδας εργασίας, δηλαδή ο πολιτικός επιστήμονας και μία/ένας δημοσιογράφος, διαβάζουν τις υπό ανάλυση παραγράφους και ελέγχουν τα αποτελέσματα του ChatGPT ως προς τους υπό εξέταση δείκτες (sentiment, πόλωση, λαϊκισμός). Σε περίπτωση που τα αποτελέσματα του ChatGPT δεν είναι ορθά, τότε η ομάδα εργασίας προχωρά σε διορθώσεις ως εξής:
- Kάθε απόσπασμα, ανάλογα με την τιμή του δείκτη για το sentiment analysis που έχει λάβει, εντάσσεται σε μια κατηγορία: α) αρνητικό, αν έχει τιμή από -1 έως -0,34, β) ουδέτερο, αν έχει τιμή από -0,33 έως 0,33, γ) θετικό, αν έχει τιμή από 0,34 έως 1. Σε περίπτωση που η παράγραφος έχει λάβει από το ChatGPT τιμή τέτοια ώστε να τοποθετείται σε άλλη κατηγορία από εκείνη που την τοποθετεί η ανθρώπινη κρίση, τότε η εν λόγω λανθασμένη τιμή συναισθήματος διαγράφεται από το dataset και δεν λαμβάνεται υπόψη σε περαιτέρω αναλύσεις/οπτικοποιήσεις. Η διαγραφή, ως διόρθωση του λάθους, επιλέχθηκε από την ομάδα εργασίας, θεωρώντας ότι αυτός είναι ο βέλτιστος τρόπος, προκειμένου να μην επηρεαστεί από την ad hoc ανθρώπινη παρέμβαση ο μέσος όρος των δεικτών sentiment, που χρησιμοποιείται για να χαρακτηριστεί το σύνολο της εκάστοτε προεκλογικής ομιλίας ως αρνητική, ουδέτερη ή θετική.
Το συναισθηματικό κλίμα στον λόγο των αρχηγών, σε «speedometer»
- Κάθε παράγραφος, ανάλογα με την τιμή των δεικτών για την πόλωση και τον λαϊκισμό που έχει λάβει, εντάσσεται σε μια κατηγορία: α) καθόλου ή χαμηλό επίπεδο (πόλωσης ή λαϊκισμού αντίστοιχα), αν έχει τιμή από 0 έως 0,5, β) μέτριο επίπεδο, αν έχει τιμή από 0,51 ως 0,8, γ) υψηλό επίπεδο, αν έχει τιμή 0,81 έως 1. Σε περίπτωση που η παράγραφος έχει λάβει από το ChatGPT τιμή τέτοια ώστε να τοποθετείται σε άλλη κατηγορία από εκείνη που την τοποθετεί η ανθρώπινη κρίση, τότε η εν λόγω λανθασμένη τιμή (είτε της πόλωσης είτε του λαϊκισμού) διορθώνεται από την ομάδα εργασίας. Σε αυτήν την περίπτωση, ο πολιτικός επιστήμονας-μέλος της ομάδας εργασίας αντικαθιστά τη λανθασμένη τιμή ως εξής: α) με την τιμή 0, εάν το μήνυμα πρέπει να ενταχθεί στην κατηγορία «καθόλου ή χαμηλό επίπεδο» (είτε πόλωσης είτε λαϊκισμού), β) με την τιμή 0,6 (δηλαδή, τη μέση τιμή του εύρους 0,51 έως 0,8), εάν το απόσπασμα πρέπει να ενταχθεί στην κατηγορία «μέτριο επίπεδο»), γ) με την τιμή 0,9 (δηλαδή, τη μέση τιμή του εύρους 0,81 έως 1), εάν το απόσπασμα πρέπει να ενταχθεί στην κατηγορία «υψηλό επίπεδο». Ο λόγος που η διορθωτική τιμή των παραγράφων οι οποίες πρέπει να ενταχθούν στην κατηγορία «καθόλου ή χαμηλό επίπεδο» είναι πάντα 0 είναι η ίδια η κατανομή των τιμών: παρατηρήθηκε ότι η πλειονότητα των αποσπασμάτων που εντάσσονται στη συγκεκριμένη κατηγορία λαμβάνουν τιμές που τείνουν στο 0. Επομένως, αποφασίστηκε και η διορθωτική τιμή τους να είναι 0, ώστε η ανθρώπινη διόρθωση να μη δημιουργήσει «ακραίες τιμές» εντός της κατηγορίας.
H εξέλιξη της πόλωσης και του λαϊκισμού σε «step chart»
Μέχρι την ώρα που γράφονται αυτές οι γραμμές, σε σύνολο 20 ομιλιών που έχουν αναλυθεί και έχουν ελεγχθεί από την ομάδα εργασίας, εκτιμάται ότι, εκ των αποτελεσμάτων του ChatGPT, περίπου το 30% των θεματικών αναλύσεων χρήζει διόρθωσης, όπως επίσης και τα περίπου 8%, 10% και 12% των αποτελεσμάτων για τους λοιπούς δείκτες (sentiment, πόλωση και λαϊκισμός αντίστοιχα).
Η οπτικοποίηση των δεδομένων
Η οπτικοποίηση των αποτελεσμάτων των αναλύσεων έχει γίνει σε Observable. Συγκεκριμένα:
- Σε δενδροχάρτη (treemap) απεικονίζεται η κατανομή των θεμάτων στα οποία αναφέρεται ο εκάστοτε πολιτικός αρχηγός στην κάθε ομιλία του. Όσο περισσότερο χώρο καταλαμβάνει κάθε θέμα, τόσο περισσότερο ο αρχηγός μίλησε για αυτό. Το εικονιζόμενο ποσοστό υπολογίζεται με βάση τον αριθμό των λέξεων που υπολογίζεται ότι εκφωνήθηκαν για το θέμα επί του συνόλου των λέξεων της ομιλίας.
- Σε ταχύμετρο (speedometer) απεικονίζεται η ανάλυση συναισθήματος (sentiment analysis) για την εκάστοτε ομιλία: η βελόνα τοποθετείται στο σημείο που αντιστοιχεί στον μέσο όρο των τιμών του sentiment που έλαβαν οι παράγραφοι. Ανάλογα με τον εν λόγω μέσο όρο, η κάθε ομιλία του εκάστοτε πολιτικού αρχηγού χαρακτηρίζεται ως αρνητική, ουδέτερη ή θετική.
- Στο «διάγραμμα βημάτων» (step chart), απεικονίζεται η εξέλιξη του επιπέδου πόλωσης ή λαϊκισμού κατά την εκάστοτε ομιλία, με τον αριθμό των παραγράφων να παρουσιάζεται στον οριζόντιο άξονα.
- Στο ακτινωτό δενδρόγραμμα (radial dendrogram), παρουσιάζονται, ανά τύπο, οι οντότητες (entities) που κατονομάστηκαν από τον πολιτικό αρχηγό στην εκάστοτε μελετώμενη ομιλία.
«Radial dendrogram» με τις οντότητες που κατονομάζονται στον λόγο των αρχηγών
Η μεθοδολογία εργασίας θα ανανεώνεται κάθε φορά που κρίνεται σκόπιμο, ανάλογα με την εξέλιξη του έργου, κατά την προεκλογική περίοδο.
Η ομάδα εργασίας
Ιδέα & Συντονισμός Έργου: Θανάσης Τρομπούκης, Κέλλυ Κική (iMEdD)
Δημοσιογραφική Έρευνα/Ανάλυση: Νότα Βαφέα, Κατερίνα Βουτσινά, Στεφανία Ιμπρισίμοβα, Αθηνά Θανάση, Κέλλυ Κική, Χρυσούλα Μαρίνου, Γιώργος Σχοινάς, Θανάσης Τρομπούκης (iMEdD)
Υποστήριξη ΙΤ: Χρήστος Νομικός, Νίκος Σαράντος (iMEdD)
Επιστημονικός Σύμβουλος για θέματα Πολιτικής Θεωρίας: Αντώνης Γαλανόπουλος, Υποψήφιος Διδάκτορας Πολιτικής Επιστήμης, ΑΠΘ
Ανάπτυξη λογισμικού/ Ανάλυση δεδομένων: Παύλος Σερμπέζης, Στέλιος Καραμανίδης, Δημήτριος-Παντελεήμων Γιακάτος, Ηλίας Δημητριάδης (Datalab, Τμήμα Πληροφορικής, ΑΠΘ)
Διευθύντρια Datalab (Τμήμα Πληροφορικής, ΑΠΘ): Καθηγήτρια Αθηνά Βακάλη
Μετάφραση: Ανατολή Σταυρουλοπούλου