Αποψη/ Σχολιο

Τα προσόντα και το πρόβλημα της τεχνητής νοημοσύνης στην ανάλυση κειμένων

Ο «ελβετικός σουγιάς», που είναι το ChatGPT, έχει το μεγάλο προσόν της επαναληψιμότητας και της αμεροληψίας αλλά και το πρόβλημα της ερμηνευσιμότητας. Η καθοδηγούμενη από την ανθρώπινη γνώση μεθοδολογία εργασίας μπορεί να δώσει την απάντηση. Γράφει ο Επίκουρος Καθηγητής Κώστας Καρπούζης*. 

Η ευρεία χρήση των μέσων κοινωνικής δικτύωσης (ΜΚΔ) από δημοσιογράφους, πολίτες, και πρόσφατα και από τους ίδιους τους πολιτικούς έχει αυξήσει κατά πολύ τον όγκο της πληροφορίας που παράγεται σε μορφή κειμένου και διακινείται, κυρίως, μέσα από τα ίδια τα ΜΚΔ. Σε σύγκριση με το -όχι τόσο μακρινό- παρελθόν, όπου η πολιτική επικοινωνία και η πληροφόρηση περνούσαν μέσα από καλά ορισμένους διαύλους που διαμόρφωναν το ύφος ανάλογα με το περιεχόμενό τους, η σύγχρονη παραγωγή πολιτικού περιεχομένου χαρακτηρίζεται από την ίδια ανάγκη να τραβήξει την (περιορισμένης διάρκειας) προσοχή του κοινού που συναντάμε στο lifestyle περιεχόμενο το οποίο διακινείται στα ΜΚΔ ή τις σειρές στις πλατφόρμες ροής, καταφεύγοντας συχνά σε λόγο χωρίς βάθος και λεπτομέρεια, στηριζόμενο σε συνθήματα, αφηγηματικές περιγραφές και έντονα, εναλλασσόμενα συναισθήματα.

Tο ChatGPT είναι μια από τις τεχνολογίες που πλέον είναι αρκετά ώριμες. To μεγάλο πρόβλημα είναι ότι δεν μπορούμε να ξέρουμε γιατί ένα τέτοιο σύστημα δίνει μια συγκεκριμένη απάντηση.

Η αξιολόγηση αυτού του ιδιαίτερου στυλ που έχει αποκτήσει η πολιτική επικοινωνία θα μπορούσε να γίνει με τα ίδια μέσα που χρησιμοποιούσαμε πριν από μερικά χρόνια, στηριζόμενοι κυρίως στην εμπειρία των δημοσιογράφων, και στη γνώση του πολιτικού υπόβαθρου και των θέσεων κάθε ομιλητή. Το πρόβλημα με αυτή τη συμβατική προσέγγιση δεν είναι μόνο ποσοτικό, καθώς θα ήταν πολύ δύσκολο για μια δημοσιογραφική ομάδα να προλαβαίνει να αξιολογεί με συστηματικό και αξιόπιστο τρόπο όλο αυτό το περιεχόμενο, αλλά και ποιοτικό, καθώς σε μια τέτοια περίπτωση αυτό που έχει μεγαλύτερη σημασία είναι το περιεχόμενο της κάθε ομιλίας ή ανάρτησης ξεχωριστά, χάνοντας έτσι την ευκαιρία να αποτιμήσουμε την εξέλιξη των αντικειμένων που ενδιαφέρουν έναν ομιλητή κατά τη διάρκεια μιας περιόδου ή την αυξομείωση της έντασης του λόγου του μέσα σε μια ομιλία. Τα υπολογιστικά εργαλεία μάς προσφέρουν πλέον μια αξιόπιστη λύση για την απάντηση των ποσοτικών ερωτημάτων που μπορεί να θέσουμε, αφήνοντάς μας περισσότερο χρόνο για την ποιοτική αξιολόγηση η οποία αποτελεί συνήθως και το αντικείμενο του πολιτικού σχολιασμού. Μια που μιλάμε για περιεχόμενο σε μορφή κειμένου, το ChatGPT, το Μεγάλο Γλωσσικό Μοντέλο του (Large Language Model), είναι μια από τις τεχνολογίες που πλέον είναι αρκετά ώριμες, ώστε να παράξουν, αλλά και να αναλύσουν αξιόπιστα πολύπλοκα κείμενα, εξάγοντας συγκεκριμένα μορφολογικά και εννοιολογικά χαρακτηριστικά και πληροφορίες που θα τους ζητήσουμε. Η μεθοδολογία που χρησιμοποίησε το iMEdD Lab στην έρευνά του για τις προεκλογικές ομιλίες των πολιτικών αρχηγών αποτελεί μια ροή εργασιών (workflow) η οποία μπορεί να μας δώσει, με την κατάλληλη καθοδήγηση, αποτελέσματα από μεγάλα σώματα κειμένων με ελάχιστη επένδυση σε χρόνο και τεχνολογική υποδομή. Σε αντίθεση με ροές εργασιών που βασίζονται σε προγραμματιστικά περιβάλλοντα τύπου Python, που συνήθως χρειάζονται αρκετό χρόνο και κόπο για να αρχίσουν να δίνουν κάποια πρώτα αποτελέσματα, το ChatGPT φαίνεται πως λειτουργεί σαν «ελβετικός σουγιάς», αναλύοντας κείμενα, αξιολογώντας τα με βάση χαρακτηριστικά που θα του περιγράψουμε, ακόμα και παραφράζοντάς τα ή εξάγοντας μια περίληψη ή μια σειρά από bullet points για τον δικτυακό μας τόπο.

Το μεγάλο πρόβλημα που έχουν, γενικά, τα τεχνητά νοήμονα συστήματα είναι αυτό της ερμηνευσιμότητας (interpretability): σε αρκετές περιπτώσεις, η λειτουργία τους είναι τόσο πολύπλοκη, ώστε οι αποφάσεις ή οι εκτιμήσεις που παράγουν να είναι αδύνατο να εξηγηθούν με βάση τα δεδομένα που τους δίνουμε. Με άλλα λόγια, δεν μπορούμε να ξέρουμε γιατί ένα τέτοιο σύστημα δίνει μια συγκεκριμένη απάντηση και ποια από τα χαρακτηριστικά ενός κειμένου είχαν μεγαλύτερη σημασία στην απάντηση αυτή. Η μεθοδολογία της έρευνας του iMEdD Lab φαίνεται να ξεπερνά αυτόν τον σκόπελο, περιγράφοντας με συγκεκριμένο τρόπο τα χαρακτηριστικά ενός κειμένου που θα μπορούσαν να είναι υποκειμενικά, όπως το συναίσθημα ή το λαϊκιστικό ή διχαστικό περιεχόμενο. Αυτό δεν σημαίνει ότι οι τεχνολογίες σαν το ChatGPT μετατρέπονται με αυτόν τον τρόπο σε μια απόλυτα αντικειμενική και διαφανή μέθοδο αξιολόγησης –κάτι τέτοιο θα ήταν μάλλον αδύνατο, όταν ακόμα κι εμείς οι ίδιοι οι αναγνώστες δεν μπορούμε να συμφωνήσουμε στον χαρακτηρισμό ενός κειμένου. Το σημαντικό, όμως, προσόν που έχουν αυτές οι μέθοδοι είναι η επαναληψιμότητα και η αμεροληψία: όσες φορές και αν «τρέξεις» έναν αλγόριθμο στο ίδιο κείμενο με την ίδια ερώτηση, θα πάρεις σχεδόν την ίδια απάντηση με σταθερή ερμηνευτική ποιότητα, κάτι που μπορεί να μην ισχύει για κάποιον άνθρωπο ο οποίος κάνει την ίδια εργασία. Παράλληλα, η καθοδήγηση του ChatGPT από την ομάδα των αναλυτών στην έκφραση των υποκειμενικών χαρακτηριστικών αποτελεί ουσιαστικά και ένα ολοκληρωμένο παράδειγμα του πώς θα μπορέσουμε να αξιοποιήσουμε την τεχνητή νοημοσύνη, αναθέτοντάς της καλά ορισμένες και επαναλαμβανόμενες εργασίες υπό την επίβλεψη ενός ειδικού στο αντικείμενο, απελευθερώνοντας, έτσι, χρόνο και νοητικό κεφάλαιο για την πιο νηφάλια αποτίμηση των αποτελεσμάτων που μας παρέχει.

*Ο Κώστας Καρπούζης είναι Επίκουρος Καθηγητής πολιτισμικής πληροφορικής στο Τμήμα Επικοινωνίας, Μέσων και Πολιτισμού στο Πάντειο Πανεπιστήμιο.

Λογότυπο Άδειας Χρήσης Creative Commons Non Commercial International

Τα άρθρα γνώμης και σχολιασμού που δημοσιεύονται στο iMEdD Lab αντιπροσωπεύουν τους/τις συγγραφείς τους και δεν απηχούν απαραιτήτως τις απόψεις του iMEdD. Oι συγγραφείς εκφράζονται ελεύθερα, χωρίς καθοδήγηση ή παρεμβάσεις.