Η Τεχνητή Νοημοσύνη αποτελεί πλέον αναπόσπαστο κομμάτι της καθημερινότητάς μας, όμως το πραγματικό κόστος το πληρώνουν κάποιοι άλλοι. Στο συνέδριο Dataharvest, δημοσιογράφοι παρουσίασαν τις έρευνές τους και μοιράστηκαν συμβουλές για το πώς μπορεί κανείς να ερευνήσει σε βάθος αυτήν την τεχνολογία.
Ο Νέιθαν Σέπερς (Nathan Schepers) δεν είναι δημοσιογράφος αλλά μηχανικός λογισμικού. Πριν από μερικούς μήνες, όταν o μη κερδοσκοπικός οργανισμός Algorithm Watch προσκάλεσε δημοσιογράφους να ερευνήσουν την Τεχνητή Νοημοσύνη (ΤΝ), ο Σέπερς θα ερχόταν σε επαφή με την ερευνητική δημοσιογραφία.
Ο Γκάμπριελ Γκάιγκερ (Gabriel Geiger), από την άλλη, είναι δημοσιογράφος που ερευνά αλγορίθμους, για τη διεθνή μη κερδοσκοπική δημοσιογραφική ομάδα Lighthouse Reports. Το workshop του στο Dataharvest – European Investigative Journalism Conference 2025, ξεκίνησε ως εξής: «Προφανώς, τώρα γίνεται μια μεγάλη συζήτηση για την ΤΝ στις ειδήσεις. Είναι ένα μοντέρνο θέμα, και όλοι μιλάνε διαρκώς για αυτό σε διάφορα συνέδρια, αλλά όλες αυτές οι συζητήσεις επικεντρώνονται στο πώς να χρησιμοποιήσεις την ΤΝ στην αίθουσα σύνταξης ή στα όρια της χρήσης της. Εμείς δεν θα μιλήσουμε για αυτό σήμερα».
Στη διάρκεια του συνεδρίου στο Μέχελεν του Βελγίου, ο Γκάιγκερ, ο Σέπερς και άλλοι μίλησαν για το πώς οι δημοσιογράφοι μπορούν να ερευνήσουν την ίδια την ΤΝ και τον τρόπο με τον οποίο επηρέασε.
«Το άρθρο θα πεθάνει, αλλά το storytelling θα παραμείνει»: Οι ραγδαίες αλλαγές που φέρνει η Τεχνητη Νοημοσύνη στο Nordic AI in Media Summit
Τα σκανδιναβικά newsrooms πρωτοστατούν στην υιοθέτηση της ΤΝ, δημιουργώντας εργαλεία για την παραγωγή ειδήσεων, ενώ ταυτόχρονα αμφισβητούν την εξάρτησή τους από την αμερικάνικη τεχνολογία.
Μιλώντας στους εργάτες
Ο καλύτερος τρόπος να σκεφτεί κανείς πώς να ξεκινήσει μια έρευνα για την ΤΝ δεν είναι να ανοίξει ένα βιβλίο πληροφορικής, αλλά να καταλάβει πως λειτουργεί σαν μια γραμμή παραγωγής.
Για παράδειγμα, για την ΤΝ το πρώτο συστατικό είναι τα δεδομένα. Αυτά «ταΐζουν» το εκάστοτε μοντέλο, ώστε να μπορέσει να παραχθεί οποιουδήποτε είδους αποτέλεσμα. Στη διαδρομή αυτή, σημαντικό ρόλο παίζουν οι λεγόμενοι «data annotators»: πρόκειται για τους ανθρώπους των οποίων μοναδική εργασία είναι να παρέχουν σημειώσεις και να κατηγοριοποιούν τα δεδομένα που θα δοθούν στο μοντέλο ΤΝ —εξηγώντας στο εκάστοτε μοντέλο την πληροφορία που του δίνεται, πώς να την αναγνωρίζει, πώς να την αναλύει και πώς να δίνει απαντήσεις.
Όταν ο δημοσιογράφος Μάικλ Μπέρντ (Michael Bird) ξεκίνησε να ερευνά το θέμα που θα έγραφε με τον Σέπερς είχε ακούσει έναν εργαζόμενο να διαμαρτύρεται για τις συνθήκες εργασίας στην Outlier, μια εταιρεία που απασχολεί εξ αποστάσεως data annotators. Παράλληλα, από μία ανάρτηση στο Facebook, κατάφεραν να ανακαλύψουν ότι εργάτες από τον λεγόμενο «Παγκόσμιο Νότο» προσπαθούσαν να αποκτήσουν, στην ψηφιακή μαύρη αγορά, στοιχεία ταυτότητας ευρωπαίων χρηστών, προκειμένου να αυξήσουν το ημερομίσθιό τους.
Για να καταφέρουν να ερευνήσουν τις εργασιακές συνθήκες κάτω από τις οποίες δούλευαν οι data annotators, ο Σέπερς και ο Μπέρντ συνομίλησαν με ομάδες εργατών που συγκεντρώνονταν σε διαδικτυακές πλατφόρμες και μέσα κοινωνικής δικτύωσης. Οι ίδιοι οι εργάτες τους πληροφόρησαν για τη μηχανική και μοναχική εργασία τους, την έλλειψη διαφάνειας, τους χαμηλούς τους μισθούς και την εκμετάλλευση που υφίστανται από μεγάλες εταιρείες για τις οποίες κατηγοριοποιούν τα δεδομένα.
Τα data centers και το πόσιμο νερό
Η ίδια η διαδικασία παραγωγής μπορεί να αποτελέσει μέρος του προβλήματος. Για να κατανοήσουμε πώς παράγεται η ΤΝ, χρειάζεται να διακρίνουμε δύο επίπεδα: το φυσικό/υλικό και το τεχνικό.
Τα φυσικά συστήματα απαρτίζονται από μεγάλες δομές που ονομάζονται κέντρα δεδομένων (data centers). Είναι κτίρια τα οποία στεγάζουν υπολογιστές,τηλεπικοινωνιακές και αποθηκευτικές υποδομές. Τα κέντρα δεδομένων χρησιμοποιούνται από εταιρείες, όπως η Microsoft και η Meta, για την αποθήκευση, επεξεργασία και τον διαμοιρασμό μεγάλου όγκου δεδομένων.
Όπως δήλωσε και η Ναιάρα Μπέλιο (Naiara Bellio), Επικεφαλής Δημοσιογραφίας στο Algorithm Watch, ερωτήματα για το πώς λειτουργούν τα κέντρα δεδομένων, σε ποιον ανήκουν, ποιος εμπλέκεται στη δημιουργία και τη συντήρησή τους και πώς επηρεάζουν τους εργάτες και τον περιβάλλοντα χώρο είναι βασικά για να ξεκινήσει μια έρευνα. Πολλά από αυτά τα κέντρα χτίζονται σε περιοχές με χαμηλή υγρασία, για να μπορέσουν να διατηρήσουν σταθερές θερμοκρασίες. Έρευνες όπως αυτή του Μάνουελ Γκ. Πασκάλ (Manuel G. Pascual) για την El Pais το 2023, ρίχνουν φως στην υπερβολική κατανάλωση νερού που χρειάζονται τα κέντρα δεδομένων. Όπως αποκάλυψε έναν χρόνο αργότερα η Κάρεν Χάο (Karen Hao), δημοσιογράφος για το Atlantic, στα κέντρα δεδομένων γίνεται σταθερή τροφοδότηση των συστημάτων με αέρα και εξατμισμένο πόσιμο νερό, ακριβώς επειδή οι υπολογιστές είναι απαραίτητο να λειτουργούν σε συγκεκριμένες θερμοκρασίες, ώστε να αποφεύγεται η υπερθέρμανση των συστημάτων.
Αντίθετα, το τεχνικό επίπεδο αφορά την ίδια την παραγωγή αποτελεσμάτων από την ΤΝ. Σύμφωνα με το Άρθρο 3 του Ευρωπαϊκού Κανονισμού για την ΤΝ, σύστημα ΤΝ είναι αυτό που βασίζεται σε μηχανισμούς, λειτουργεί με ποικίλα επίπεδα αυτονομίας, παρουσιάζει προσαρμοστικότητα και έχει τη δυνατότητα να συμπεραίνει, βάσει των δεδομένων που λαμβάνει πώς να παράγει αποτελέσματα. Η Μπέλιο υπογράμμισε ότι δεν είναι όλοι οι αλγόριθμοι, μορφές τεχνητής νοημοσύνης, ενώ παράλληλα υπάρχουν διαφορετικές μορφές όπως η βαθιά μάθηση (deep learning), η υπολογιστική όραση (computer vision), τα παραγωγικά συστήματα (generative systems) και η επεξεργασία φυσικής γλώσσας (natural language processing) —όπως αυτή που χρησιμοποιούν τα chatbots. Είναι σημαντικό οι δημοσιογράφοι να μπορούν να ξεχωρίσουν αυτές τις μορφές μεταξύ τους και να διατηρούν αυτή τη διαφοροποίηση και στις έρευνές τους. Ορίζοντας συγκεκριμένα σε ποιο είδος ΤΝ αναφέρονται, γίνεται ευκολότερο για τους δημοσιογράφους να επικοινωνούν σε φορείς, εταιρείες και σε αναγνώστες τι ερευνούν.
Γιατί να θέλει κανείς να δει οπωσδήποτε τον αλγόριθμο, όταν μπορεί να δει γύρω από αυτόν;
Στην έρευνα του 2024 με τίτλο «Sweden’s Suspicion Machine», ο Γκάιγκερ ερεύνησε έναν αλγόριθμο της σουηδικής υπηρεσίας πρόνοιας ο οποίος είχε σχεδιαστεί για να δημιουργεί προφίλ επικινδυνότητας για απάτη κοινωνικών παροχών. Βάσει στατιστικών μεθόδων, ο αλγόριθμος αξιολογούσε προσωπικά στοιχεία, όπως το φύλο, η ηλικία, η οικογενειακή κατάσταση ή ακόμα και ο τόπος διαμονής, για να εκτιμήσει αν κάποιο άτομο είχε αυξημένες πιθανότητες να διαπράξει απάτη. Τα άτομα που κρίνονταν επικίνδυνα επισημαίνονταν σε ελεγκτές των Αρχών, οι οποίοι κινητοποιούσαν σχετικές έρευνες. Κοινώς, ο αλγόριθμος επεξεργαζόταν την πληροφορία με σκοπό να «διευκολύνει» τη λήψη αποφάσεων σχετικά με το ποιος πρέπει να ελεγχθεί.
Η παροχή πρόσβασης στον αλγόριθμο από την εταιρεία που τον δημιούργησε ήταν σημαντική για την πορεία της έρευνας του Γκάιγκερ. Όταν αρνήθηκαν να του τη δώσουν, η πρόσβαση που μπόρεσε να αποκτήσει στη μεθοδολογία βάσει της οποίας λειτουργεί ο αλγόριθμος, στα δεδομένα και τα στατιστικά στοιχεία , του έδωσαν τα απαραίτητα στοιχεία για να καταφέρει να καταλάβει τη λογική του αλγορίθμου.
Το 2023, ερευνώντας το αντίστοιχο σύστημα του δήμου του Ρότερνταμ, μια αποστολή αρχείων, που έγινε τυχαία, αποκάλυψε κάποια από τα δεδομένα εκπαίδευσης (training data) που τροφοδοτούσαν το σύστημα. Ήταν η μοναδική περίπτωση, στο πλαίσιο της σειράς ερευνών «Suspision Machine», στην οποία ο Γκάιγκερ απέκτησε πρόσβαση σε αντίστοιχα δεδομένα.
Όμως, στην Ευρώπη, είναι πολύ δύσκολο να πάρει κανείς τα αρχικά δεδομένα που τροφοδοτούν τα μοντέλα ΤΝ, καθώς πολλά από αυτά προστατεύονται από νομοθεσία GDPR. Έτσι, στην περίπτωση της Σουηδίας, αντί να αναζητήσει ολόκληρο τον κώδικα του μοντέλου, ελπίζοντας να του χαμογελάσει η τύχη όπως τότε με τον δήμο του Ρότερνταμ, ζήτησε να του παράσχουν πληροφορίες σχετικά με τον τρόπο που χρησιμοποιούνται τα δεδομένα και έγγραφα με τις προδιαγραφές σχεδιασμού.
«Καταλάβαμε πώς λειτουργεί το σύστημα; Όχι», απάντησε στο κοινό ο Γκάιγκερ. Τα στοιχεία που είχε, όμως,συλλέξει ήταν αρκετά ώστε να χτίσει μια ιστορία που έριξε φως σε πιθανούς μεροληπτικούς μηχανισμούς ή σφάλματα στο μοντέλο της υπηρεσίας πρόνοιας.
Στην αρχή και στο τέλος είναι ο άνθρωπος
Όταν η έρευνα επικεντρώνεται στους αλγορίθμους, είναι εύκολο η ιστορία να γίνει υπερβολικά τεχνική και να επικεντρωθεί υπέρμετρα στις λεπτομέρειες της ΤΝ. Αν και ο αλγόριθμος είναι φαινομενικά το πρόβλημα, η Μπέλιο σημείωσε πως, σε όλες τις έρευνες, ο άνθρωπος πρέπει να είναι στο κέντρο της ιστορίας. «Ο αλγόριθμος δεν μπορεί να θεωρηθεί υπεύθυνος σήμερα» αναφέρει. «Έτσι, όταν μιλάμε μόνο για την ΤΝ που “κάνει πράγματα”, δεν έχουμε ένα υποκείμενο στο οποίο μπορούμε να αποδώσουμε ευθύνες ή να ζητήσουμε λογοδοσία για ό,τι συμβαίνει». Ο άνθρωπος χειρίζεται τα συστήματα, αναπτύσσει τα μοντέλα, παίρνει τις τελικές αποφάσεις. Στο τέλος, είναι και αυτός που επηρεάζεται.
Η λύση για τον Γκάιγκερ είναι να δοθεί μεγαλύτερη έμφαση στις επιπτώσεις που έχουν τα συστήματα στις ζωές των ανθρώπων. Στο παράδειγμα που έδωσε για τον αλγόριθμο της υπηρεσίας πρόνοιας, ακόμη και ο έλεγχος της αξιοπιστίας του συστήματος, δηλαδή να εξεταστεί αν το άτομο που επέλεξε ο αλγόριθμος έχει διαπράξει απάτη, μπορεί να έχει σοβαρές συνέπειες.
Η Σουαζίς Πενικό (Soizic Pénicaud), ερευνήτρια στον οργανισμό Observatoire des algorithmes publics (παρατηρητήριο για τους αλγορίθμους του Δημοσίου στη Γαλλία), επικεντρώνεται στην ανθρώπινη εμπειρία. Η ίδια, όμως, αντιλαμβάνεται τη βαρύτητα του όρου «Τεχνητή Νοημοσύνη» στους τίτλους των θεμάτων της. Η ιστορία μπορεί να επικεντρώνεται στους ανθρώπους, αλλά ο πιασάρικος τίτλος μπορεί να τραβήξει τα βλέμματα των αναγνωστών. «Στα θέματα πρόνοιας και κοινωνικής προστασίας, κανείς δεν ενδιαφέρεται για τον πυρήνα του ζητήματος. Όλοι, όμως, ενδιαφέρονται για την ΤΝ. Και, έτσι, το ερώτημα είναι, πώς μπορούμε να την χρησιμοποιήσουμε ως αγκίστρι, για να κάνουμε τους ανθρώπους να ενδιαφερθούν για τους ανθρώπους;»