Ειδικοί από την Ινδία, τη Λευκορωσία, τη Νιγηρία, το Μάλι, την Παραγουάη και τις Φιλιππίνες εξηγούν πώς δημιουργούν εργαλεία για να γεφυρώσουν το χάσμα ανάμεσα στις αίθουσες σύνταξης και στο κοινό.
Το παρόν αποτελεί αναδημοσίευση στα ελληνικά. Το πρωτότυπο άρθρο δημοσιεύθηκε από το Reuters Institute for the Study of Journalism, στις 7/7/2025. Μεταφράστηκε και αναδημοσιεύεται από το iMEdD κατόπιν άδειας. Η αναδημοσίευσή του απαιτεί άδεια από τον εκδότη.
Μετάφραση: Εβίτα Λύκου
Από την κυκλοφορία του ChatGPT το 2022, οι αίθουσες σύνταξης παλεύουν τόσο με τις προοπτικές όσο και με τους κινδύνους που εγκυμονεί η δημιουργική τεχνητή νοημοσύνη (generative AI). Ωστόσο, δεν είναι όλα τα μέσα εξίσου προετοιμασμένα να αξιοποιήσουν αυτές τις ευκαιρίες. Ενώ οι αίθουσες σύνταξης στις ΗΠΑ και στην Ευρώπη καινοτομούν και πειραματίζονται με μεγάλα γλωσσικά μοντέλα (LLMs), πολλές αίθουσες σύνταξης στον Παγκόσμιο Νότο έχουν μείνει πίσω.
Ενώ τα μοντέλα τεχνητής νοημοσύνης σε γλώσσες όπως η αγγλική, η ισπανική ή η γαλλική διαθέτουν πληθώρα δεδομένων εκπαίδευσης και πόρων, οι βαθιές γλωσσικές και πολιτισμικές προκαταλήψεις που ενσωματώνονται σε πολλά κυρίαρχα εργαλεία τεχνητής νοημοσύνης θέτουν σημαντικές προκλήσεις για τις αίθουσες σύνταξης και τις κοινότητες, που λειτουργούν εκτός των κυρίαρχων δυτικών γλωσσών και πολιτισμικών πλαισίων.
Για αυτές τις αίθουσες σύνταξης, τα κενά στα δεδομένα δεν αποτελούν απλώς μια τεχνική δυσλειτουργία, αλλά μια υπαρξιακή απειλή απέναντι στο δικαίωμά τους να συμμετέχουν ισότιμα σε αυτό το εξελισσόμενο ψηφιακό οικοσύστημα. Ποιες είναι οι απειλές που δημιουργεί αυτή η έλλειψη δεδομένων για τις αίθουσες σύνταξης στον Παγκόσμιο Νότο; Πώς μπορούν να περιοριστούν αυτά τα κενά της τεχνητής νοημοσύνης; Για να απαντήσω σε αυτά τα ερωτήματα, μίλησα με έξι δημοσιογράφους και ειδικούς από την Ινδία, τις Φιλιππίνες, τη Λευκορωσία, τη Νιγηρία, την Παραγουάη και το Μάλι, οι οποίοι προσπαθούν να «εξισορροπήσουν την κατάσταση».
Reuters Institute Digital News Report 2025: ένα ειδησεογραφικό οικοσύστημα που συνεχώς αλλάζει
Τα ΑΙ chatbots και οι influencers αναδιαμορφώνουν τις παγκόσμιες συνήθειες ενημέρωσης, καθώς η εμπιστοσύνη στα παραδοσιακά ΜΜΕ συνεχίζει να φθίνει.
Τι μπορεί (και τι δεν μπορεί) να κάνει η τεχνητή νοημοσύνη για τις τοπικές γλώσσες και διαλέκτους
Τα εργαλεία τεχνητής νοημοσύνης δεν λειτουργούν καλά (ή δεν λειτουργούν καθόλου) για τις τοπικές, περιφερειακές και αυτόχθονες γλώσσες, σύμφωνα με όλες τις πηγές με τις οποίες συνομίλησα. Αυτό είναι ιδιαίτερα εμφανές σε χώρες όπου ομιλούνται πολλές [τοπικές] γλώσσες πέραν των κυρίαρχων, όπως η αγγλική, η ισπανική ή η γαλλική. Αυτό το γλωσσικό χάσμα επιτείνει τις ανισότητες για τις αίθουσες σύνταξης και τις κοινότητες που χρησιμοποιούν μη κυρίαρχες γλώσσες.
Ο Τζέμαρκ Τορντεσίλα (Jaemark Tordecilla) είναι δημοσιογράφος, σύμβουλος μέσων ενημέρωσης και τεχνολόγος από τις Φιλιππίνες που ειδικεύεται στην τεχνητή νοημοσύνη και στην καινοτομία στις αίθουσες σύνταξης. Έχοντας εργαστεί ως σύμβουλος σε αίθουσες σύνταξης σε όλη την Ασία, ο Τορντεσίλα έχει διαπιστώσει ότι οι δημοσιογράφοι δείχνουν μεγάλο ενδιαφέρον για την τεχνητή νοημοσύνη, αλλά η αφομοίωσή της είναι άνιση. Για τις απομαγνητοφωνήσεις (τη λειτουργία τεχνητής νοημοσύνης, που έχει δει να χρησιμοποιείται περισσότερο), το κόστος και η γλώσσα αποτελούν συχνά ζήτημα.
«Για μεγάλο χρονικό διάστημα, η [απομαγνητοφώνηση] λειτουργούσε καλά για την αγγλική γλώσσα και δεν λειτουργούσε καθόλου για τα φιλιππινέζικα, οπότε οι δημοσιογράφοι στις Φιλιππίνες άρχισαν να χρησιμοποιούν αυτά τα εργαλεία για τα δικά τους ρεπορτάζ σχετικά πρόσφατα. Ωστόσο, το κόστος παραμένει ένα ζήτημα», είπε.
Περιέγραψε περιπτώσεις όπου δημοσιογράφοι στις Φιλιππίνες αναγκάστηκαν να μοιραστούν μεταξύ τους λογαριασμούς για συνδρομές επί πληρωμή σε εργαλεία απομαγνητοφώνησης, γεγονός που μπορεί να δημιουργήσει ζητήματα ασφαλείας. Τα πράγματα είναι ακόμη χειρότερα για τους δημοσιογράφους που χρησιμοποιούν τοπικές γλώσσες, για τις οποίες τα εργαλεία αυτά είναι ουσιαστικά άχρηστα.
«Η ανάπτυξη της υποστήριξης των περιφερειακών γλωσσών ήταν αργή και έχουν μείνει πίσω», λέει. «Εάν παίρνεις μια συνέντευξη σε μια περιφερειακή γλώσσα, τότε προφανώς δεν μπορείς να χρησιμοποιήσεις την τεχνητή νοημοσύνη για να την επεξεργαστείς. Δεν μπορείς να τη χρησιμοποιήσεις για να τη μεταφράσεις σε άλλη γλώσσα. Δεν μπορείς να τη χρησιμοποιήσεις για να παρακολουθήσεις, για παράδειγμα, τις συνεδριάσεις του δημοτικού συμβουλίου σε μια περιφερειακή γλώσσα και να τις κάνεις πιο προσιτές στο κοινό».
Η Ινδή δημοσιογράφος Σανούτα Ραγκού (Sannuta Raghu), επικεφαλής του εργαστηρίου τεχνητής νοημοσύνης του Scroll. in και τώρα συνεργάτιδα δημοσιογράφος στο Ινστιτούτο Reuters, έχει καταγράψει πώς αυτές οι γλωσσικές και πολιτισμικές ανισότητες αποτυπώνονται στην πράξη σε αίθουσες σύνταξης, όπως η δική της.
Τα εργαλεία τεχνητής νοημοσύυνης δεν λειτουργούν πολύ αποτελεσματικά για τις περισσότερες από τις 22 επίσημες γλώσσες της Ινδίας. Η Ραγκού απαρίθμησε ζητήματα, όπως ανακριβή αποτελέσματα, «ψευδαισθήσεις» και λανθασμένες μεταφράσεις. Περιγράφει ότι, για μεγάλο χρονικό διάστημα, τα εργαλεία τεχνητής νοημοσύνης δεν ήταν σε θέση να λάβουν υπόψη τους τις λεπτές αποχρώσεις της γλώσσας. Σε αντίθεση με τα αγγλικά, για παράδειγμα, πολλές ινδικές γλώσσες παρουσιάζουν μεγάλες διαφορές μεταξύ προφορικού και γραπτού λόγου.
«Οι χώρες της Ασίας χρησιμοποιούν “ανάμεικτο κώδικα” όταν μιλούν. Δηλαδή, για παράδειγμα, συνδυάζουν πολλές λέξεις στα ινδικά (hindi) και αγγλικές λέξεις σε μια καθημερινή συνομιλία, πράγμα που σημαίνει ότι χρειαζόμαστε αρκετά πλούσια δεδομένα για να μπορέσουμε να το κατανοήσουμε», είπε.
Εάν δεν υπάρχουν επαρκή «καλά δεδομένα» για την εκπαίδευση μοντέλων σε αυτές τις συγκεκριμένες γλώσσες και περιβάλλοντα, λέει η Ραγκού, οι γλωσσικές και πολιτισμικές ανισότητες είναι αναπόφευκτες. Η Ραγκού απέδωσε την έλλειψη δεδομένων εκπαίδευσης σε έναν συνδυασμό πολυπλοκότητας και έλλειψης ενδιαφέροντος από τις μεγάλες εταιρείες τεχνολογίας. Όμως, είπε, επίσης, ότι η κατάσταση αρχίζει τώρα να βελτιώνεται.
«Αποτελεί πραγματικά προτεραιότητα η βελτιστοποίηση για όλες αυτές τις γλώσσες στην Ινδία από πλευράς πωλήσεων τεχνολογικών προϊόντων; Καθώς κινείσαι προς τα ανατολικά, η πολυπλοκότητα του τρόπου με τον οποίο οι κοινωνίες χρησιμοποιούν τη γλώσσα αλλάζει. Αυξάνεται η πολυγλωσσία. Η κατάσταση γίνεται πολύ πιο περίπλοκη. Η ανάμειξη κώδικα επιτείνεται. Αυτές είναι οι πολυπλοκότητες με τις οποίες ζούμε, οι οποίες δεν αντικατοπτρίζονται σε κανένα από τα μοντέλα», δήλωσε η Ραγκού.
Η τεχνητή νοημοσύνη αγνοεί την πολιτική προκατάληψη
Πέρα από αυτές τις ανεπάρκειες, οι πηγές μού επεσήμαναν, επίσης, τις πολιτιστικές και πολιτικές ιδιαιτερότητες που δεν περιέχονται σε αυτά τα μοντέλα και που τα καθιστούν ακόμη πιο προβληματικά για τις αίθουσες σύνταξης.
Για παράδειγμα, η Ραγκού είπε ότι οι αίθουσες σύνταξης έχουν διακρίνει ήδη πως οτιδήποτε παράγει η τεχνητή νοημοσύνη ρέπει προς εγγενώς αμερικάνικα ζητήματα. Περιέγραψε μια περίπτωση όπου δοκίμαζαν ένα εργαλείο για να δουν πόσο χρήσιμο θα τους ήταν για να τους βοηθήσει να γράψουν ένα κείμενο για το κρίκετ. Για κάτι τόσο απλό όσο η περιγραφή του αθλήματος, λέει ότι υπήρχαν ψευδείς πληροφορίες (hallucinations), με παίκτες που δεν είναι υπαρκτά πρόσωπα, ενώ το μοντέλο απλά δεν κατανοούσε τους κανόνες του παιχνιδιού.
«Ως και 2,6 δισεκατομμύρια άνθρωποι παρακολουθούν κρίκετ. Πολιτισμικά είναι κάτι τεράστιο για εμάς, την Αυστραλία, το Μπαγκλαντές, την Αγγλία… Αλλά στις Ηνωμένες Πολιτείες δεν παίζουν κρίκετ, γι’ αυτό και πολλές από τις πολιτιστικές πτυχές του δεν περιλαμβάνονται στα μοντέλα», είπε. «Υπάρχει έλλειψη συγκυριακών εκπαιδευτικών δεδομένων (contextual training data). Το κρίκετ είναι πολύ σημαντικό για εμάς, αλλά δεν είμαστε σε θέση να χρησιμοποιήσουμε τα μεγάλα γλωσσικά μοντέλα (LLM) για να μιλήσουμε για αυτό, επειδή αυτά τα μοντέλα δεν αντιλαμβάνονται πλήρως τους κανόνες».
Ερευνώντας την Τεχνητή Νοημοσύνη: τι βρίσκεται πέρα από τον αλγόριθμο
Η Τεχνητή Νοημοσύνη αποτελεί πλέον αναπόσπαστο κομμάτι της καθημερινότητάς μας, όμως το πραγματικό κόστος το πληρώνουν κάποιοι άλλοι. Στο συνέδριο Dataharvest, δημοσιογράφοι παρουσίασαν τις έρευνές τους και μοιράστηκαν συμβουλές για το πώς μπορεί κανείς να ερευνήσει σε βάθος αυτήν την τεχνολογία.
Η Ντάρια Μίνσκι (Daria Minsky) είναι Λευκορωσίδα ειδικός στην καινοτομία των μέσων ενημέρωσης και επικεντρώνεται σε εφαρμογές της τεχνητής νοημοσύνης στη δημοσιογραφία. Έχοντας συνεργαστεί με αρκετά μέσα ενημέρωσης που λειτουργούν από την εξορία, έχει διαπιστώσει πως υπάρχει μεγάλος σκεπτικισμός απέναντι στη χρήση της τεχνητής νοημοσύνης. Και όχι λόγω των πραγματολογικών σφαλμάτων, αλλά επειδή ορισμένα από αυτά τα μοντέλα στερούνται λεπτομερειών, όταν πρόκειται για ευαίσθητα πολιτικά θέματα.
Όταν μιλήσαμε, η Μίνσκι χρησιμοποίησε τη χώρα της ως παράδειγμα για το πώς αυτά τα LLM μπορούν εύκολα να επαναλαμβάνουν τις αφηγήσεις που προβάλλονται από αυταρχικά καθεστώτα.
«Η λέξη “Belarusian” [Λευκορώσος] είναι πολιτικά πολύ φορτισμένη όσον αφορά τον τρόπο γραφής της, οπότε συνέκρινα διαφορετικά μοντέλα. Το ChatGPT στην πραγματικότητα παραθέτει τη δημοκρατική γραφή ή κάποια εκδοχή της, ενώ το DeepSeek χρησιμοποιεί την παλιά, σοβιετική εκδοχή», λέει η ίδια. «Είναι “Belorussian” αντί για “Belarusian”. “Belorussian” είναι ο ιμπεριαλιστικός όρος που χρησιμοποίησε το καθεστώς. Εάν οι αίθουσες σύνταξης χρησιμοποιήσουν τη λέξη “Belorussian”, αντί για “Belarusian”, κινδυνεύουν να χάσουν το ακροατήριό τους και το κύρος τους».
Τα μοντέλα τεχνητής νοημοσύνης εκπαιδεύονται με βάση τα δεδομένα που είναι διαθέσιμα στο διαδίκτυο και, γι’ αυτό, τα μοντέλα αυτά είναι πιο καλά προσαρμοσμένα στα αγγλικά [και το αγγλικό συγκείμενο (context)] από ό,τι, ας πούμε, στα λευκορωσικά. Δεδομένου ότι το επίσημο αφήγημα των αυταρχικών καθεστώτων είναι το πλέον διαθέσιμο στο διαδίκτυο, η τεχνητή νοημοσύνη εκπαιδεύεται να ακολουθεί το ίδιο αφήγημα.
Αυτά τα κενά στο σύστημα εκπαίδευσης έχουν ήδη γίνει αντικείμενο εκμετάλλευσης από κακόβουλους παράγοντες. Πρόσφατη μελέτη του Newsguard αποκάλυψε ότι ένα δίκτυο παραπληροφόρησης με έδρα τη Μόσχα διεισδύει σκόπιμα στα δεδομένα που ανακτώνται από τα chatbot τεχνητής νοημοσύνης, δημοσιεύοντας ψευδείς ισχυρισμούς και προπαγάνδα με σκοπό να επηρεάσει τις απαντήσεις των μοντέλων τεχνητής νοημοσύνης σε θέματα της επικαιρότητας. Το αποτέλεσμα είναι περισσότερο προϊόν που προωθεί την προπαγάνδα και την παραπληροφόρηση.
«Έχω ακούσει ότι υπάρχουν τα ίδια προβλήματα στη Βιρμανία, για παράδειγμα, επειδή η αντίπαλη πλευρά χρησιμοποιεί την ονομασία Βιρμανία αντί για Μιανμάρ. Βλέπω τέτοια προβλήματα ακόμη και στις Ηνωμένες Πολιτείες, όπου βρίσκομαι, με τη συζήτηση γύρω από τη χρήση του «Κόλπου του Μεξικού» ή του «Κόλπου της Αμερικής», επειδή ο Τραμπ άρχισε να μετονομάζει διάφορα πράγματα, όπως συμβαίνει και σε άλλα δικτατορικά καθεστώτα», λέει.
Πώς να γεφυρωθεί το χάσμα
Παρόλα αυτά τα προβλήματα, ορισμένες αίθουσες σύνταξης στον Παγκόσμιο Νότο παίρνουν την ανάπτυξη εργαλείων τεχνητής νοημοσύνης στα χέρια τους.
Το Tama Media, ένα γαλλόφωνο ειδησεογραφικό μέσο της Δυτικής Αφρικής, εγκαινίασε την Akili, μια εφαρμογή, που βρίσκεται επί του παρόντος σε beta έκδοση, η οποία επιτρέπει τον έλεγχο γεγονότων με φωνητική αλληλεπίδραση στις τοπικές αφρικανικές γλώσσες. Ο Μοΐζ Μουνκόρο (Moïse Mounkoro), ο υπεύθυνος σύμβουλος έκδοσης της Akili, αποδίδει την προέλευση της ιδέας σε δύο πράγματα: στο γεγονός ότι η παραπληροφόρηση είναι ανεξέλεγκτη στη Δυτική Αφρική και στη συνειδητοποίηση ότι πολλοί άνθρωποι επικοινωνούν μέσω φωνητικών μηνυμάτων αντί να διαβάζουν και να γράφουν.
«Οι μορφωμένοι άνθρωποι μπορούν να διαβάσουν άρθρα και να ελέγξουν τα γεγονότα», δήλωσε ο Μουνκόρο. «Αλλά για τους ανθρώπους που είναι αναλφάβητοι ή που δεν μιλούν γαλλικά, αγγλικά ή ισπανικά, ο πιο συνηθισμένος τρόπος επικοινωνίας είναι ο προφορικός. Η καταγωγή μου είναι από το Μάλι και οι περισσότερες συνομιλίες εκεί γίνονται μέσω φωνητικών μηνυμάτων WhatsApp. Αν θέλεις να πλησιάσεις αυτούς τους ανθρώπους, πρέπει να χρησιμοποιήσεις τη γλώσσα τους».
Η εφαρμογή Akili χρησιμοποιεί τεχνητή νοημοσύνη για να ελέγχει τις πληροφορίες «παίρνοντας» την ερώτηση και βρίσκοντας μια απάντηση μέσω της βάσης δεδομένων των πηγών της, οι οποίες κυμαίνονται από το BBC Africa έως το Tama Media. Κατόπιν, η απάντηση δίνεται προφορικά στον χρήστη. Για να συμπεριλάβει περισσότερες αφρικανικές γλώσσες, όπως οι γουλόφ, παμπάρα και σουαχίλι, η ομάδα της Akili πειραματίζεται είτε με τη χρήση του API του Google Translate είτε με τη δημιουργία δικών της μέσω διαδικτυακών λεξικών.
«Αυτές οι τεχνολογίες τεχνητής νοημοσύνης προήλθαν από τη Δύση, οπότε επικεντρώνονται στις δικές τους γλώσσες. Είναι σαν τις φωτογραφικές μηχανές: στην αρχή, δεν φτιάχτηκαν για να φωτογραφίζουν μαύρο δέρμα», λέει. «Οι άνθρωποι χρειάζεται να γνωρίζουν ότι θα πρέπει να ενσωματωθούν και άλλες γλώσσες. Η Google έχει τουλάχιστον κάνει μια προσπάθεια ενσωματώνοντας πολλές αφρικανικές γλώσσες τα τελευταία δύο χρόνια».
Στην Παραγουάη, ο ψηφιακός ειδησεογραφικός οργανισμός El Surti αναπτύσσει το GuaraníAI. Αν και το έργο βρίσκεται ακόμη σε εξέλιξη, ο στόχος τους είναι να δημιουργήσουν ένα chatbot που θα ανιχνεύει αν κάποιος μιλάει γκουαρανί και θα του δίνει μια απάντηση. Για να το πετύχουν αυτό, αναπτύσσουν ένα σύνολο δεδομένων προφορικού λόγου της γλώσσας γκουαρανί, ώστε οι μηχανές LLM να μπορούν να αναγνωρίζουν προφορικό λόγο σε αυτή τη γλώσσα των αυτοχθόνων, την οποία μιλούν σχεδόν 12 εκατομμύρια άνθρωποι.
Ο Σεμπαστιάν Αουγιανέτ (Sebastián Auyanet), ο οποίος είναι επικεφαλής του έργου, μου είπε ότι ήθελαν να διερευνήσουν εκείνους που δεν μιλούν τις κυρίαρχες γλώσσες και αποκλείονται από την πρόσβαση στα LLM. Τα γκουαρανί είναι μια γλώσσα που μιλιέται ακόμα και σήμερα σε όλη την περιοχή της Νότιας Αμερικής, κυρίως στην Παραγουάη, όπου είναι επίσημη γλώσσα μαζί με τα ισπανικά. Μέχρι και το 90% του μη αυτόχθονου πληθυσμού της Παραγουάης μιλάει γκουαρανί.
«Τα γκουαρανί είναι μια προφορική, άγραφη γλώσσα», λέει ο Αουγιανέτ. «Αυτό που χρειαζόμαστε είναι οποιαδήποτε μηχανή LLM να είναι σε θέση να αναγνωρίζει τα προφορικά γκουαρανί και να μπορεί να “απαντά” σε αυτές τις ερωτήσεις στα ισπανικά. Η κατανάλωση ειδήσεων φαίνεται πως στρέφεται προς το ChatGPT, το Perplexity και άλλα μοντέλα. Δεν υπάρχει τρόπος να μπεις σε αυτόν τον κόσμο, αν μιλάς σε μια γλώσσα που κανένα από αυτά τα συστήματα δεν μπορεί να χρησιμοποιήσει».
Το El Surti διοργανώνει μαραθώνιους ανάπτυξης εφαρμογών (hackathons) σε όλη την Παραγουάη, για να δοκιμάσει αυτό το σύνολο δεδομένων. Το Common Voice της Mozilla είναι μια πλατφόρμα σχεδιασμένη να συλλέγει φωνητικά δεδομένα για διάφορες γλώσσες και διαλέκτους, τα οποία θα χρησιμοποιηθούν από τα LLM. Το El Surti χρησιμοποιεί το Common Voice για να αναπτύξει το ελάχιστο βιώσιμο προϊόν του, το οποίο στοχεύει στην επίτευξη 70% εγκυρότητας για τα προφορικά γκουαρανί στα σύνολα δεδομένων της Mozilla. Με αυτόν τον βαθμό εγκυρότητας, το chatbot θα είναι σε θέση να απαντά σε ερωτήματα στην εν λόγω αυτόχθονη γλώσσα.
Ιδανικά, δήλωσε ο Αουγιανέτ, το έργο αυτό θα επιτρέψει στο El Surti να δημιουργήσει ένα ακροατήριο ομιλητών της γλώσσας γκουαρανί, οι οποίοι τελικά θα είναι σε θέση να αλληλεπιδρούν με τις ειδήσεις του οργανισμού κάνοντας ερωτήσεις στο chatbot στη δική τους γλώσσα.
«Αυτή τη στιγμή αποκλείουμε όσους μιλούν μόνο γκουαρανί από τα ρεπορτάζ του El Surti», είπε. «Αυτή είναι μια προσπάθεια να τους φέρουμε πιο κοντά».
Στη Νιγηρία, το The Republic, ένας ψηφιακός ειδησεογραφικός οργανισμός, αναπτύσσει το Minim, μια αποκεντρωμένη πλατφόρμα μετατροπής κειμένου σε ομιλία με τη χρήση τεχνητής νοημοσύνης, η οποία έχει σχεδιαστεί για την υποστήριξη διαφορετικών γλωσσών και φωνών. Εκπαιδεύουν ενεργά ένα μοντέλο τεχνητής νοημοσύνης σε συγκεκριμένες αφρικανικές γλώσσες, όπως η νιγηριανή πίτζιν, η χάουσα και η σουαχίλι, και σχεδιάζουν να προσθέσουν περισσότερες στην πορεία. Η ομάδα στοχεύει σε ένα τουλάχιστον βιώσιμο προϊόν μέχρι το τέλος του έτους.
Το μοντέλο αυτό θα επιτρέψει στους ανεξάρτητους δημιουργούς να δανείσουν τις δικές τους φωνές και να εκπαιδεύσουν την τεχνητή νοημοσύνη στη μοναδική φωνητική τους ιδιομορφία, συμπεριλαμβανομένης της ηλικίας, της τοπικής προφοράς και άλλων δημογραφικών χαρακτηριστικών.
Ο αρχισυντάκτης Γουάλε Λαουάλ (Wale Lawal) μου είπε ότι στόχος τους είναι να προσελκύσουν το κοινό που μιλάει αυτές τις γλώσσες και να δημιουργήσουν μια πιο σχετική με αυτό επικοινωνία. «Πιστεύουμε ότι τα παγκόσμια μέσα μαζικής ενημέρωσης έχουν πρόβλημα με τη γλώσσα των αυτοχθόνων», είπε. «Σε ένα μέρος όπως η Αφρική υπάρχουν πολλοί άνθρωποι που αποκλείονται αυτόματα από τα παγκόσμια μέσα ενημέρωσης λόγω της γλώσσας».
Η Μίνσκι, η σύμβουλος μέσων ενημέρωσης από τη Λευκορωσία, συνεργάζεται με μέσα, που λειτουργούν από την εξορία για την ανάπτυξη ενός εργαλείου τεχνητής νοημοσύνης, που θα επιτρέπει την αυτοματοποίηση της παρακολούθησης ειδήσεων από αξιόπιστες πηγές. Στόχος της είναι να ληφθούν υπόψη όλες οι πολιτιστικές και πολιτικές λεπτές αποχρώσεις που λείπουν από τα υπάρχοντα μοντέλα, επιτρέποντας στις αίθουσες σύνταξης ειδήσεων να παρακολουθούν πολύ συγκεκριμένες πηγές, συμπεριλαμβανομένων τοπικών και υπερτοπικών μέσων όπως το Telegram.
Αυτό περιλαμβάνει τη μεταφόρτωση αρχειακών δεδομένων και ιστορικών δεδομένων για τη βελτιστοποίηση των αποτελεσμάτων και τη ρητή προτροπή για τον έλεγχο της ορολογίας και της ορθογραφίας (π.χ. «μην αποκαλείς τον Λουκασένκο πρόεδρο»).
Κανένα newsroom δεν πρέπει να αποκλειστεί
Οι δημοσιογραφικοί οργανισμοί εργάζονταν χωρίς τεχνητή νοημοσύνη για δεκαετίες πριν κυκλοφορήσουν στο ευρύ κοινό τα πρώτα εργαλεία δημιουργικής τεχνητής νοημοσύνης. Ποιο είναι, λοιπόν, το πρόβλημα εάν αυτά τα εργαλεία δεν είναι διαθέσιμα σε όλους;
Ο Τορντεσίλα τόνισε ότι το χάσμα μεταξύ των μέσων ενημέρωσης γίνεται όλο και μεγαλύτερο, και επισήμανε πράγματα που ήδη συμβαίνουν: υπάρχουν αίθουσες σύνταξης στη Μανίλα που κάνουν έρευνες με τεχνητή νοημοσύνη και άλλες στις αγροτικές Φιλιππίνες που θα μπορούσαν να επωφεληθούν από την αποτελεσματικότητα που παρέχει η τεχνητή νοημοσύνη, οι οποίες αγωνίζονται να επιβιώσουν.
«Μιλάμε για αίθουσες σύνταξης που έχουν πέντε άτομα στην ομάδα τους, οπότε κάθε λεπτό που ξοδεύουν για μια απομαγνητοφώνηση είναι ένα λεπτό που δεν αφιερώνουν στο ρεπορτάζ και στην επεξεργασία των θεμάτων τους», λέει ο Τορντεσίλα. «Αυτές οι αίθουσες σύνταξης χρειάζονται απεγνωσμένα τη βοήθεια που παρέχουν αυτές οι τεχνολογίες, αλλά είναι οι ίδιες που αποκλείονται επειδή εργάζονται σε γλώσσες που θεωρούνται μικρές, οπότε δεν αποτελούν μεγάλη προτεραιότητα για τις εταιρείες τεχνολογίας στην υποστήριξή τους».
Η Ινδή δημοσιογράφος Σανούτα Ραγκού δήλωσε ότι η αντιμετώπιση του ψηφιακού χάσματος της τεχνητής νοημοσύνης είναι σημαντική για την πρόσβαση, την εμβέλεια και την προσέγγιση ενός ευρύτερου κοινού. Η Ραγκού ανέφερε έναν συγκεκριμένο στόχο που είχε η δική της αίθουσα σύνταξης, όταν ξεκίνησε το εργαστήριο τεχνητής νοημοσύνης: να δημιουργήσει ένα πολύγλωσσο εργαλείο μετατροπής κειμένου σε βίντεο, καθώς το περιεχόμενο σε βίντεο είναι εξαιρετικά δημοφιλές στην Ινδία. Καθώς χιλιάδες εκατομμύρια Ινδοί χρησιμοποιούν smartphone και έχουν πρόσβαση σε πολύ φθηνό διαδίκτυο, υπάρχει μια σημαντική ευκαιρία για την παρουσίαση της δημοσιογραφίας μέσω βίντεο σε αυτές τις τοπικές γλώσσες. Δημιούργησαν το Factivo 1.0, ένα εργαλείο URL-to-mp4 που δημιουργεί ακριβή βίντεο από άρθρα ειδήσεων μέσα σε λίγα λεπτά και το οποίο είναι διαθέσιμο για τις κυριότερες γλώσσες.
«Για ένα μικρό αγγλόφωνο newsroom, όπως εμείς, το κοινό που έχουμε στη διάθεσή μας αυτή τη στιγμή είναι περίπου 30 εκατομμύρια Ινδοί που καταλαβαίνουν αγγλικά», εξηγεί. «Αλλά για να προσεγγίσουμε το ευρύτερο κοινό της Ινδίας, που αριθμεί 1,4 δισεκατομμύρια ανθρώπους, θα πρέπει να είμαστε σε θέση να χρησιμοποιούμε τη γλώσσα σε μεγάλη κλίμακα».