Εργαλεια & Πρακτικες

Ξεκινώντας από τα βασικά της Τεχνητής Νοημοσύνης: μαθήματα από τον Jonathan Soma

Ο καθηγητής Jonathan Soma μιλά για την τεχνητή νοημοσύνη και δίνει πολύτιμες πληροφορίες που απευθύνονται τόσο σε αρχάριους δημοσιογράφους όσο και σε έμπειρους επαγγελματίες και αποτελούν μια ιδανική αφετηρία για όσους ασχολούνται με τον κλάδο της τεχνολογίας.

«Ο κόσμος πιστεύει ότι (η τεχνητή νοημοσύνη) είναι ένα τεχνολογικό θαύμα, ότι απαιτεί δύσκολα μαθηματικά και ότι πρέπει να είσαι προγραμματιστής ή πληροφορικός για να την καταλάβεις. Δεν είναι έτσι όμως. Όλοι μπορούν να την προσεγγίσουν». Ο Jonathan Soma, καθηγητής πρακτικής στη δημοσιογραφία δεδομένων στην έδρα Knight και διευθυντής του επαγγελματικού προγράμματος LEDE στο Πανεπιστήμιο της Κολούμπια, είναι ο ιδανικός «διαμεσολαβητής» στις συζητήσεις που αφορούν την τεχνητή νοημοσύνη (TN). Με την ευγένεια που αποπνέει και τον διακριτικό ενθουσιασμό του για οτιδήποτε έχει να κάνει με τη δημοσιογραφία δεδομένων, κάνει την κατανόηση της Τεχνητής Νοημοσύνης εξαιρετικά εύκολη.

Όταν συναντηθήκαμε στο Διεθνές Forum Δημοσιογραφίας 2023 του iMEdD, ήταν μια ηλιόλουστη μέρα. Ο Jonathan είχε περάσει ώρες ολόκληρες δίνοντας ομιλίες για την ΤΝ, καθώς συμμετείχε στο πάνελ «Η τεχνητή νοημοσύνη στην αίθουσα σύνταξης: Μια συζήτηση για τον ρόλο της τεχνητής νοημοσύνης στα μέσα ενημέρωσης» και στο workshop «Τεχνητή νοημοσύνη και δημοσιογραφία: Δυνατότητες και περιορισμοί». Καθίσαμε στον κήπο της Πειραιώς 260, όπου μίλησε στο iMEdD για τους τρόπους που μπορεί να ασχοληθεί ο καθένας με την ΤΝ.

Ξεδιαλύνοντας το τοπίο

Για να ξεκινήσει κανείς με οποιαδήποτε τεχνολογία, χρειάζεται να έχει καταλάβει με τι έχει να κάνει. Όμως, όπως μας λέει ο Soma, αυτό δεν είναι πάντα εύκολο. «Όσο περισσότερο μιλάω και συζητώ για την τεχνητή νοημοσύνη, τόσο καταλήγω στο συμπέρασμα πως ο καθένας δίνει διαφορετικό ορισμό για την ΤΝ – ακόμα και άνθρωποι που ασχολούνται με τον τομέα της πληροφορικής». «Πρόκειται για ένα σύστημα που επιτρέπει στον υπολογιστή να εκτελεί “προηγμένες εργασίες”», σημειώνει, αναφερόμενος σε ενέργειες που συνήθως απαιτούν ανθρώπινη νοημοσύνη, οι οποίες περιγράφονται συνήθως ως εξέλιξη της μηχανικής μάθησης. Ωστόσο, οι υπολογιστές πλέον μπορούν να μάθουν από μόνοι τους. Για την κατανόηση των φαινομενικά πολύπλοκων ορισμών, τα βίντεο της IBM στο YouTube σχετικά με την τεχνητή νοημοσύνη παρέχουν μια ολοκληρωμένη εικόνα με απλές επεξηγήσεις.

Η κατανόηση των μηχανισμών της παραγωγικής τεχνητής νοημοσύνης έγινε περίπλοκη αλλά απαραίτητη για κάθε συζήτηση σχετική με την ΤΝ όταν, στα τέλη του 2022 εμφανίστηκε το ChatGPT. Το νέο chatbot έκανε την τεχνολογία προσιτή σε κάθε χρήστη, ειδησεογραφικό οργανισμό και δημοσιογράφο. «Παραγωγική τεχνητή νοημοσύνη σημαίνει πως ένας υπολογιστής δημιουργεί» εξηγεί ο Soma. «Στο παρελθόν, η εφαρμογή της μηχανικής μάθησης στην τεχνητή νοημοσύνη μας έδινε περιορισμένης έκτασης αποτελέσματα, όπως μερικές λέξεις ή κατηγορίες. Η παραγωγική τεχνητή νοημοσύνη όμως, παράγει αποτελέσματα που θυμίζουν αυτά της ανθρώπινης δημιουργικότητας». Αν και μοιάζει μαγικό, η παραγωγική τεχνητή νοημοσύνη βασίζεται στη λογική και οι δυνατότητές της εκτείνονται από την παραγωγή εικόνων και βίντεο έως τη δημιουργία κώδικα. Το δυνατότερο σημείο της, όμως, είναι γλώσσα.

Και εδώ είναι που έρχονται τα chatbot της παραγωγικής τεχνητής νοημοσύνης.

Ο Jonathan Soma παρουσιάζει το workshop «Τεχνητή νοημοσύνη και δημοσιογραφία: Δυνατότητες και περιορισμοί".  Βρίσκεται ανάμεσα σε δύο οθόνες με σημειώσεις και κρατά το μικρόφωνο. Φορά ένα καρό πουκάμισο. Το ακροατήριο εμφανίζεται σε πρώτο πλάνο, εκτός εστίασης.
Jonathan Soma στο workshop «Τεχνητή νοημοσύνη και δημοσιογραφία: Δυνατότητες και περιορισμοί» Φωτογραφία: Άλεξ Γρυμάνης

Μιλώντας με το Chat GPT

«Το πρώτο βήμα είναι πάντα το ChatGPT, με το οποίο μπορείτε να ανοίξετε έναν διάλογο». Το άρθρο «Generative AI exists because of the Transformer» (Η γενετική τεχνητή νοημοσύνη υπάρχει χάρη στους μετασχηματιστές), το οποίο καταπιάνεται με τα μεγάλα γλωσσικά μοντέλα και τους μετασχηματιστές (τους βασικούς μηχανισμούς της τεχνολογίας των γενετικών chatbot) και δημοσιεύτηκε από τους Financial Times, αναφέρει ότι «πρόκειται για ένα λογισμικό που μπορεί να παραγάγει αληθοφανή και εξελιγμένα κείμενα, εικόνες και κώδικα υπολογιστή σε επίπεδο που μιμείται την ανθρώπινη ικανότητα». Η συζήτηση, λοιπόν, με ένα chatbot είναι μια πολύτιμη προσέγγιση για την απόκτηση γνώσεων σχετικά με τη λειτουργία των εργαλείων τεχνητής νοημοσύνης, την εκμάθηση αποτελεσματικών τεχνικών αλληλεπίδρασης και την κατανόηση των απαιτήσεών τους. Είναι μια πολύ καλή πρώτη επαφή με την τεχνολογία που επιτρέπει στον χρήστη να πειραματιστεί με τις απεριόριστες δυνατότητες που παρέχει. Δώστε στο ChatGPT ένα άρθρο σας και ζητήστε του να κάνει περίληψη και να γράψει το lead ή θέστε του ένα γενικό ερώτημα για να σας δώσει διαφορετικές οπτικές γωνίες.

Τον Φεβρουάριο του 2023, το Reuters έγραψε ότι το ChatGPT της OpenAI είναι η δεύτερη ταχύτερα αναπτυσσόμενη βάση χρηστών. Το ChatGPT 3.5 είναι δωρεάν, αλλά η νεότερη έκδοση, το ChatGPT 4, χρειάζεται συνδρομή. Αν θέλετε να διευρύνετε τους ορίζοντές σας, το Claude2 της Anthropic και το Bard της Google είναι δύο μεγάλα γλωσσικά μοντέλα (LLM) με παρόμοιες δυνατότητες παραγωγής περιεχομένου. Ωστόσο, διαφέρουν σε κάποια χαρακτηριστικά – όπως στον επιτρεπτό αριθμό λέξεων, στις δυνατότητες περιήγησης στο διαδίκτυο και τις δυνατότητες ανάλυσης δεδομένων – γεγονός που μπορεί να επηρεάσει την καταλληλότητά τους για κάποιους χρήστες.

Πριν από είκοσι χρόνια, θα χρειαζόταν ένας στρατός εκπαιδευόμενων. Πριν από δέκα χρόνια, θα έπρεπε να μιλήσεις με έναν επιστήμονα δεδομένων για να εκπαιδεύσεις ένα προσαρμοσμένο μοντέλο. Τώρα μπορείς να το κάνεις μέσα σε ένα απόγευμα, χρησιμοποιώντας μόνο το Google Sheets και το ChatGPT.

Jonathan Soma, καθηγητής πρακτικής στη δημοσιογραφία δεδομένων στην έδρα Knight στο Πανεπιστήμιο της Κολούμπια

Python, Python, Python

Αν θέλετε να κατανοήσετε επί τις ουσίας τις λειτουργίες ενός υπολογιστή, θα πρέπει να μάθετε να γράφετε κώδικα. «Καλώς ή κακώς, η Python είναι η πιο διαδεδομένη γλώσσα προγραμματισμού για την επιστήμη των δεδομένων, καθώς είναι ευανάγνωστη και εύκολη στην εκμάθησή της. Ό,τι σεμινάριο προσφέρεται για την τεχνητή νοημοσύνη κάνει χρήση Python». Αυτός είναι ο λόγος που ο καθηγητής δημιούργησε ένα δικό του σεμινάριο για όσους ενδιαφέρονται να μάθουν τη γλώσσα προγραμματισμού. Τo Python is not (just) for Unicorns είναι ένα καλό εργαλείο εκμάθησης και εξάσκησης για δημοσιογράφους όλων των ειδικοτήτων. Παρόλο που μπορεί να χρειαστούν λίγες επαναλήψεις για να γίνει κατανοητό, ο ανάλαφρος τόνος διδασκαλίας που έχει εξασφαλίζει μια ευχάριστη εμπειρία εκμάθησης.

Η εξοικείωση με το Excel, το Google Sheets και άλλα είδη υπολογιστικών φύλλων μπορεί επίσης να βοηθήσει, ιδιαίτερα όταν δουλεύετε με μεγάλα δεδομένα. Η λειτουργία φιλτραρίσματος απλοποιεί τη διαχείρισή τους και η δυνατότητα χρήσης τύπων και πινάκων pivot βοηθά στη διαδικασία ανάλυσης. Αν και υπάρχει πληθώρα σχετικών πληροφοριών στο διαδίκτυο, σεμινάρια όπως αυτά του Kevin Stratver μπορούν να προσφέρουν πολύτιμη καθοδήγηση σε κάθε αρχάριο.

Ο καθηγητής Jonathan Soma στο πάνελ "Η τεχνητή νοημοσύνη στην αίθουσα σύνταξης: Μια συζήτηση για τον ρόλο της τεχνητής νοημοσύνης στα μέσα ενημέρωσης". Μιλά στο μικρόφωνο και βρίσκεται ανάμεσα στους συνομιλητές του, οι οποίοι είναι στραμένοι προς αυτόν. Φορά καρό πουκάμισο, γυαλιά και, στο λαιμό, το κίτρινο καρτελάκι του φόρουμ. Το κάδρο έχει κλίση προς τα δεξιά.
Ο καθηγητής Jonathan Soma στο πάνελ «Η τεχνητή νοημοσύνη στην αίθουσα σύνταξης: Μια συζήτηση για τον ρόλο της τεχνητής νοημοσύνης στα μέσα ενημέρωσης». Φωτογραφία: Άλεξ Γρυμάνης

Ώρα για πειραματισμό. Ταξινομήστε τα έγγραφά σας

Αφού καλύψαμε κάποια βασικά, ήρθε η ώρα να αρχίσουμε να χρησιμοποιούμε την ΤΝ για διάφορα project. «Η ταξινόμηση είναι ένας κλασικός τύπος μηχανικής μάθησης που σχετίζεται με την ΤΝ και λειτουργεί πολύ καλά με τη παραγωγική τεχνητή νοημοσύνη», λέει ο καθηγητής. «Είτε πρόκειται για έγγραφα και εικόνες είτε για οποιοδήποτε σύνολο δεδομένων, το αρχικό ερώτημα είναι πάντα το ίδιο: Σε ποια κατηγορία ανήκει αυτό; Αυτό ακριβώς πρέπει να ρωτήσετε την ΤΝ. Στα παραδοσιακά συστήματα, απαραίτητη προϋπόθεση για να απαντηθούν αυτά τα ερωτήματα ήταν η εκπαίδευσή τους μέσω της παροχής πολλών παραδειγμάτων και του ορισμού των κατηγοριών προς ταξινόμηση. Ωστόσο, με τη παραγωγική τεχνητή νοημοσύνη, η οποία έχει απορροφήσει τεράστιες ποσότητες δεδομένων από το διαδίκτυο, μπορείτε απλώς να ρωτήσετε: “Αυτή η νομοθεσία αφορά τον έλεγχο των όπλων, το περιβάλλον ή τη μετανάστευση;”. Και επειδή γνωρίζει τι είναι ο έλεγχος των όπλων, η μετανάστευση και το περιβάλλον, μπορεί να προχωρήσει σε αποτελεσματική κατηγοριοποίηση». Ο ίδιος έχει ήδη εκθέσει την άποψή του υπέρ των παραδοσιακών τεχνικών ταξινόμησης στον ιστότοπό του investigate.ai, όπου παρέχει έναν αναλυτικό οδηγό για τη χρήση προγραμμάτων όπως το scikit-learn – μια βιβλιοθήκη μηχανικής μάθησης βασισμένη στην Python που χρησιμοποιείται για την ταξινόμηση δεδομένων. Ωστόσο, με μια απλή «αντιγραφή-επικόλληση» εγγράφων στο ChatGPT (ή σε άλλα chatbots που δέχονται μεγαλύτερο αριθμό λέξεων) και το κατάλληλο prompt στο bot, μπορείτε να κάνετε την ταξινόμηση σε δευτερόλεπτα.

Και εδώ είναι που θα χρησιμεύσει η εξοικείωσή με τα υπολογιστικά φύλλα. Ο Soma είναι ιδιαίτερα ενθουσιασμένος με μια νέα τεχνική ενσωμάτωσης των Google Sheets στο ChatGPT. «Μπορείτε να έχετε μια στήλη που να είναι το όνομα του νομοσχεδίου ή απλώς κάποιο κείμενο ή ένα σχόλιο. Στη συνέχεια, δημιουργείτε μια νέα στήλη και του ζητάτε να κάνει “ταξινόμηση”. Πριν από είκοσι χρόνια, θα χρειαζόταν ένας στρατός εκπαιδευόμενων για να διαβάσει όλη τη νομοθεσία ή να δει όλες τις εικόνες. Πριν από δέκα χρόνια, θα έπρεπε να μιλήσεις με έναν επιστήμονα δεδομένων για να εκπαιδεύσεις ένα προσαρμοσμένο μοντέλο. Τώρα μπορείς να το κάνεις μέσα σε ένα απόγευμα, χρησιμοποιώντας μόνο το Google Sheets και το ChatGPT».

Καθώς το τοπίο της τεχνητής νοημοσύνης διευρύνεται, το ίδιο συμβαίνει και με τις δυνατότητές της. Όταν όμως ασχολούμαστε με τον κόσμο της τεχνολογίας, είναι σημαντικό να γνωρίζουμε τους κινδύνους που ενέχει. «Υπάρχουν διάφορα επίπεδα που πρέπει να κατανοήσουμε. Αν και μπορείτε να προσεγγίσετε αυτά τα εργαλεία από τεχνική άποψη, αυτό δεν θα σας δώσει μια καθαρή εικόνα για τα μειονεκτήματα της χρήσης τους ή τις πρακτικές πτυχές αλληλεπίδρασης με αυτά». Ο Jonathan Soma παρατηρεί ότι πολλοί αρχάριοι χρησιμοποιούν τα chatbots σαν μηχανές αναζήτησης, αναζητώντας πραγματικές πληροφορίες. «Σιχαίνονται να παραδέχονται ότι δεν γνωρίζουν κάτι, όπως ακριβώς και ο άνθρωπος», εξηγεί και προσθέτει: «το καλύτερο που μπορείτε να κάνετε είναι να αντιμετωπίζετε πάντα τα εργαλεία όπως το ChatGPT με τον ίδιο τρόπο που θα αντιμετωπίζατε οποιαδήποτε άλλη πηγή» και, ως δημοσιογράφοι, δεν θα εμπιστευόσασταν την πηγή σας στα τυφλά.


Μετάφραση: Ανατολή Σταυρουλοπούλου 

Λογότυπο Άδειας Χρήσης Creative Commons Non Commercial International