Αναγνώριση Προσώπου Συνοδευτική Εικόνα
EFF Photos/Flickr-CC BY 2.0
Feature

Πόσο ακριβή είναι τα συστήματα αναγνώρισης προσώπου –και γιατί αυτό έχει σημασία;

Λογότυπο του Κέντρου Στρατηγικιών και Διεθνών Σπουδών στην Ουάσιγνκτον

Το iMEdD Lab αναδημοσιεύει, σε ελληνική μετάφραση, το άρθρο του Γουίλιαμ Κράμπλερ από το Technology Policy Blog του Κέντρου Στρατηγικών και Διεθνών Σπουδών στην Ουάσινγκτον.

Η αναγνώριση προσώπου έχει βελτιωθεί σημαντικά μέσα σε μόλις λίγα χρόνια. Από τον Απρίλιο 2020, ο καλύτερος αλγόριθμος ταυτοποίησης προσώπου έχει ποσοστό σφάλματος μόλις 0,08%, έναντι 4,1% που ο κορυφαίος αλγόριθμος παρουσίαζε το 2014, σύμφωνα με ελέγχους του Εθνικού Ινστιτούτου Προτύπων και Τεχνολογίας (National Institute of Standards and Technology, NIST) των ΗΠΑ1. Το 2018, το NIST διαπίστωσε ότι περισσότεροι από 30 αλγόριθμοι είχαν επιτύχει ακρίβεια η οποία ξεπερνούσε τις καλύτερες επιδόσεις που επιτεύχθηκαν το 2014. Αυτές οι βελτιώσεις πρέπει να ληφθούν υπόψη κατά τη μελέτη του βέλτιστου τρόπου ρύθμισης της τεχνολογίας. Οι κυβερνητικές δράσεις θα πρέπει να προσβλέπουν στη διαχείριση του ρίσκου που προκύπτει από το πού πηγαίνει η τεχνολογία –και όχι από το πού βρίσκεται σήμερα. Περαιτέρω βελτίωση της ακρίβειας θα συνεχίσει να μειώνει τους κινδύνους που σχετίζονται με την εσφαλμένη ταυτοποίηση και να αυξάνει τα οφέλη τα οποία μπορούν να προκύψουν από την ορθή χρήση. Ωστόσο, καθώς οι βελτιώσεις στην απόδοση των συστημάτων δημιουργούν κίνητρα για περισσότερο εκτεταμένη ανάπτυξη, η ανάγκη διασφάλισης της σωστής διακυβέρνησης της τεχνολογίας θα γίνει πιο επιτακτική.

Τι είναι η αναγνώριση προσώπου;

Τα συστήματα αναγνώρισης προσώπου είναι ένα επιμέρους πεδίο της τεχνητής νοημοσύνης που μπορεί να ταυτοποιήσει άτομα, από εικόνες και βίντεο, αναλύοντας τα χαρακτηριστικά του προσώπου τους. Σήμερα, τα συστήματα αναγνώρισης προσώπου τροφοδοτούνται από τη βαθιά μάθηση, ένα είδος τεχνητής νοημοσύνης που λειτουργεί μεταφέροντας δεδομένα μέσω πολλαπλών επάλληλων στρωμάτων προσομοιωμένων νευρώνων για την επεξεργασία πληροφοριών. Αυτά τα νευρωνικά δίκτυα εκπαιδεύονται σε χιλιάδες, ή ακόμη και σε εκατομμύρια, παραδείγματα των τύπων προβλημάτων που το σύστημα είναι πιθανό να αντιμετωπίσει, επιτρέποντας στο μοντέλο να «μάθει» πώς να αναγνωρίζει με επιτυχία μοτίβα που προκύπτουν από τα δεδομένα. Τα συστήματα αναγνώρισης προσώπου χρησιμοποιούν αυτή τη μέθοδο, για να απομονώσουν συγκεκριμένα γνωρίσματα ενός προσώπου που έχει ανιχνευθεί σε μια εικόνα (όπως η απόσταση ανάμεσα σε ορισμένα χαρακτηριστικά, η υφή του δέρματος ή ακόμη και το θερμικό προφίλ ενός προσώπου) και για να συγκρίνουν το πορτρέτο που προκύπτει με άλλα γνωστά πρόσωπα, με σκοπό την ταυτοποίηση του ατόμου.

Σε γενικές γραμμές, τα συστήματα αναγνώρισης προσώπου μπορούν να χρησιμοποιηθούν για δύο διαφορετικές εργασίες: επαλήθευση ή ταυτοποίηση. Η επαλήθευση (επίσης γνωστή ως αντιστοίχιση ένα προς ένα) χρησιμοποιείται για να επιβεβαιωθεί ότι ένα άτομο είναι αυτό που λέει ότι είναι. Επαλήθευση προσώπου γίνεται, για παράδειγμα, όταν ένα άτομο χρησιμοποιεί το πρόσωπό του για να ξεκλειδώσει το «smartphone» του, να συνδεθεί σε μια τραπεζική εφαρμογή ή να επαληθεύσει την ταυτότητά του κατά την επιβίβαση σε αεροπλάνο. Κατά τη διαδικασία της σύνδεσης, λαμβάνεται ένα δείγμα εικόνας του προσώπου ενός χρήστη το οποίο, στη συνέχεια, συγκρίνεται με μια γνωστή εικόνα του ατόμου που εκείνος ισχυρίζεται ότι είναι. Οι αλγόριθμοι αναγνώρισης προσώπου τείνουν να επιτυγχάνουν καλή ακρίβεια στην επαλήθευση, επειδή το άτομο συνήθως γνωρίζει ότι η εικόνα του καταγράφεται και μπορεί να τοποθετήσει τον εαυτό του σε τέτοια θέση, ώστε να δώσει στις κάμερες μια καθαρή εικόνα του προσώπου του.

H επαλήθευση προσώπου χρησιμοποιείται για να επιβεβαιωθεί ότι ένα άτομο είναι αυτό που λέει ότι είναι. Η ταυτοποίηση είναι όταν ένα λογισμικό συγκρίνει κάποιο άγνωστο πρόσωπο με μια μεγάλη βάση δεδομένων γνωστών προσώπων, προκειμένου να προσδιορίσει την ταυτότητα του αγνώστου.

Η ταυτοποίηση (επίσης γνωστή ως αντιστοίχιση ένα προς Ν) είναι όταν ένα λογισμικό συγκρίνει κάποιο άγνωστο πρόσωπο με μια μεγάλη βάση δεδομένων γνωστών προσώπων, προκειμένου να προσδιορίσει την ταυτότητα του άγνωστου ατόμου. Η αναγνώριση μπορεί να χρησιμοποιηθεί σε «συνεργάσιμα» άτομα, τα οποία ξέρουν ότι η εικόνα τους καταγράφεται, ή σε «μη συνεργάσιμα» άτομα που δεν το γνωρίζουν. Η τελευταία περίπτωση έχει τραβήξει τη μεγαλύτερη προσοχή, λόγω του φόβου ότι οι αρχές επιβολής του νόμου ή ιδιωτικές επιχειρήσεις θα χρησιμοποιήσουν την τεχνολογία, ώστε να συλλέξουν εξ αποστάσεως δεδομένα για άτομα εν αγνοία τους. Ωστόσο, η απομακρυσμένη αναγνώριση μπορεί, επίσης, να χρησιμοποιηθεί για την ταυτοποίηση υπόπτων από βίντεο παρακολούθησης, για τον εντοπισμό αγνοουμένων ή θυμάτων απαγωγής και για τη βελτίωση των υπηρεσιών του ιδιωτικού τομέα. Τα συστήματα απομακρυσμένης ταυτοποίησης τείνουν να επιτυγχάνουν χαμηλότερη ακρίβεια σε σύγκριση με τα συστήματα επαλήθευσης, επειδή είναι πιο δύσκολο για τις στατικές κάμερες να λαμβάνουν σταθερές, υψηλής ποιότητας εικόνες ατόμων που κινούνται ελεύθερα στους δημόσιους χώρους.

Πόσο ακριβής είναι η αναγνώριση προσώπου;

Υπό ιδανικές συνθήκες, τα συστήματα αναγνώρισης προσώπου μπορούν να έχουν σχεδόν απόλυτη ακρίβεια. Οι αλγόριθμοι επαλήθευσης που χρησιμοποιούνται για την αντιστοίχιση ατόμων με καθαρές εικόνες αναφοράς (όπως φωτογραφία διαβατηρίου ή φωτογραφία σύλληψης) μπορούν να επιτύχουν αποτελέσματα με ακρίβεια που φτάνει έως και το 99,97% σε πρότυπες αξιολογήσεις όπως ο Έλεγχος Παρόχων Αναγνώρισης Προσώπου (Facial Recognition Vendor Test, FRVT) του NIST2. Το ποσοστό είναι συγκρίσιμο με τα καλύτερα αποτελέσματα σαρωτών ίριδας3. Αυτό το είδος επαλήθευσης προσώπου έχει καταστεί τόσο αξιόπιστο που ακόμη και οι τράπεζες βασίζονται σε αυτό με ευκολία, για τη σύνδεση των χρηστών στους λογαριασμούς τους.

Ωστόσο, αυτός ο βαθμός ακρίβειας είναι δυνατό να επιτευχθεί μόνο υπό ιδανικές συνθήκες, όπου υπάρχει συνέπεια στον φωτισμό και στην τοποθέτηση του ατόμου, και όπου τα χαρακτηριστικά του προσώπου του είναι καθαρά και ασκίαστα. Σε πραγματικές εφαρμογές, τα ποσοστά ακρίβειας τείνουν να είναι πολύ χαμηλότερα. Για παράδειγμα, ο FRVT διαπίστωσε ότι το ποσοστό σφάλματος για έναν κορυφαίο αλγόριθμο σκαρφάλωσε από το 0,1% (όταν η αντιστοίχιση γινόταν με υψηλής ποιότητας φωτογραφίες σύλληψης) στο 9,3%, στην περίπτωση που ο αλγόριθμος αντιστοίχιζε με φωτογραφίες ατόμων που έχουν τραβηχτεί στο φυσικό περιβάλλον, όπου το υποκείμενο μπορεί να μην κοιτάζει απευθείας στην κάμερα ή το πρόσωπό του μπορεί να συγκαλύπτεται από αντικείμενα ή σκιές4. Η γήρανση είναι ένας άλλος παράγοντας που μπορεί να επηρεάσει σοβαρά τα ποσοστά σφάλματος, καθώς οι αλλαγές στα πρόσωπα των ατόμων, με την πάροδο του χρόνου, μπορεί να δυσκολέψουν την αντιστοίχιση με φωτογραφίες που τραβήχτηκαν πριν από πολλά χρόνια. Ο FRVT του NIST διαπίστωσε ότι πολλοί αλγόριθμοι μεσαίου επιπέδου σχεδόν δεκαπλασίαζαν τα ποσοστά σφάλματος, όταν επιχειρούσαν να αντιστοιχίσουν πρόσωπα με φωτογραφίες που τραβήχτηκαν πριν από 18 χρόνια5.

Σημαντικό ζήτημα σχετικά με την ακρίβεια αναγνώρισης προσώπου είναι η ευρεία διακύμανση ανάμεσα στους παρόχους: αν και ορισμένοι έχουν κατασκευάσει πολύ ακριβείς αλγόριθμους, ο μέσος προμηθευτής στην αγορά εξακολουθεί να δυσκολεύεται.

Η ευαισθησία σε εξωτερικούς παράγοντες μπορεί να φανεί πιο ξεκάθαρα, όταν αναλογιστούμε πώς αποδίδουν οι αλγόριθμοι αναγνώρισης προσώπου κατά την αντιστοίχιση ατόμων με πρόσωπα που έχουν καταγραφεί σε βίντεο παρακολούθησης. Η έκθεση αξιολόγησης «Πρόσωπα σε Βίντεο» (Face in Video Evaluation, FIVE) του NIST το 2017, εξέτασε την απόδοση των αλγορίθμων, όταν αυτοί εφαρμόστηκαν σε βίντεο που είχαν τραβηχτεί σε τοποθεσίες όπως πύλες επιβίβασης σε αεροδρόμιο και αθλητικές εγκαταστάσεις. Ο έλεγχος διαπίστωσε ότι όταν χρησιμοποιούνταν πλάνα επιβατών που εισέρχονταν στις πύλες επιβίβασης –μια σχετικά ελεγχόμενη τοποθέτηση–, ο καλύτερος αλγόριθμος είχε ποσοστό ακρίβειας 94,4%6. Αντίθετα, κορυφαίοι αλγόριθμοι στην αναγνώριση ατόμων που περπατούσαν σε αθλητικές εγκαταστάσεις –ένα πολύ πιο απαιτητικό περιβάλλον– είχαν ακρίβεια κυμαινόμενη μεταξύ 36% και 87%, ανάλογα με την τοποθέτηση της κάμερας7.

Τα αποτελέσματα της FIVE, επίσης, καταδεικνύουν ένα άλλο σημαντικό ζήτημα σχετικά με την ακρίβεια αναγνώρισης προσώπου: την ευρεία διακύμανση ανάμεσα στους παρόχους. Παρόλο που ένας κορυφαίος αλγόριθμος επέτυχε ακρίβεια 87% σε αθλητικές εγκαταστάσεις, ο διάμεσος αλγόριθμος είχε ακρίβεια μόλις 40%, χρησιμοποιώντας εικόνες από την ίδια κάμερα8. Οι έλεγχοι του NIST σε αλγόριθμους επαλήθευσης εικόνας διαπίστωσαν ότι πολλοί προμηθευτές λογισμικού αναγνώρισης προσώπου στην αγορά ενδέχεται να έχουν ποσοστά σφάλματος αρκετές τάξεις μεγέθους υψηλότερα από τους κορυφαίους παρόχους9. Αν και ορισμένοι πάροχοι έχουν κατασκευάσει πολύ ακριβείς αλγόριθμους αναγνώρισης προσώπου, ο μέσος προμηθευτής στην αγορά εξακολουθεί να δυσκολεύεται να επιτύχει παρόμοια αξιοπιστία και ακόμη και οι καλύτεροι αλγόριθμοι είναι ιδιαίτερα ευαίσθητοι σε εξωτερικούς παράγοντες. Σύμφωνα με το NIST, αυτό το μεγάλο εύρος ακρίβειας ανάμεσα στους παρόχους «υποδηλώνει ότι το λογισμικό αναγνώρισης προσώπου απέχει ακόμη πολύ από το να είναι έτοιμο για εμπορική εκμετάλλευση».

Τι είναι οι βαθμοί εμπιστοσύνης και γιατί είναι σημαντικοί;

Είναι, επίσης, σημαντικό να ληφθεί υπόψη η επίδραση που έχει στην ακρίβεια η προσαρμογή αλγορίθμων για την αποφυγή ψευδώς θετικών αποτελεσμάτων: Επειδή η αναγνώριση προσώπου πιθανότατα θα χρησιμοποιηθεί σε πλαίσιο όπου ο χρήστης θα θέλει να ελαχιστοποιήσει τον κίνδυνο λανθασμένης αναγνώρισης του λάθος ατόμου (όπως όταν τα όργανα επιβολής του νόμου χρησιμοποιούν την τεχνολογία για την ταυτοποίηση υπόπτων), οι αλγόριθμοι συχνά ρυθμίζονται, ώστε να επιστρέφουν στον χρήστη μια αντιστοίχιση ατόμου μόνο εφόσον υπάρχει συγκεκριμένος βαθμός εμπιστοσύνης στην αξιολόγησή τους. Η χρήση αυτών των ορίων εμπιστοσύνης μπορεί να μειώσει σημαντικά τα ποσοστά αντιστοίχισης για τους αλγόριθμους, αναγκάζοντας το σύστημα να παραγνωρίσει τις σωστές αλλά χαμηλής εμπιστοσύνης αντιστοιχίσεις. Για παράδειγμα, ένα ενδεικτικό σύνολο αλγορίθμων που δοκιμάστηκαν βάσει του FRVT είχαν μέσο ποσοστό απώλειας 4,7% σε φωτογραφίες «από το φυσικό περιβάλλον», όταν αντιστοίχιζαν χωρίς κανένα όριο εμπιστοσύνης. Μόλις επιβλήθηκε ένα όριο που απαιτούσε από τον αλγόριθμο να αναφέρει αποτελέσματα μόνο εφόσον ήταν βέβαιος για τα ευρήματά του κατά 99%, το ποσοστό απώλειας σκαρφάλωσε στο 35%. Αυτό σημαίνει ότι, περίπου στο 30% των περιπτώσεων, ο αλγόριθμος αναγνώρισε το σωστό άτομο, αλλά το έκανε με βαθμό εμπιστοσύνης χαμηλότερο του 99% και, έτσι, ανέφερε ότι δεν βρέθηκε αντιστοίχιση.

Η εισαγωγή τέτοιων ορίων εμπιστοσύνης είναι σημαντική σε περιπτώσεις όπου οι αντιστοιχίσεις που κάνει ο αλγόριθμος δεν ελέγχονται από άνθρωπο και όπου τυχόν λάθη θα μπορούσαν να έχουν σοβαρές επιπτώσεις σε εκείνους που δεν ταυτοποιούνται σωστά. Σε αυτές τις περιπτώσεις, τα υψηλότερα ποσοστά απώλειας ενδέχεται να είναι προτιμότερα από τα ψευδώς θετικά αποτελέσματα και θα πρέπει να εφαρμόζονται αυστηρά όρια εμπιστοσύνης για την αποφυγή δυσμενών συνεπειών. Ωστόσο, όταν η αναγνώριση προσώπου χρησιμοποιείται για αυτό που λέμε «έρευνα» (απλώς για την παραγωγή μιας λίστας πιθανών υποψηφίων την οποία θα ελέγξει ανθρώπινο δυναμικό), τα όρια εμπιστοσύνης συνήθως χαμηλώνουν, καθώς οι άνθρωποι είναι αυτοί που ελέγχουν τα αποτελέσματα και λαμβάνουν την τελική απόφαση σχετικά με τον τρόπο χρήσης των πληροφοριών που το σύστημα επιστρέφει. Σε αυτές τις περιπτώσεις, η αναγνώριση προσώπου είναι απλώς ένα εργαλείο για την επιτάχυνση της αναγνώρισης ατόμου από άνθρωπο –και όχι για την ίδια την αναγνώριση αυτή καθ’ αυτή. Θεωρητικά, οι λανθασμένες αντιστοιχίσεις που έγιναν κατ’ αυτόν τον τρόπο δεν θα πρέπει να είναι περισσότερες από ό,τι εάν δεν είχαν χρησιμοποιηθεί τεχνολογικά μέσα, καθώς και στις δύο περιπτώσεις οι άνθρωποι είναι αυτοί που κάνουν την τελική αντιστοίχιση. Ωστόσο, υπάρχουν ορισμένες ανησυχίες ότι οι άνθρωποι, ως χειριστές, θα μπορούσαν να μεροληπτούν υπέρ της αποδοχής των συμπερασμάτων στα οποία κατέληξε ο αλγόριθμος, εάν ορισμένες αντιστοιχίσεις εμφανίζονταν με υψηλότερο βαθμό εμπιστοσύνης σε σχέση με άλλες.

Το 2018, η Αμερικανική Ένωση Πολιτικών Ελευθεριών έγινε πρωτοσέλιδο με την ανακάλυψη ότι η τεχνολογία αναγνώρισης προσώπου της Amazon αντιστοίχισε εσφαλμένα 28 μέλη του Κογκρέσου με φωτογραφίες συλληφθέντων. Η Ένωση πραγματοποίησε την αναζήτησή της με όριο εμπιστοσύνης 80%, το προεπιλεγμένο όριο της Amazon.

Η κατανόηση του σωστού ρόλου των διαστημάτων εμπιστοσύνης είναι απαραίτητη, όταν εξετάζουμε τον τρόπο με τον οποίο αναπτύσσεται η τεχνολογία αναγνώρισης προσώπου. Το 2018, η Αμερικανική Ένωση Πολιτικών Ελευθεριών (American Civil Liberties Union, ACLU) έγινε πρωτοσέλιδο με την ανακάλυψη ότι η τεχνολογία αναγνώρισης προσώπου της Amazon αντιστοίχισε εσφαλμένα 28 μέλη του Κογκρέσου με φωτογραφίες συλληφθέντων. Στον έλεγχο που διεξήγαγε η ACLU εισήγαγε φωτογραφίες μελών του Κογκρέσου και έψαξε σε μια βάση δεδομένων της αστυνομίας, με 25.000 φωτογραφίες ατόμων που είχαν συλληφθεί, για να δουν αν το σύστημα θα επέστρεφε τυχόν αντιστοιχίσεις. Σε 28 περιπτώσεις (περίπου το 5% του συνόλου των μελών που δοκιμάστηκαν), η Amazon ανέφερε κάποια αντιστοίχιση. Η ACLU υποστήριξε ότι αυτά τα αποτελέσματα δείχνουν πως η αναγνώριση προσώπου δεν είναι ακόμη αρκετά ακριβής, για να αναπτυχθεί χωρίς να ενέχει σοβαρό κίνδυνο καταχρήσεων που μπορεί να προκληθούν από λανθασμένες αντιστοιχίσεις.

Η ACLU πραγματοποίησε την αναζήτησή της με όριο εμπιστοσύνης 80%, το προεπιλεγμένο όριο της Amazon. Αυτό είναι ένα πολύ χαμηλό επίπεδο εμπιστοσύνης –και πολύ χαμηλότερο από το συνιστώμενο όριο 95% της Amazon για δραστηριότητες των αρχών επιβολής του νόμου. Η Amazon ισχυρίστηκε πως, εάν το σύστημα είχε βαθμονομηθεί σύμφωνα με τις οδηγίες της, είναι πιθανό ότι ελάχιστες από αυτές τις αντιστοιχίσεις θα είχαν εμφανιστεί ως αποτελέσματα –ίσως και καμία. Η ACLU και άλλοι σημείωσαν ότι, ανεξάρτητα από τις συστάσεις της Amazon, οι περισσότεροι χρήστες απλώς θα χρησιμοποιήσουν το σύστημα με τις προεπιλεγμένες ρυθμίσεις του, χωρίς να αφιερώσουν χρόνο για να προσαρμόσουν το όριο εμπιστοσύνης. Πράγματι, το 2019, το γραφείο του σερίφη της κομητείας της Ουάσιγκτον στο Όρεγκον, χρήστης του προϊόντος αναγνώρισης προσώπου της Amazon, δήλωσε ότι δεν ορίζουν και δεν κάνουν χρήση ορίων εμπιστοσύνης, όταν χρησιμοποιούν το σύστημα. Με αυτό επισημαίνεται πόσο σημαντικό είναι να διασφαλιστεί ότι οι χειριστές τεχνολογίας αναγνώρισης προσώπου για χρήσεις ευαίσθητης φύσης έχουν την κατάλληλη εκπαίδευση και επίβλεψη, ώστε να διασφαλιστεί ότι τα συστήματα είναι σωστά ρυθμισμένα. Εάν οι αντιστοιχίσεις αναγνώρισης προσώπου πρόκειται να χρησιμοποιηθούν ως αποδεικτικά στοιχεία ή για να παρέχουν πληροφορίες με σκοπό την αυτοματοποιημένη λήψη αποφάσεων, απαιτείται μια πολύ πιο αυστηρή διαδικασία για την προστασία των πολιτών από την κατάχρηση.

Ωστόσο, καθώς η αναγνώριση προσώπου χρησιμοποιείται ως επί το πλείστον απλώς για να διατίθενται κάποια κατευθυντήρια στοιχεία, η κριτική που ασκείται στην τεχνολογία, βασισμένη αποκλειστικά σε περιπτώσεις ψευδών αντιστοιχίσεων, δίνει εσφαλμένη εικόνα του κινδύνου. Όταν η αναγνώριση προσώπου χρησιμοποιείται για έρευνα, οι περισσότεροι ερευνητές γνωρίζουν ότι η συντριπτική πλειονότητα των αντιστοιχίσεων θα είναι εσφαλμένη. Σε αυτές τις περιπτώσεις, το ζήτημα είναι να εμφανιστεί ένα ευρύ φάσμα πιθανών υποψηφίων από τους οποίους η συντριπτική πλειονότητα, αν όχι όλοι, θα απορριφθούν από τους χειριστές. Αυτό δεν σημαίνει ότι δεν συντρέχουν κίνδυνοι από τη χρήση της αναγνώρισης προσώπου για έρευνα, αλλά μάλλον ότι οποιοδήποτε ενδεχόμενο πλαίσιο διακυβέρνησης για την τεχνολογία θα πρέπει να λαμβάνει υπόψη το γεγονός ότι αυτά τα συστήματα θα χρησιμοποιηθούν με μια σειρά διαφορετικών τρόπων και ότι καθένας τους δημιουργεί διαφορετικό σύνολο κινδύνων.

Η σημασία της διαχείρισης κινδύνων με γνώμονα το μέλλον

Η τεχνολογία αναγνώρισης προσώπου έχει προκαλέσει διάχυτη ανησυχία λόγω της δυνητικής κατάχρησης που μπορεί να προκύψει. Η κατανόηση της πραγματικότητας σχετικά με το πώς η ακρίβεια επηρεάζει αυτούς τους κινδύνους θα είναι ζωτικής σημασίας για τους χαράσσοντες πολιτική που προσπαθούν να δημιουργήσουν ασπίδες προστασίας για τους πολίτες τους, διατηρώντας παράλληλα τα οφέλη που θα μπορούσε να αποφέρει η τεχνολογία. Η ταχέως βελτιούμενη ακρίβεια των συστημάτων αναγνώρισης προσώπου θα βοηθήσει στην αποφυγή ζημιών που μπορεί να προέλθουν από εσφαλμένη αναγνώριση, αλλά θα μπορούσε επίσης να αυξήσει άλλους κινδύνους, καθιστώντας την τεχνολογία πιο ελκυστική για όσους ενδέχεται να προβούν σε καταχρηστική χρήση. Ταυτόχρονα, οι βελτιώσεις στην τεχνολογία θα αυξήσουν τη δυνητική αξία της στην επιβολή του νόμου και στις ιδιωτικές επιχειρήσεις, δημιουργώντας πιέσεις που επιτρέπουν η επέκταση της υιοθέτησής της να συνεχιστεί. Καθώς οι φορείς χάραξης πολιτικής εργάζονται για να ρυθμίσουν τη χρήση αυτών των τεχνολογιών, θα είναι σημαντικό για εκείνους να επικεντρωθούν στους κινδύνους και στις ευκαιρίες που συνδέονται με το πώς θα εξελιχθεί η τεχνολογία μελλοντικά, αντί να εστιάζουν σε ανησυχίες που σχετίζονται με το πού βρίσκεται η τεχνολογία αυτή τη στιγμή.

Οι φορείς χάραξης πολιτικής είναι σημαντικό να επικεντρωθούν στους κινδύνους και στις ευκαιρίες που συνδέονται με το πώς θα εξελιχθεί η τεχνολογία, αντί να εστιάζουν σε ανησυχίες που σχετίζονται με το πού βρίσκεται η τεχνολογία.

Τα μέτρα για την προστασία από εσφαλμένη αναγνώριση θα είναι πάντα σημαντικά, καθώς η αναγνώριση προσώπου δεν θα είναι ποτέ 100% ακριβής. Σήμερα, αυτά τα μέτρα προστασίας είναι ιδιαίτερα σημαντικά, καθώς πολλοί πάροχοι εξακολουθούν να μη διαθέτουν συστήματα που λειτουργούν με εξαιρετικά υψηλή ακρίβεια και ακόμη και οι καλύτεροι αλγόριθμοι εξακολουθούν να δυσκολεύονται σε συνθήκες του πραγματικού κόσμου που αποτελούν μεγαλύτερη πρόκληση. Ωστόσο, αναμένεται ότι όλο και περισσότερο, οι κίνδυνοι της αναγνώρισης προσώπου δεν θα προέρχονται από περιπτώσεις όπου η τεχνολογία αποτυγχάνει αλλά, αντιθέτως, από περιπτώσεις όπου αυτή επιτυγχάνει. Η ανεξέλεγκτη χρήση της αναγνώρισης προσώπου σε δημόσιους χώρους θα μπορούσε να επιτρέψει μια άνευ προηγουμένου συλλογή δεδομένων συμπεριφοράς και κίνησης των πολιτών, δημιουργώντας ευκαιρίες για οικονομική εκμετάλλευση, πολιτική χειραγώγηση, διακρίσεις και πολλά άλλα. Ωστόσο, υπό την ορθή διακυβέρνηση, η τεχνολογία αναγνώρισης προσώπου θα μπορούσε, επίσης, να αποφέρει σημαντικά οφέλη ως προς την ασφάλεια και την προσβασιμότητα. Οι υπεύθυνοι φορείς για τη χάραξη πολιτικής αντιμετωπίζουν τώρα το ζήτημα του τρόπου εξισορρόπησης αυτών των συμφερόντων για το καλό των πολιτών τους, αλλά πρώτα πρέπει να κατανοήσουν τις πραγματικές δυνάμεις, τις αδυναμίες και τις δυνατότητες των συστημάτων αναγνώρισης προσώπου.

1Συγκρίνοντας τα ποσοστά ψευδώς αρνητικής αναγνώρισης στην κορυφαία αντιστοίχιση (N= 1,6 εκατ. φωτογραφίες σύλληψης, FRVT 2018), για τον αλγόριθμο 2020 Yitu-004 (0,0008) και τον αλγόριθμο 2014 NEC-30 (0,041). Πηγή: Πάτρικ Γκρόθερ, Μέι Νγκαν και Κέι Χαναόκα, FRVT Part 2: Identification, 27 Μαρτίου 2020 και Πάτρικ Γκρόθερ, Μέι Νγκαν και Κέι Χαναόκα, FRVT Part 2: Identification, Νοέμβριος 2018.

2 Ο αλγόριθμος Yitu-003 πέτυχε ποσοστό ψευδούς μη-αντιστοίχισης (FNMR) 0,0003 (0,03%) με ποσοστά ψευδούς αντιστοίχισης (FMR) 1e-4 (=0,0001) για φωτογραφίες βίζας. Πηγή: FRVT 1: 1 Leaderboard, NIST, 27 Φεβρουαρίου 2020.

3 Οι έλεγχοι του NIST το 2018 διαπίστωσαν ότι οι πιο ακριβείς σαρώσεις ίριδας επιτυγχάνουν ποσοστά ακρίβειας 99,43%, με πάνω από το 50% να επιτυγχάνει ποσοστά ακρίβειας άνω του 98%. Πηγή: Τζορτζ Κουίν, Πάτρικ Γκρόθερ και Τζέιμς Ματέι, IREX IX Part One Performance of Iris Recognition Algorithms, NISTIR 8207, Απρίλιος 2018.

4 NEC-002 FNMR σε N=1,6 εκατ. φωτογραφίες σύλληψης (R=1, FRVT 2018) και σε N=1,1 εκατ. φωτογραφίες «φυσικού περιβάλλοντος» (R=1). Γκρόθερ κ.ά. FRVT Part 2: Identification, 27 Μαρτίου 2020.

5 Η μέση μεταβολή στο ποσοστό σφάλματος για έξι ενδεικτικούς αλγόριθμους μεσαίου επιπέδου που επέλεξαν οι Γκρόθερ κ.ά. ήταν 9,24x για λειτουργία αναγνώρισης, FPIR = 0,001. Πάτρικ Γκρόθερ, Μέι Νγκαν και Κέι Χαναόκα, Face Recognition Vendor Test (FRVT) Part 2: Identification, NIST, NISTIR 8271, Σεπτέμβριος 2019.

6 M32V FNIR 0,056 σε FP(T)=1 στο σύνολο δεδομένων U. Πάτρικ Γκρόθερ, Τζορτζ Κουίν και Μέι Νγκαν, Face in Video Evaluation (FIVE): Face Recognition of Non-Cooperative Subjects, NIST, NISTIR 8173, Μάρτιος 2017

7 M32V FNMR σε χαμηλή τοποθέτηση 6 ποδιών (1,8 μέτρων) και τοποθέτηση σε ύψος θύρας 8 ποδιών (2,4 μέτρων) στο σύνολο δεδομένων P. Γκρόθερ κ.ά. FIVE: Face Recognition of Non-Cooperative Subjects, Μάρτιος 2017.

8 M32V FNMR έναντι N31V FNMR σε χαμηλή τοποθέτηση 6 ποδιών (1,8 μέτρων) στο σύνολο δεδομένων P. Γκρόθερ κ.ά. FIVE: Face Recognition of Non-Cooperative Subjects, Μάρτιος 2017.

9 Ο κορυφαίος αλγόριθμος επαλήθευσης στις 27 Φεβρουαρίου 2020, ο Yitu-003, είχε ποσοστό ψευδούς μη-αντιστοίχισης (FNMR) 0,0003 (0,03%), για φωτογραφίες βίζας με FMR 1e-4 (=0,0001). Ο intellicloudai-001, ο διάμεσος αλγόριθμος, είχε FNMR=0,0064 (0,64%). Ο Allgovision-000, ο οποίος πέτυχε το τρίτο τεταρτημόριο βαθμολογίας ακρίβειας, είχε FNMR=0,0210 (2,1%). Πηγή: Πάτρικ Γκρόθερ, Μέι Νγκαν και Κέι Χαναόκα, Ongoing Face Recognition Vendor Test (FRVT) Part 1: Verification, NIST, 28 Φεβρουαρίου 2020.


Μετάφραση: Εβίτα Λύκου

Πηγή: Γουίλιαμ Κράμπλερ, How Accurate are Facial Recognition Systems – and Why Does It Matter?, Technology Policy Blog, CSIS: Technology Policy Program, 14 Απριλίου 2020

*Ο συγγραφέας του άρθρου, Γουίλιαμ Κράμπλερ, είναι βοηθός έρευνας στο Πρόγραμμα Τεχνολογικής Πολιτικής (Technology Policy Program) στο Κέντρο Στρατηγικών & Διεθνών Σπουδών (Center for Strategic & International Studies, CSIS) στην Ουάσιγκτον.

Το παρόν αποτελεί αναδημοσίευση, σε ελληνική μετάφραση. Το άρθρο πρωτογενώς δημοσιεύθηκε στο Technology Policy Blog, το οποίο παράγεται από το Technology Policy Program στο CSIS, έναν ιδιωτικό, φοροαπαλλασσόμενο οργανισμό που εστιάζει σε διεθνή θέματα δημόσιας πολιτικής. Η έρευνά του είναι μη κομματική και μη ιδιοκτησιακή. Το CSIS δεν λαμβάνει συγκεκριμένες πολιτικές θέσεις. Κατά συνέπεια, όλες οι απόψεις, οι θέσεις και τα συμπεράσματα που εκφράζονται σε αυτή τη δημοσίευση θα πρέπει να θεωρείται ότι ανήκουν αποκλειστικά στον συγγραφέα.