Πώς τα drones θα μπορούν σύντομα να εντοπίζουν και βιομετρικά στοιχεία

Τα εκτενή σωματικά βιομετρικά στοιχεία βρίσκονται προ των πυλών

Drone © EPA/MARTIN DIVISEK

Παρά τις εντυπωσιακές δυνατότητες των drones, η αναγνώριση προσώπου παραμένει αδύνατη. Τα μη επανδρωμένα αεροσκάφη βρίσκονται σε πολύ μεγαλύτερη απόσταση από τα υποκείμενά τους σε σύγκριση με τις κάμερες κλειστού κυκλώματος, που χρησιμοποιούνται συνήθως για βιομετρικές αναλύσεις. Σε αυτές τις αποστάσεις, ένα πρόσωπο μπορεί να αποδίδεται με λίγες μόνο δεκάδες pixels. Οι ατμοσφαιρικές διακυμάνσεις, όπως η άνοδος του θερμού αέρα, μπορούν να παραμορφώσουν χαρακτηριστικά, όπως η απόσταση μεταξύ των ματιών. Επιπλέον, επειδή οι κάμερες των drones καταγράφουν από τον ουρανό, συχνά αποτυπώνουν μια μερική μόνο εικόνα του προσώπου ή, αν κάποιος φοράει καπέλο με φαρδύ γείσο, καμία.

Ωστόσο, μια επαναστατική τεχνολογία από ερευνητική ομάδα του Πολιτειακού Πανεπιστημίου του Μίσιγκαν (MSU) έρχεται να ανατρέψει όσα πιστεύαμε έως τώρα και να ανεβάσει σε νέα επίπεδα τις δυνατότητες της Τεχνητής Νοημοσύνης στον ουρανό. Το σύστημα, με την εύγλωττη ονομασία FarSight, υπόσχεται ότι η εναέρια επιτήρηση μεγάλης εμβέλειας δεν θα είναι απλώς πιο ακριβής, αλλά και πιο διεισδυτική από ποτέ. Το έργο χρηματοδοτείται από το Intelligence Advanced Research Projects Activity (IARPA), τμήμα της αμερικανικής κυβέρνησης, υπεύθυνο για τη μεταφορά ευφάνταστων κατασκοπευτικών ιδεών στην πραγματική ζωή. Άλλα τρέχοντα έργα IARPA περιλαμβάνουν μια προσπάθεια για την κατασκευή μιας συσκευής που μπορεί να διαμορφώνει τη φωνή σε πραγματικό χρόνο, ώστε να αποφεύγεται η ανίχνευση από εργαλεία αναγνώρισης ομιλίας, καθώς και μια πρωτοβουλία για την κατασκευή συσκευών κατασκοπείας, οι οποίες είναι αρκετά μικρές και εύκαμπτες ώστε να μπορούν να υφαίνονται απευθείας στα ρούχα.

Το FarSight εργάζεται με μια παρόμοια πανούργα τεχνική γνωστή ως «βιομετρική αναγνώριση ολόκληρου του σώματος». Αντί να προσπαθεί να αναγνωρίσει ένα υποκείμενο μόνο από το πρόσωπό του, το σύστημα χρησιμοποιεί έναν συνδυασμό αλγορίθμων βιομετρικής αναγνώρισης που εκτελούνται παράλληλα.

Ένα σύνολο αλγορίθμων διακρίνει το βάδισμα του ατόμου, ενώ ένα άλλο δημιουργεί μια τρισδιάστατη αναπαράσταση του σώματός του. Ο Xiaoming Liu, καθηγητής Πληροφορικής και Μηχανικής στο MSU, ο οποίος ηγείται του έργου, το παρομοιάζει σαν κάποιος ουσιαστικά να γδύνει το άτομο, προκειμένου να δημιουργήσει ένα ακριβές μοντέλο της ανατομίας του, ανεξάρτητα από το τι φοράει.

Ένα τρίτο σύνολο αλγορίθμων περνά το πρόσωπο του υποκειμένου από ένα μοντέλο στροβιλισμού, που προσπαθεί να αναιρέσει τις διαθλαστικές επιδράσεις του αέρα στο φως που εισέρχεται στην κάμερα, επαναφέροντας την εικόνα που συλλέγεται από το drone σε μια προσομοιωμένη μη παραμορφωμένη κατάσταση, από την οποία στη συνέχεια εξάγεται μια λεπτομερής χαρτογράφηση των χαρακτηριστικών του υποκειμένου.

Αφού αποτυπωθούν, οι τρεις βιομετρικοί δείκτες -το βάδισμα, το σχήμα του σώματος και το πρόσωπο- συγχωνεύονται σε ένα συνδυασμένο προφίλ. Αυτό το προφίλ μπορεί να αντιστοιχιστεί με εκείνα γνωστών ατόμων ή, εάν ο στόχος είναι νέος, να αποθηκευτεί για μελλοντική χρήση. Η όλη διαδικασία πραγματοποιείται σε περίπου ένα τρίτο του δευτερολέπτου, λέει ο δρ Liu. Η ομάδα του εργάζεται για να μειώσει την κλίμακα του συστήματος, ώστε να μπορεί να χωρέσει σε ένα τετρακόπτερο.

Αν και βρίσκεται ακόμη σε πειραματικό στάδιο, τα πρώτα αποτελέσματα του FarSight είναι εντυπωσιακά. Το Εθνικό Ινστιτούτο Προτύπων και Τεχνολογίας (NIST), ο οργανισμός τυποποίησης της Αμερικής, ο οποίος αξιολογεί συστήματα αναγνώρισης προσώπου για περισσότερο από μια δεκαετία, δοκίμασε το FarSight σε μια σειρά από δύσκολες εικόνες και βίντεο χαμηλής ανάλυσης που συλλέχθηκαν σε εκατοντάδες μέτρα, σε πολλές περιπτώσεις από μεγάλη γωνία. Το FarSight ξεπέρασε όλα τα άλλα συστήματα που δοκιμάστηκαν στο ίδιο σύνολο.

Το έργο δείχνει επίσης πώς τα μοντέλα μεγάλης όρασης (LVM), μια παραλλαγή των μεγάλων γλωσσικών μοντέλων, θα μπορούσαν να είναι χρήσιμα για την επιτήρηση. Η ομάδα του MSU χρησιμοποίησε το CLIP, ένα μοντέλο που κατασκευάστηκε από την OpenAI, για να σχολιάσει εικόνες χιλιάδων ατόμων με περιγραφές κειμένου -«Μυώδης-λεπτός, μακρύς κορμός», «Κοντός κορμός», «Ψηλόμεση», «Χαμηλόμεση»-, τις οποίες στη συνέχεια χρησιμοποίησε για να εκπαιδεύσει το σύστημα αποτύπωσης του σχήματος του σώματος. Η λειτουργία αναγνώρισης βάδισης βασίζεται σε ένα διαφορετικό μοντέλο μεγάλης όρασης, που ονομάζεται DINOv2, το οποίο κυκλοφόρησε πέρυσι από τη Meta.

Ο δρ Liu λέει ότι τα επόμενα χρόνια τα μοντέλα LVM θα μπορούσαν να έχουν πολύ ευρύτερες εφαρμογές. Αυτό οφείλεται στο γεγονός ότι τα LVM επιτυγχάνουν αναγνώριση υψηλής απόδοσης χωρίς να απαιτούν μεγάλα σύνολα δεδομένων εκπαίδευσης, τα οποία είναι δύσκολο και ακριβό να παραχθούν. Τα δεδομένα εκπαίδευσης και δοκιμής του FarSight, μεγάλο μέρος των οποίων συλλέχθηκαν από το Oak Ridge National Laboratory, μια εγκατάσταση επιστημονικής έρευνας, αποτελούνται από 876.000 βίντεο και φωτογραφίες περίπου 3.000 ατόμων. Ένα LVM, συγκριτικά, είναι ήδη προ-εκπαιδευμένο σε δισεκατομμύρια εικόνες και βίντεο και μπορεί να απαιτήσει ελάχιστη τελειοποίηση πριν χρησιμοποιηθεί για την ανάλυση βίντεο παρακολούθησης.

Το FarSight δεν είναι ακόμη έτοιμο για το πεδίο. Αν και υπερτερεί έναντι άλλων συστημάτων στην αναγνώριση σε μεγάλη απόσταση, η ακρίβειά του, καθώς και τα ποσοστά ψευδώς θετικών και ψευδώς αρνητικών αποτελεσμάτων, παραμένουν «πολύ πίσω από τις επιδόσεις που θα απαιτούνταν για να καταστεί το σύστημα εφαρμόσιμο», λέει ο Josef Kittler, καθηγητής που εργάζεται σε θέματα βιομετρίας και όρασης υπολογιστών στο Πανεπιστήμιο του Surrey, ο οποίος δεν συμμετείχε στην έρευνα.

Το σύστημα έχει κι άλλους περιορισμούς. Το βάδισμα ενός ατόμου, για παράδειγμα, εάν μεταφέρει βαρύ φορτίο ή έχει υποστεί τραυματισμό, μπορεί να αλλάξει δραστικά, λέει ο δρ Kittler. Σε μια δεύτερη δοκιμή του NIST σε ένα ευρύτερο σύνολο δεδομένων, το FarSight δεν είχε τις καλύτερες επιδόσεις. Ο δρ Liu λέει ότι η απόδοση του FarSight μειώνεται επίσης σημαντικά εάν η γωνία της κάμερας είναι πολύ υψηλή, εάν ο καιρός είναι ζεστός (που προκαλεί εντονότερες αλλοιώσεις) ή εάν η απόσταση από τον στόχο υπερβαίνει το ένα χιλιόμετρο.

Αν, όμως, αυτές οι αδυναμίες επιλυθούν, δεν είναι δύσκολο να φανταστεί κανείς πώς ένα τέτοιο σύστημα θα μπορούσε να καταλήξει πάνω από τα κεφάλια μας. Σύμφωνα με τα έγγραφα της σύμβασης, το IARPA επιδιώκει να δημιουργήσει μια τεχνολογία όχι μόνο για drones, αλλά για οποιαδήποτε υψηλή ή απομακρυσμένη κάμερα, όπως αυτές που είναι τοποθετημένες σε ψηλά κτίρια ή πύργους επιτήρησης συνόρων. Ο οργανισμός έχει σημειώσει ότι τα αποτελέσματα του προγράμματος -γνωστό ως BRIAR, το οποίο έχει τουλάχιστον μία ακόμη ενεργή ερευνητική ομάδα, με επικεφαλής μια αμερικανική εταιρεία που ονομάζεται Science and Technology Research- προορίζονται επίσης για την «προστασία των κρίσιμων υποδομών και των εγκαταστάσεων μεταφορών».

«Αυτό συνεπάγεται τη συνήθη χρήση του σε μη στρατιωτικούς πληθυσμούς», λέει ο Jay Stanley από την Αμερικανική Ένωση Πολιτικών Ελευθεριών, και «δημιουργεί σοβαρούς κινδύνους κατάχρησης και ανατριχιαστικές επιπτώσεις στην αίσθηση της ελευθερίας των ανθρώπων». Σε πόλεις όπως το Λονδίνο ή η Νέα Υόρκη, όπου οι κάμερες κλειστού κυκλώματος είναι πανταχού παρούσες, αλλά όχι συνεχόμενες, η αναγνώριση ολόκληρου του σώματος θα μπορούσε να βοηθήσει στον εντοπισμό ατόμων σε μεγάλες αποστάσεις. Η Veritone, μια αμερικανική εταιρεία, εμπορεύεται ήδη ένα σύστημα που μπορεί να ταιριάξει άτομα με χαρακτηριστικά όπως το σχήμα του σώματος και το χτένισμα. Τον Μάιο το αφεντικό της εταιρείας, ο Ryan Steelberg, δήλωσε στο περιοδικό MIT Technology Review ότι το εργαλείο θα μπορούσε να είναι χρήσιμο σε πόλεις όπου η αναγνώριση προσώπου απαγορεύεται.

Όσοι ασχολούνται με την προστασία της ιδιωτικής ζωής ίσως διαπιστώσουν ότι οι προσωπικές τους ασφαλιστικές δικλίδες περιορίζονται απέναντι στα βιομετρικά δεδομένα ολόκληρου του σώματος. Κάποιος που θέλει να αποφύγει ένα σύστημα όπως το FarSight δεν θα μπορεί πια να βασίζεται απλώς σε μια αλλαγή ρούχων ή σε ένα μεγάλο καπέλο. Θα χρειαστεί να τροποποιήσει το βάδισμά του και, με κάποιον τρόπο, να εμφανίσει στις κάμερες ένα διαφορετικό σχήμα σώματος. Με άλλα λόγια, όπως σημειώνει ο δρ Liu,πρέπει να αλλάξει «όλο το πακέτο».

© 2025 The Economist Newspaper Limited. All rights reserved. Άρθρο από τον Economist, το οποίο μεταφράστηκε και δημοσιεύθηκε με επίσημη άδεια από την www.powergame.gr. Το πρωτότυπο άρθρο, στα αγγλικά, βρίσκεται στο www.economist.com