Μία από τις φιλοδοξίες της επιστήμης και της τεχνολογίας είναι η ανάπτυξη συστημάτων με τις δυνατότητες του πιο πολύπλοκου οργανισμού που υπάρχει στη φύση: αυτού που αποτελείται από τα 37 τρισεκατομμύρια κύτταρα του ανθρώπινου σώματος. Συνολικά είναι ακατανόητο, αλλά μπορεί να σημειωθεί μερική πρόοδος. Το Ινστιτούτο Μικροηλεκτρονικής της πρωτεύουσας της Ανδαλουσίας (Imse), το Ανώτατο Συμβούλιο Επιστημονικής Έρευνας (CSIC) και το Πανεπιστήμιο της Σεβίλλης, έχουν επικεντρωθεί στο σύστημα που καθιστά δυνατή την όραση. Οι συμβατικές κάμερες καταγράφουν μια εικόνα η οποία, όταν επαναλαμβάνεται μεταξύ…
Εγγραφείτε για να συνεχίσετε την ανάγνωση
Διαβάστε χωρίς όρια
Μία από τις φιλοδοξίες της επιστήμης και της τεχνολογίας είναι η ανάπτυξη συστημάτων με τις δυνατότητες του πιο πολύπλοκου οργανισμού που υπάρχει στη φύση: αυτού που αποτελείται από τα 37 τρισεκατομμύρια κύτταρα του ανθρώπινου σώματος. Συνολικά είναι ακατανόητο, αλλά μπορεί να σημειωθεί μερική πρόοδος. Το Ινστιτούτο Μικροηλεκτρονικής της πρωτεύουσας της Ανδαλουσίας (Imse), το Ανώτατο Συμβούλιο Επιστημονικής Έρευνας (CSIC) και το Πανεπιστήμιο της Σεβίλλης, έχουν επικεντρωθεί στο σύστημα που καθιστά δυνατή την όραση. Οι συμβατικές κάμερες καταγράφουν μια εικόνα η οποία, επαναλαμβανόμενη 30 έως 100.000 φορές το δευτερόλεπτο, σχηματίζει μια ακολουθία. Αλλά το μάτι και οι συνδέσεις με τον εγκέφαλο μάς επιτρέπουν να προχωρήσουμε παραπέρα και να εστιάσουμε και να αντιληφθούμε ελάχιστες αλλαγές που μας επιτρέπουν να προσαρμοστούμε για να ερμηνεύσουμε το περιβάλλον και να ενεργήσουμε ανάλογα χωρίς να χρειάζεται να αποθηκεύσουμε όλες τις πληροφορίες. Αυτή είναι μια δυνατότητα που το Imse εφαρμόζει ήδη σε αισθητήρες δυναμικής όρασης (DVS) για κάμερες εκδηλώσεων που έχουν υιοθετήσει εταιρείες όπως η Samsung και η Sony.
Οι συμβατικές κάμερες μοιάζουν περισσότερο με υπερρεαλιστικό πίνακα παρά με όραμα. Καταγράφουν μια εικόνα ενός καρέ και την αναπαράγουν. Οι κύριες προόδους του αφορούν την ανάλυση: την ενσωμάτωση περισσότερων pixel για την επίτευξη ορισμού και την αποφυγή πιθανών ελαττωμάτων επεξεργασίας. «Μπορούν να παρέχουν έναν τεράστιο όγκο δεδομένων που απαιτούν ένα κεντρικό γραφείο και πολλά καλώδια για τη μετάδοσή τους. Αλλά κάποιος πρέπει να δώσει περισσότερες λεπτομέρειες», εξηγεί ο Bernabé Linares, καθηγητής ερευνητής στο Imse.
«Ο βιολογικός αμφιβληστροειδής δεν αποκτά εικόνες. Όλες οι πληροφορίες περνούν από το οπτικό νεύρο και ο εγκέφαλος τις επεξεργάζεται. Στη συμβατική κάμερα, κάθε pixel είναι αυτόνομο και, το πολύ, είναι φτιαγμένο για να αλληλεπιδρά με τους γείτονές του για να ρυθμίζει τη φωτεινότητα. Αλλά μια ψηφιακή εικόνα στην έξοδο ενός τούνελ μπορεί να είναι ολόλευκη ή μαύρη ενώ εμείς, εκτός από πολύ ακραίες συνθήκες, μπορούμε να δούμε τι υπάρχει μέσα και τι έξω», προσθέτει ο ερευνητής. Αυτή η ικανότητα είναι απαραίτητη, για παράδειγμα, για την ανάπτυξη αυτοοδηγούμενων οχημάτων.
Αυτό το χαρακτηριστικό της ανθρώπινης όρασης είναι γνωστό ως foveation, ένας μηχανισμός που επιτρέπει τη μεγιστοποίηση της ανάλυσης στην περιοχή όπου εστιάζεται η όραση, διατηρώντας παράλληλα χαμηλή ανάλυση σε περιοχές της περιφερειακής όρασης. Αυτό μειώνει τον όγκο των πληροφοριών που παράγεται από τον αμφιβληστροειδή, αλλά διατηρεί την ικανότητα οπτικής αναγνώρισης για τη λήψη αποφάσεων.
Η ομάδα Imse Neuromorphic Systems αναζητά ένα ηλεκτρονικό μάτι με αυτά και άλλα βιολογικά εμπνευσμένα χαρακτηριστικά, έναν αισθητήρα που επιτρέπει αποτελέσματα σε υψηλή ταχύτητα, χωρίς τεράστια κατανάλωση ενέργειας και που ελαχιστοποιεί την ποσότητα των δεδομένων που απαιτούνται για αποτελεσματική επεξεργασία. Με αυτές τις εγκαταστάσεις αναπτύχθηκε η κάμερα εκδηλώσεων, η οποία δεν λειτουργεί με καρέ, αλλά με συνεχείς ροές ηλεκτρικών παλμών (γεγονότα ή κορυφές) που παράγεται από κάθε φωτοαισθητήρα (ή pixel) ανεξάρτητα όταν ανιχνεύει επαρκή αλλαγή στο φως.
«Σε αυτές τις κάμερες», υπογραμμίζει ο Linares, «οι αρχικές πληροφορίες παρέχονται από τα περιγράμματα των αντικειμένων. Αλλά δεν είναι εικόνες: είναι μια δυναμική ροή εικονοστοιχείων (γεγονότων) που αλλάζουν και η φάση επεξεργασίας μιμείται τον εγκέφαλο, ο οποίος δημιουργεί επίσης μια ιεραρχία στρωμάτων».
Αν και το μικρόβιο της νέας προσέγγισης στην απεικόνιση εμφανίστηκε στο Ινστιτούτο Τεχνολογίας της Καλιφόρνια (Caltech) τη δεκαετία του 1990, η χρήση της για τη μίμηση του ανθρώπινου ματιού ξεκίνησε πριν από 20 χρόνια στην Ελβετία με ένα ευρωπαϊκό έργο που συντονίστηκε από την Imse και ονομάζεται CAVIAR. Από εκεί ξεκίνησαν οι πατέντες, αναδείχθηκαν εταιρείες μέσα από έρευνα, επενδυτές και υιοθέτηση εξελίξεων από εταιρείες όπως η Samsung και η Sony για την ανάπτυξη επεξεργαστών εικόνας. «Ο στόχος – εξηγεί ο ερευνητής του Imse – είναι να αναπτυχθεί ένα βοθρίο [la región de la retina especializada en la visión fina de los detalles] ηλεκτρονική”. Αυτή η συσκευή επιτρέπει, χωρίς να δημιουργεί πολλές πληροφορίες, τον εντοπισμό της περιοχής ενδιαφέροντος και είναι αυτή που επεξεργάζεται σε υψηλή ανάλυση.
Αυτή η συσκευή είναι απαραίτητη για τη διάκριση δεδομένων σχετικά με την αυτόνομη οδήγηση, τον εξορθολογισμό της επεξεργασίας και την ελαχιστοποίηση της κατανάλωσης πόρων. «Αν η κάμερα δει μια πινακίδα, έναν πεζό ή άλλο όχημα, δεν χρειάζεται να αναλύσει ολόκληρη την εικόνα αλλά μόνο το νέο στοιχείο», εξηγεί ο Linares.
Αλλά έχει επίσης εξαιρετικές επιπτώσεις στους αισθητήρες για οποιαδήποτε δραστηριότητα, όπως η επιτήρηση και η παρακολούθηση εικόνων, που ενεργοποιούνται μόνο όταν συμβεί σχετική αλλαγή ή στη διάγνωση εικόνων, στην αναφορά μόνο αλλαγμένων περιοχών ή στην πλοήγηση με drone. Η έρευνα με επικεφαλής τον Bodo Rueckauer, του ολλανδικού Πανεπιστημίου του Radboud, χρησιμοποιεί έναν δυναμικό αισθητήρα όρασης (DVS), όπως αυτός που αναπτύχθηκε από την Imse: «Αυτός ο αισθητήρας χωρίς πλαίσιο αναφέρει αλλαγές στην ένταση φωτός ανάλογα με τα pixel και χαρακτηρίζεται από υψηλό δυναμικό εύρος και ανάλυση χρόνου μικροδευτερόλεπτου. Ένα AI εκπαιδευμένο στην αναγνώριση χειρονομιών επιτυγχάνει 90% ακρίβεια μέσω DVS.»
Η Teresa Serrano, επιστήμονας και διευθύντρια του Imse, υπογραμμίζει πώς η νευροεπιστήμη μπορεί να χρησιμοποιήσει επεξεργαστές που αλληλεπιδρούν με νευρωνικά συστήματα και εξυπηρετούν ασθενείς με επιληψία ή νόσο του Πάρκινσον.
Η τρέχουσα γραμμή έρευνας ομαδοποιείται στο έργο Nimble AI, το οποίο στοχεύει να αξιοποιήσει τις τελευταίες εξελίξεις στη μικροηλεκτρονική και την τεχνολογία ολοκληρωμένων κυκλωμάτων για τη δημιουργία νευρομορφικής ανίχνευσης και επεξεργασίας με μεγαλύτερη ασφάλεια και ιδιωτικότητα με χαμηλότερο κόστος, κατανάλωση ενέργειας (έως και 100 φορές λιγότερο) και λανθάνουσα κατάσταση (50 φορές ταχύτερος χρόνος απόκρισης).
Μία από τις εταιρείες που προέκυψαν από την ερευνητική ομάδα ήταν η Chronocam, που τώρα ονομάζεται Profhesee. «Ουσιαστικά, αυτό που αναπτύσσουμε είναι μια νέα προσέγγιση στην ανίχνευση πληροφοριών, πολύ διαφορετική από τις συμβατικές κάμερες που υπάρχουν εδώ και πολλά χρόνια», λέει ο Luca Verre, Διευθύνων Σύμβουλος της Profhesee.
«Οι αισθητήρες μας παράγουν πολύ χαμηλούς όγκους δεδομένων. Ως εκ τούτου, σας επιτρέπουν να έχετε ένα σύστημα χαμηλής κατανάλωσης και λογικού κόστους επειδή, απλά, μπορεί να δημιουργήσει ορισμένα δεδομένα συμβάντων με τα οποία ο επεξεργαστής μπορεί να αλληλεπιδράσει εύκολα και τοπικά. Αντί να το τροφοδοτείτε με τόνους καρέ που το κατακλύζουν και εμποδίζουν την ικανότητά του να επεξεργάζεται δεδομένα σε πραγματικό χρόνο, η κάμερα εκδηλώσεων σας επιτρέπει να το κάνετε αυτό σε πραγματικό χρόνο σε μια σκηνή», εξηγεί ο Verre.
Μπορείτε να ακολουθήσετε ΘΕΜΑ Σε Facebook, Χ ΚΑΙ Ίνσταγκραμή εγγραφείτε εδώ για να το λάβετε το εβδομαδιαίο μας ενημερωτικό δελτίο.