Αλκης Γαλδαδάς

Happy Little girl with dog walking in the flowers field in spring
Η επικοινωνία αποκαλύπτεται και αποκρυπτογραφείται - έως έναν βαθμό - με τη βοήθεια της Τεχνητής Νοημοσύνης. Η χρήση της νέας γνώσης επαφίεται σε εμάς
«Αφεντικό, σε συμπαθώ πάρα πολύ. Εχεις τα πάντα εκτός από λίγη τρέλα. Και ο άνθρωπος χρειάζεται λίγη τρέλα… Αλλιώς δεν μπορεί να σπάσει το σκοινί και να ελευθερωθεί».
Λόγια του Αλέξη Ζορμπά που τα βρίσκει ο αναγνώστης στο ομώνυμο βιβλίο του Νίκου Καζαντζάκη. Τη σχετική με τον άνθρωπο πρόταση όμως τη βρίσκουμε επίσης στον προσωπικό ιστότοπο του συνομιλητή μας Σταύρου Νταλαμπίρα, αναπληρωτή καθηγητή στο Τμήμα Πληροφορικής του Πανεπιστημίου του Μιλάνου.
Αυτή τη στιγμή, είναι ιδρυτικό μέλος της Ομάδας Εργασίας του IEEE (Ινστιτούτο Ηλεκτρολόγων και Ηλεκτρονικών Μηχανικών με έδρα τη Νέα Υόρκη) για την Υπολογιστική Επεξεργασία Ηχου και συντάκτης επιστημονικών περιοδικών, μεταξύ των οποίων τα IEEE Transactions on Neural Network and Learning Systems, PlosOne και Intelligent Computing.
Τα ερευνητικά του ενδιαφέροντα περιλαμβάνουν την τεχνητή νοημοσύνη, την επεξεργασία σήματος, την αναγνώριση προτύπων ήχου, τη μηχανική μάθηση, τη βιοακουστική, τα μεγάλα δεδομένα και τα κυβερνοφυσικά συστήματα. Ανήκει επίσης στην κατηγορία εκείνων των ερευνητών που θέτουν στη διάθεση και των άλλων τα δεδομένα που προκύπτουν από τη δική τους έρευνα.
Και εκείνος κατά κάποιον τρόπο έσπασε το «σκοινί», αφού με σπουδές αρχικά στο Πολυτεχνείο της Πάτρας, Ηλεκτρολόγος Μηχανικός και με διδακτορικό στην Τεχνητή Νοημοσύνη, μεταξύ άλλων ερευνητικών ασχολιών, έχει δημοσιεύσει ίσως λίγο απρόσμενα εργασίες σχετικά με την αποκωδικοποίηση της φωνητικής επικοινωνίας πουλιών, γατών και πολύ πρόσφατα και κτηνοτροφικών ζώων!
ΑΙ και… Animal Farm
Θέλει λίγη τρέλα για να ασχοληθείς ως μηχανικός πέρα από τα αποστειρωμένα data που φθάνουν στην οθόνη του υπολογιστή σου, για να αποκρυπτογραφήσεις τα γαβγίσματα κάποιων σκύλων, να βρεις πού είναι καλύτερα να τοποθετηθεί στο σώμα κάποιας γάτας ποιο μικρόφωνο, για να πιάσει καλά τα… φωνητικά της. Ή το πώς θα καταγραφούν με τον αποτελεσματικότερο τρόπο (στον χώρο) οι απαραίτητοι μόνον ήχοι σε τέσσερις διαφορετικές πολύβουες εγκαταστάσεις εκτροφής αιγών στη Βόρεια Ιταλία.
Και από εκεί και πέρα να επεξεργαστείς τα δεδομένα αυτά με πρωτοποριακό τρόπο. Διότι όπως τονίζει ο συνομιλητής μας: «Αυτή τη στιγμή, το μεγαλύτερο μέρος της βιβλιογραφίας στον χώρο της υπολογιστικής βιοακουστικής επικεντρώνεται στο πώς να αντιμετωπίσει πολύ συγκεκριμένα και καλά οριοθετημένα προβλήματα. Για παράδειγμα, έχοντας διαθέσιμη μια βάση δεδομένων με είδη πουλιών, που έχουν επαληθευτεί από ζωολόγους, εκπαιδεύεται ένα μοντέλο ώστε να μάθει να τα ξεχωρίζει – και πολύ συχνά το κάνει πολύ καλά, ίσως και καλύτερα από πολλούς ανθρώπους.
Αυτό αποτελεί ένα χρήσιμο εργαλείο ιδίως για νέους ζωολόγους και μπορεί να βοηθήσει στην αποτελεσματικότερη εκπαίδευσή τους. Ομως προς το παρόν, τέτοια εργαλεία πολλές φορές δεν φτάνουν την αρχική τους επίδοση σε πραγματικές συνθήκες λόγω απρόβλεπτων συνθηκών θορύβου, καιρού κ.τ.λ. Επίσης, δεν προσφέρουν νέα γνώση για ένα δεδομένο πρόβλημα – απλά αντιστοιχούν ήχους σε κατηγορίες οι οποίες είναι a priori καθορισμένες από ειδικούς στον χώρο».
Οι μέθοδοι και η νέα γνώση
Οι μέθοδοι όμως που χρησιμοποιούν στο Πανεπιστήμιο του Μιλάνου όπως μας είπε προσφέρουν αυτή τη νέα γνώση και τα βασικά συμπεράσματα από την έως τώρα έρευνά του για τα παραπάνω είναι:
- Τεχνολογίες ΑΙ που μπορούν να αντιμετωπίσουν αποτελεσματικά πολλές εφαρμογές βιοακουστικής ξεκινώντας από την αυτόματη ανάλυση ηχογραφήσεων και την κατηγοριοποίηση των ειδών ενός βιοτόπου, μέχρι τον εντοπισμό νέων ειδών ή ακόμα και την παρακολούθηση ειδών προς εξαφάνιση.
- Τα τελευταία χρόνια, αυτές οι τεχνολογίες εφαρμόζονται στον χώρο του Precision Livestock Farming (Κτηνοτροφία Ακριβείας) με σκοπό την παρακολούθηση και διαχείριση κτηνοτροφικών ζώων, βελτιώνοντας την υγεία, την ευημερία, την παραγωγή και την αναπαραγωγή τους. Και ελαχιστοποιώντας παράλληλα τις περιβαλλοντικές επιπτώσεις της κτηνοτροφίας.
Τα επόμενα χρόνια, και με τη διαθεσιμότητα περισσότερων δεδομένων, αναμένεται να αναπτυχθούν τεχνολογίες που εμβαθύνουν στην κατανόηση των προβλημάτων στον χώρο της βιοακουστικής και για παράδειγμα να εντοπίζουν αυτόματα το περιεχόμενο στο φασματογράφημα που συνδέεται με κάθε κατηγορία. Μια εργασία του συνομιλητή μας προς αυτή την κατεύθυνση δημοσιεύθηκε τον προηγούμενο μήνα στο Nature Scientific Reports.
Κατά την άποψή του όμως «πρέπει να επισημανθεί και ότι η καλή διαβίωση των ζώων μπορεί να τεθεί σε κίνδυνο όταν οι αγρότες εξαρτώνται υπερβολικά από τέτοιες τεχνολογίες (βάζοντας την κτηνοτροφία σε κάτι σαν “αυτόματο πιλότο”). Διότι ως εκ τούτου, τείνουν να χάνουν τις γνώσεις τους σχετικά με τις ανάγκες των ζώων και να αφιερώνουν λιγότερο χρόνο στα ζώα, με αρνητικές συνέπειες στην ποιότητα της σχέσης ανθρώπου – ζώου. Για αυτόν τον λόγο, η έρευνά μας έχει ως στόχο να βοηθήσει και τους αγρότες να καταλάβουν καλύτερα τι σημαίνουν οι ήχοι των ζώων τους σε διαφορετικές καταστάσεις ώστε να μπορούν να τα διαχειρίζονται καλύτερα».
Οι τεχνικές της «μεταγλώττισης»
«Τα Συνελικτικά Νευρωνικά Δίκτυα (Neuronic Networks, CNN) μπορούν να χρησιμοποιηθούν για να αναγνωρίζουν ήχους ως εξής: αρχικά, ο ήχος μετατρέπεται σε μια εικόνα που δείχνει πώς αλλάζουν οι συχνότητες με τον χρόνο, συνήθως σε μορφή φασματογραφήματος Mel. Επειτα, το CNN επεξεργάζεται αυτή την εικόνα με φίλτρα για να βρει μοτίβα (patterns) στον χρόνο και στη συχνότητα.
Μέσα από διαδοχικά στρώματα, εντοπίζει πιο σύνθετα χαρακτηριστικά και στο τέλος χρησιμοποιεί αυτά τα δεδομένα για να αποφασίσει σε ποια κατηγορία ανήκει ο ήχος. Με βάση τα δεδομένα του προγράμματος VOCAPRA φτιάξαμε ένα CNN ειδικά σχεδιασμένο για να ξεχωρίζει βελάσματα αιγών σε διαφορετικές καταστάσεις. Για να βελτιώσουμε τα δεδομένα που είχαμε, χρησιμοποιήσαμε τεχνικές όπως αλλαγή τόνου (pitch) και επέκταση στον χρόνο (stretching) ώστε το μοντέλο να γίνει πιο ανθεκτικό στην αναγνώριση» εξήγησε ο κ. Νταλαμπίρας και προσέθεσε: «Επίσης μελετήσαμε σε βάθος πώς “σκέφτεται” το CNN.
Συγκεκριμένα, κάναμε ανάλυση για να βρούμε ποια μέρη του ήχου (στον χρόνο και στη συχνότητα) επηρεάζουν περισσότερο την ταξινόμηση. Με τη βοήθεια εργαλείων Explainable AI (XAI), μπορέσαμε να εξηγήσουμε πώς παίρνει αποφάσεις το μοντέλο και να εντοπίσουμε τα βασικά ακουστικά χαρακτηριστικά που ξεχωρίζουν τις κατηγορίες. Τα αποτελέσματά μας δείχνουν ότι οι τεχνικές ενίσχυσης δεδομένων βελτιώνουν σημαντικά την ακρίβεια και ότι η XAI είναι απαραίτητη για να κατανοούμε και να ερμηνεύουμε πολύπλοκα μοντέλα μηχανικής μάθησης που εφαρμόζονται σε ήχους ζώων».
Πηγή: https://www.tovima.gr
Δεν υπάρχουν σχόλια:
Δημοσίευση σχολίου
Σημείωση: Μόνο ένα μέλος αυτού του ιστολογίου μπορεί να αναρτήσει σχόλιο.