Σάββατο 15 Νοεμβρίου 2008

Ανακαλύφθηκε το «αποτύπωμα» της φωνής


Νέο λογισμικό αναγνώρισης διαβάζει το «νευρωνικό ίχνος».


Επιστήμονες από το ολλανδικό πανεπιστήμιο του Μάαστριχτ, υπό τον Ελία Φορμιζάνο, ανέπτυξαν μια νέα μέθοδο και ένα νέο λογισμικό για να μελετούν τον εγκέφαλο ενός ανθρώπου και να «διαβάζουν» ποιός του μίλησε και τι του είπε.

Μέχρι τώρα οι επιστήμονες είχαν απλώς πετύχει, με βάση το «αποτύπωμα» στην εγκεφαλική δραστηριότητα, να ξεχωρίζουν απλώς διαφορετικές κατηγορίες ήχων (π.χ. τις φωνές των ανθρώπων από αυτές των ζώων).

Με τη βοήθεια της τεχνικής της νευροαπεικόνισης (συγκεκριμένα του λειτουργικού μαγνητικού συντονισμού fMRI), οι ερευνητές «χαρτογράφησαν» την εγκεφαλική δραστηριότητα που σχετίζεται με την αναγνώριση τόσο των φωνών, όσο και των ήχων του λόγου.

Όπως αναφέρεται σε σχετική εργασία στο περιοδικό «Science» με τον χαρακτηριστικό τίτλο «Ποιός λέει τι; Η εγκεφαλική αποκρυπτογράφηση της ανθρώπινης φωνής και του λόγου», οι ήχοι του λόγου και οι φωνές μπορούν να ταυτοποιηθούν, επειδή αφήνουν ένα μοναδικό «νευρωνικό αποτύπωμα» στον εγκέφαλο του ακροατή, κυρίως στον ακουστικό φλοιό.

Στο μέλλον, όπως αναφέρουν οι ερευνητές, η νέα αυτή τεχνική, αφού τελειοποιηθεί, θα μπορεί να χρησιμοποιηθεί, μεταξύ άλλων, για να βελτιώσει την αυτόματη αναγνώριση φωνής στους ηλεκτρονικούς υπολογιστές.

Οι ερευνητές ανέπτυξαν ένα αλγόριθμο που «μεταφράζει» την εγκεφαλική δραστηριότητα που καταγράφεται στον ακροατή, σε ξεχωριστά μοτίβα που προσδιορίζουν την ταυτότητα κάθε διαφορετικού ήχου του λόγου (συμφώνων, φωνηέντων κλπ) και κάθε διαφορετικής φωνής. Τα διαφορετικά ακουστικά χαρακτηριστικά των δονήσεων των φωνητικών χορδών (ανάλογα με το περιεχόμενο της φωνής του ομιλητή) αντιστοιχήθηκαν με συγκεκριμένα μοτίβα δραστηριοποίησης των νευρώνων του ακροατή.

Η ομοιότητα είναι σαφής με τα δακτυλικά αποτυπώματα. Τα «νευρωνικά ίχνη» ενός ήχου του λόγου (π.χ. του φωνήεντος «α» ) είναι μοναδικά και δεν αλλάζουν αν κάποιος άλλος το προφέρει. Από την άλλη, το «αποτύπωμα» στον εγκέφαλο του ακροατή από τη φωνή ενός συγκεκριμένου ομιλητή είναι πάντα το ίδιο, ακόμα και αν αυτός λέει διαφορετικά πράγματα.

Η μελέτη αποκάλυψε ότι όλη αυτή η πολύπλοκη διαδικασία εγκεφαλικής κωδικοποίησης των ήχων είναι εξαπλωμένη σε μια ευρύτερη και λιγότερη ιεραρχική περιοχή του εγκεφάλου, από ό,τι πίστευαν μέχρι σήμερα οι νευροεπιστήμονες.

Η ερευνητική ομάδα του Φορμιζάνο, όπως δήλωσε στο «New Scientist», φιλοδοξεί τώρα, χρησιμοποιώντας επίσης την τεχνική του λειτουργικού μαγνητικού συντονισμού, να κάνει στο μέλλον κάτι ανάλογο με την όραση και να προσδιορίσει τι βλέπει ένας άνθρωπος, ανιχνεύοντας μόνο τα μοτίβα των νευρώνων που ενεργοποιούνται στον εγκέφαλό του.

Δεν υπάρχουν σχόλια:

Δημοσίευση σχολίου