Ένα Μηχάνημα που Διαβάζει τα Χείλη Αλλάζει την Επικοινωνία Όσων Έχουν Προβλήματα Ακοής

Ο τομέας της τεχνητής νοημοσύνης γνωρίζει τεράστια πρόοδο.

Αυτή τη φορά, η τεχνητή νοημοσύνη έρχεται να βοηθήσει όσους έχουν προβλήματα ακοής.

Επιστήμονες από το Πανεπιστήμιο της Οξφόρδης στη Μ. Βρετανία σε συνεργασία με την Google Deepmind στις ΗΠΑ κατάφεραν να αναπτύξουν μια εφαρμογή που μπορεί να διαβάσει τα χείλη και να μετατρέψει σε φράσεις τη σιωπηλή κίνηση των χειλιών. 

Ένα μηχάνημα που διαβάζει τα χείλη αλλάζει την επικοινωνία όσων έχουν προβλήματα ακοής

Το πρόγραμμα αυτό ονομάζεται LipNet και δημιουργήθηκε στηριζόμενο στην αρχή της «μηχανικής μάθησης» (N.D.L.R: αυτοματοποιημένη μάθηση). 

Στην πράξη, οι ερευνητές τροφοδότησαν το μηχάνημα με 5000 ώρες τηλεοπτικών προγραμμάτων του BBC (ειδήσεις, ενημερωτικές εκπομπές, ντοκιμαντέρ). Το «δείγμα» που «είδε» ο υπολογιστής περιλάμβανε 118.000 φράσεις και 17.500 μοναδικές λέξεις.

Το αποτέλεσμα; Το LipNet κατάφερε να «διαβάσει» άψογα το 46,8 των φράσεων ενός συγκεκριμένου βίντεο που δημιουργήθηκε για το σκοπό αυτό.  

Το σκορ είναι πραγματικά εντυπωσιακό, ειδικότερα όταν γνωρίζει κανείς ότι οι επαγγελματίες που κλήθηκαν να σχολιάσουν το ίδιο βίντεο και να «διαβάσουν» τα χείλη των ατόμων που εμφανίζονται στην οθόνη, έφτασαν σε ποσοστό επιτυχίας 12,4%. 

Η μηχανή είναι πιο αποτελεσματική από έναν άνθρωπο; Δεν είναι η πρώτη φορά που συμβαίνει κάτι παρόμοιο! 

Στη συγκεκριμένη περίπτωση το αξιοσημείωτο είναι η ικανότητα του LipNet να αποκωδικοποιήσει όχι μόνο λέξεις αλλά ολόκληρες φράσεις.

Επιπρόσθετα το πρόγραμμα φαίνεται ικανό να χειριστεί την πιο μεγάλη δυσκολία στο θέμα της ανάγνωσης των χειλιών που είναι οι ομόηχες λέξεις (όπως για παράδειγμα, ιός-υιός, κλείνω-κλίνω, όμως-ώμος, κ.ά).  

Οι λέξεις που έχουν την ίδια προφορά αλλά διαφορετική σημασία, είναι εξαιρετικά δύσκολο να ανιχνευτούν, καθώς η κίνηση των χειλιών όταν λένε τις λέξεις αυτές είναι ακριβώς η ίδια..

Με τις εντυπωσιακές επιδόσεις της όμως η τεχνολογία ανοίγει τον δρόμο σε πολλές εφαρμογές.

Ιδιαίτερα για όσους έχουν προβλήματα ακοής το πρόγραμμα αυτό θα μπορεί να βάζει απευθείας υπότιτλους σε ταινίες και άλλα τηλεοπτικά προγράμματα ή ακόμη και να χρησιμοποιηθεί στα συστήματα με φωνητική εντολή. 

Ένα μηχάνημα που διαβάζει τα χείλη αλλάζει την επικοινωνία όσων έχουν προβλήματα ακοής

Η τεχνητή νοημοσύνη, προϊόν της ευφυΐας του ανθρώπου,  μπορεί να μας αφήσει άφωνους με τις δυνατότητές της.

Θα έχουμε πολλά ακόμη να δούμε στο μέλλον που έρχεται.

Πηγή: Le Quotidien du Pharmacien 

Κατεβάστε τώρα το Application!

Με την περιήγησή σας στο pharmamanage.gr αποδέχεστε την χρήση cookies.