fbpx

Ένα Μηχάνημα που Διαβάζει τα Χείλη Αλλάζει την Επικοινωνία Όσων Έχουν Προβλήματα Ακοής

Ο τομέας της τεχνητής νοημοσύνης γνωρίζει τεράστια πρόοδο.

Αυτή τη φορά, η τεχνητή νοημοσύνη έρχεται να βοηθήσει όσους έχουν προβλήματα ακοής.

Επιστήμονες από το Πανεπιστήμιο της Οξφόρδης στη Μ. Βρετανία σε συνεργασία με την Google Deepmind στις ΗΠΑ κατάφεραν να αναπτύξουν μια εφαρμογή που μπορεί να διαβάσει τα χείλη και να μετατρέψει σε φράσεις τη σιωπηλή κίνηση των χειλιών. 

Ένα μηχάνημα που διαβάζει τα χείλη αλλάζει την επικοινωνία όσων έχουν προβλήματα ακοής

Το πρόγραμμα αυτό ονομάζεται LipNet και δημιουργήθηκε στηριζόμενο στην αρχή της «μηχανικής μάθησης» (N.D.L.R: αυτοματοποιημένη μάθηση). 

Στην πράξη, οι ερευνητές τροφοδότησαν το μηχάνημα με 5000 ώρες τηλεοπτικών προγραμμάτων του BBC (ειδήσεις, ενημερωτικές εκπομπές, ντοκιμαντέρ). Το «δείγμα» που «είδε» ο υπολογιστής περιλάμβανε 118.000 φράσεις και 17.500 μοναδικές λέξεις.

Το αποτέλεσμα; Το LipNet κατάφερε να «διαβάσει» άψογα το 46,8 των φράσεων ενός συγκεκριμένου βίντεο που δημιουργήθηκε για το σκοπό αυτό.  

Το σκορ είναι πραγματικά εντυπωσιακό, ειδικότερα όταν γνωρίζει κανείς ότι οι επαγγελματίες που κλήθηκαν να σχολιάσουν το ίδιο βίντεο και να «διαβάσουν» τα χείλη των ατόμων που εμφανίζονται στην οθόνη, έφτασαν σε ποσοστό επιτυχίας 12,4%. 

Η μηχανή είναι πιο αποτελεσματική από έναν άνθρωπο; Δεν είναι η πρώτη φορά που συμβαίνει κάτι παρόμοιο! 

Στη συγκεκριμένη περίπτωση το αξιοσημείωτο είναι η ικανότητα του LipNet να αποκωδικοποιήσει όχι μόνο λέξεις αλλά ολόκληρες φράσεις.

Επιπρόσθετα το πρόγραμμα φαίνεται ικανό να χειριστεί την πιο μεγάλη δυσκολία στο θέμα της ανάγνωσης των χειλιών που είναι οι ομόηχες λέξεις (όπως για παράδειγμα, ιός-υιός, κλείνω-κλίνω, όμως-ώμος, κ.ά).  

Οι λέξεις που έχουν την ίδια προφορά αλλά διαφορετική σημασία, είναι εξαιρετικά δύσκολο να ανιχνευτούν, καθώς η κίνηση των χειλιών όταν λένε τις λέξεις αυτές είναι ακριβώς η ίδια..

Με τις εντυπωσιακές επιδόσεις της όμως η τεχνολογία ανοίγει τον δρόμο σε πολλές εφαρμογές.

Ιδιαίτερα για όσους έχουν προβλήματα ακοής το πρόγραμμα αυτό θα μπορεί να βάζει απευθείας υπότιτλους σε ταινίες και άλλα τηλεοπτικά προγράμματα ή ακόμη και να χρησιμοποιηθεί στα συστήματα με φωνητική εντολή. 

Ένα μηχάνημα που διαβάζει τα χείλη αλλάζει την επικοινωνία όσων έχουν προβλήματα ακοής

Η τεχνητή νοημοσύνη, προϊόν της ευφυΐας του ανθρώπου,  μπορεί να μας αφήσει άφωνους με τις δυνατότητές της.

Θα έχουμε πολλά ακόμη να δούμε στο μέλλον που έρχεται.

Πηγή: Le Quotidien du Pharmacien 

Κοινοποιήστε το Άρθρο:


e-learning-pharmamanage.gr

Κατεβάστε δωρεάν την εφαρμογή "Charami SA" στο κινητό σας και πάντοτε θα έχετε άμεση και επίκαιρη ενημέρωση για όλα τα θέματα του κλάδου της υγείας, της ομορφιάς και της ευεξίας. Επιλέξτε το αντίστοιχο με τα ενδιαφέροντά σας "κουμπί" και περιηγηθείτε στο περιεχόμενό του!


Σεβόμαστε την Ιδιωτικότητά σας

Εμείς και οι συνεργάτες μας αποθηκεύουμε ή/και έχουμε πρόσβαση σε πληροφορίες σε μια συσκευή, όπως cookies και επεξεργαζόμαστε προσωπικά δεδομένα, όπως μοναδικά αναγνωριστικά και τυπικές πληροφορίες, που αποστέλλονται από μια συσκευή για εξατομικευμένες διαφημίσεις και περιεχόμενο, μέτρηση διαφημίσεων και περιεχομένου, καθώς και απόψεις του κοινού για την ανάπτυξη και βελτίωση προϊόντων.

Με την άδειά σας, εμείς και οι συνεργάτες μας ενδέχεται να χρησιμοποιήσουμε ακριβή δεδομένα γεωγραφικής τοποθεσίας και ταυτοποίησης μέσω σάρωσης συσκευών. Μπορείτε να κάνετε κλικ για να συναινέσετε στην επεξεργασία από εμάς και τους συνεργάτες μας όπως περιγράφεται παραπάνω. Λάβετε υπόψη ότι κάποια επεξεργασία των προσωπικών σας δεδομένων ενδέχεται να μην απαιτεί τη συγκατάθεσή σας, αλλά έχετε το δικαίωμα να αρνηθείτε αυτήν την επεξεργασία. Οι προτιμήσεις σας θα ισχύουν μόνο για αυτόν τον ιστότοπο. Μπορείτε πάντα να αλλάξετε τις προτιμήσεις σας επιστρέφοντας σε αυτόν τον ιστότοπο ή επισκεπτόμενοι τους όρους Προστασίας Προσωπικών Δεδομένων