Σκούρα φαίνεται να τα βρίσκουν τα μοντέλα τεχνητής νοημοσύνης της Meta τα οποία «εκπαιδεύονται» με τη Βίβλο ώστε να αναγνωρίζουν και να παράγουν ομιλία για περισσότερες από 1.000 γλώσσες.
Η εταιρεία κυκλοφορεί τα νέα της μοντέλα γλώσσας μέσω της υπηρεσίας GitHub, έτσι ώστε οι προγραμματιστές που εργάζονται σε διαφορετικές γλώσσες να μπορούν να δημιουργήσουν νέες, πιο ποικίλες εφαρμογές ομιλίας.
Τεχνητή Νοημοσύνη: Κινέζος νομπελίστας έγραψε την ομιλία του με τη βοήθεια του ChatGPT
Τα νέα μοντέλα εκπαιδεύτηκαν σε δύο σύνολα δεδομένων: ένα που περιέχει ηχογραφήσεις της Καινής Διαθήκης σε 1.107 γλώσσες και ένα άλλο που περιέχει ηχογραφήσεις -χωρίς κατηγοριοποίηση- της Καινής Διαθήκης σε 3.809 γλώσσες.
Στην συνέχεια, η ομάδα επεξεργάστηκε τον ήχο ομιλίας και τα δεδομένα κειμένου για να βελτιώσει την ποιότητά του προτού εκτελέσει έναν αλγόριθμο σχεδιασμένο να ευθυγραμμίζει τις ηχογραφήσεις με το συνοδευτικό κείμενο. Η διαδικασία επανελήφθη με έναν δεύτερο αλγόριθμο εκπαιδευμένο στα πρόσφατα ευθυγραμμισμένα δεδομένα. Με αυτή τη μέθοδο, οι ερευνητές μπόρεσαν να διδάξουν τον αλγόριθμο να μαθαίνει μια νέα γλώσσα πιο εύκολα, ακόμη και χωρίς το συνοδευτικό κείμενο.
Η εταιρεία ελπίζει τώρα ότι αυτοί οι αλγόριθμοι θα βοηθήσουν στη διατήρηση γλωσσών που κινδυνεύουν να εξαφανιστούν.
7.000 γλώσσες περιμένουν
Οι ερευνητές ισχυρίζονται τώρα ότι τα μοντέλα τους μπορούν να συνομιλούν σε περισσότερες από 1.000 γλώσσες, αλλά αναγνωρίζουν περισσότερες από 4.000.
Ωστόσο, υπάρχουν 7.000 γλώσσες παγκοσμίως τις οποίες δεν «καλύπτει» όλρε το εργαλείο της Meta. Αυτό συμβαίνει επειδή αυτού του είδους τα μοντέλα τείνουν να απαιτούν τεράστιες ποσότητες δεδομένων εκπαίδευσης με κατηγοριοποίηση, τα οποία είναι διαθέσιμα μόνο για έναν μικρό αριθμό γλωσσών, συμπεριλαμβανομένων των Αγγλικών, Ισπανικών και Κινέζων.
«Μπορούμε να χρησιμοποιήσουμε αυτό που έμαθε αυτό το μοντέλο για να κατασκευάσουμε γρήγορα συστήματα ομιλίας με πολύ, πολύ λίγα δεδομένα», δήλωσε ο Michael Auli, ερευνητής στη Meta που εργάστηκε στο έργο. «Για τα αγγλικά, έχουμε πολλά καλά σύνολα δεδομένων και τα έχουμε για μερικές ακόμη γλώσσες, αλλά απλώς δεν τα έχουμε για γλώσσες που ομιλούνται, ας πούμε, από 1.000 άτομα».
Επιπλέον, σε σύγκριση με μοντέλα από άλλες εταιρείες, συμπεριλαμβανομένου του OpenAI Whisper, η έκδοση του Meta είχε το μισό ποσοστό σφαλμάτων, παρόλο που κάλυπτε 11 φορές περισσότερες γλώσσες.
Το πρόβλημα με τη Βίβλο
Ωστόσο, η ομάδα προειδοποιεί ότι το μοντέλο εξακολουθεί να κινδυνεύει να μεταγράψει λάθος ορισμένες λέξεις ή φράσεις, κάτι που θα μπορούσε να οδηγήσει σε ανακριβείς ή δυνητικά προσβλητικές ετικέτες.
Αναγνωρίζουν επίσης ότι τα μοντέλα αναγνώρισης ομιλίας τους απέδωσαν περισσότερες μεροληπτικές λέξεις από άλλα μοντέλα, αν και μόνο 0,7% περισσότερες.
Αν και το εύρος της έρευνας είναι εντυπωσιακό, η χρήση θρησκευτικών κειμένων για την εκπαίδευση μοντέλων τεχνητής νοημοσύνης μπορεί να είναι αμφιλεγόμενη, λέει ο Chris Emezue, ερευνητής στο Masakhane, έναν οργανισμό που εργάζεται στην επεξεργασία φυσικής γλώσσας για αφρικανικές γλώσσες, ο οποίος δεν συμμετείχε στο πρότζεκτ της Meta. «Η Βίβλος έχει πολλές μεροληψίες και παραποιήσεις», λέει.
Με πληροφορίες από MIT Technology Review
Πηγή: in.gr
Latest News
Η Baidu έκανε την έκπληξη - Πτώση εσόδων αλλά μικρότερη από το αναμενόμενο
Η Baidu κατέγραψε αύξηση 12% των εσόδων της από μη διαδικτυακό μάρκετινγκ στα 1,1 δισεκατομμύρια δολάρια
Η αδηφάγα Τεχνητή Νοημοσύνη αλλάζει τον τεχνολογικό χάρτη της Ευρώπης - Που πάνε τα νέα data centers
Η πεινασμένη για ενέργεια τεχνητή νοημοσύνη καταπονεί τα δίκτυα ηλεκτρικής ενέργειας της Ιρλανδίας, θέτοντας σε κίνδυνο τη θέση της χώρας ως τεχνολογικού κόμβου της Ευρώπης
Σήμα κινδύνου από τις ευρωπαϊκές εταιρείες τεχνολογίας - Τι ζητούν από τις Βρυξέλλες μετά την εκλογή Τραμπ
Παραφράζοντας το αγαπημένο μάντρα του Nτόναλντ Τραμπ οι εταιρείες τεχνολογίας της ΕΕ ζητούν να υιοθετήσει το «πρώτα η Ευρώπη»
Κυριάκος Μητσοτάκης για AI: Τεράστια ευκαιρία για τη χώρα η Τεχνητή Νοημοσύνη
Ο πρωθυπουργός Κυριάκος Μητσοτάκης συζήτησε με το μέλος της Συμβουλευτικής Επιτροπής για την Τεχνητή Νοημοσύνη και αντιπρόεδρο του Endeavor Greece Ανδρέα Σταυρόπουλο στο πλαίσιο του GenAI Summit
Η κυριαρχία επί της ΑΙ είναι ο δρόμος για απεξάρτηση της ΕΕ από τις ΗΠΑ
Για τις υπηρεσίες που προφέρει η τεχνητή νοημοσύνη σήμερα χρησιμοποιούνται κέντρα δεδομένων που εδρεύουν στις ΗΠΑ
Μπορεί η τεχνητή νοημοσύνη να αντικαταστήσει τον άνθρωπο στις μεταφράσεις;
CEO Startup λέει ότι δεν θα χρειάζονται άνθρωποι για μετάφραση σε 3 χρόνια, καθώς κυκλοφορεί νέα εφαρμογή με τεχνητή νοημοσύνη
Σκληρή μάχη στην «αρένα» της ΑΙ - Κούρσα για τα καλύτερα... μικροτσίπ
Κορυφώνεται ο ανταγωνισμός στην κούρσα για την επικράτηση στην Τεχνητή Νοημοσύνη - Το μεγάλο στοίχημα και οι προκλήσεις
Ποιες είναι οι τάσεις στις σχέσεις καταναλωτών-Τεχνητής Νοημοσύνης
Σύμφωνα με την έρευνα της Salesforce, η εμπιστοσύνη των καταναλωτών απέναντι στις επιχειρήσεις είναι στα χαμηλότερα επίπεδα των τελευταίων ετών
Οι επιχειρήσεις φοβούνται τις κυβερνοεπιθέσεις που βασίζονται στην AI
Μελέτη επισημαίνει ότι η Τεχνητή Νοημοσύνη ενισχύει πλέον και τη δράση των κυβερνοεγκληματιών προσθέτοντας ένα επιπλέον επίπεδο απειλών στην κυβερνοασφάλεια
Η Salesforce ανακοίνωσε την παγκόσμια διαθεσιμότητα του Agentforce
Το εργαλείο Agentforce της Salesforce δημιουργεί αξιόπιστους, αυτοματοποιημένους βοηθούς Τεχνητής Νοημοσύνης που ενισχύουν το ανθρώπινο δυναμικό των επιχειρήσεων