Τεχνητή Νοημοσύνη: Με ποιο βιβλίο τα βρίσκει σκούρα;

Οι ερευνητές ισχυρίζονται ότι τα εργαλεία τους μπορούν να συνομιλούν σε περισσότερες από 1.000 γλώσσες

OT.gr Newsroom

25.05.2023 | 20:29

Σκούρα φαίνεται να τα βρίσκουν τα μοντέλα τεχνητής νοημοσύνης της Meta τα οποία «εκπαιδεύονται» με τη Βίβλο ώστε να αναγνωρίζουν και να παράγουν ομιλία για περισσότερες από 1.000 γλώσσες.

Η εταιρεία κυκλοφορεί τα νέα της μοντέλα γλώσσας μέσω της υπηρεσίας GitHub, έτσι ώστε οι προγραμματιστές που εργάζονται σε διαφορετικές γλώσσες να μπορούν να δημιουργήσουν νέες, πιο ποικίλες εφαρμογές ομιλίας.

Τεχνητή Νοημοσύνη: Κινέζος νομπελίστας έγραψε την ομιλία του με τη βοήθεια του ChatGPT

Τα νέα μοντέλα εκπαιδεύτηκαν σε δύο σύνολα δεδομένων: ένα που περιέχει ηχογραφήσεις της Καινής Διαθήκης σε 1.107 γλώσσες και ένα άλλο που περιέχει ηχογραφήσεις -χωρίς κατηγοριοποίηση- της Καινής Διαθήκης σε 3.809 γλώσσες.

Στην συνέχεια, η ομάδα επεξεργάστηκε τον ήχο ομιλίας και τα δεδομένα κειμένου για να βελτιώσει την ποιότητά του προτού εκτελέσει έναν αλγόριθμο σχεδιασμένο να ευθυγραμμίζει τις ηχογραφήσεις με το συνοδευτικό κείμενο. Η διαδικασία επανελήφθη με έναν δεύτερο αλγόριθμο εκπαιδευμένο στα πρόσφατα ευθυγραμμισμένα δεδομένα. Με αυτή τη μέθοδο, οι ερευνητές μπόρεσαν να διδάξουν τον αλγόριθμο να μαθαίνει μια νέα γλώσσα πιο εύκολα, ακόμη και χωρίς το συνοδευτικό κείμενο.

Η εταιρεία ελπίζει τώρα ότι αυτοί οι αλγόριθμοι θα βοηθήσουν στη διατήρηση γλωσσών που κινδυνεύουν να εξαφανιστούν.

7.000 γλώσσες περιμένουν

Οι ερευνητές ισχυρίζονται τώρα ότι τα μοντέλα τους μπορούν να συνομιλούν σε περισσότερες από 1.000 γλώσσες, αλλά αναγνωρίζουν περισσότερες από 4.000.

Ωστόσο, υπάρχουν 7.000 γλώσσες παγκοσμίως τις οποίες δεν «καλύπτει» όλρε το εργαλείο της Meta. Αυτό συμβαίνει επειδή αυτού του είδους τα μοντέλα τείνουν να απαιτούν τεράστιες ποσότητες δεδομένων εκπαίδευσης με κατηγοριοποίηση, τα οποία είναι διαθέσιμα μόνο για έναν μικρό αριθμό γλωσσών, συμπεριλαμβανομένων των Αγγλικών, Ισπανικών και Κινέζων.

«Μπορούμε να χρησιμοποιήσουμε αυτό που έμαθε αυτό το μοντέλο για να κατασκευάσουμε γρήγορα συστήματα ομιλίας με πολύ, πολύ λίγα δεδομένα», δήλωσε ο Michael Auli, ερευνητής στη Meta που εργάστηκε στο έργο. «Για τα αγγλικά, έχουμε πολλά καλά σύνολα δεδομένων και τα έχουμε για μερικές ακόμη γλώσσες, αλλά απλώς δεν τα έχουμε για γλώσσες που ομιλούνται, ας πούμε, από 1.000 άτομα».

Επιπλέον, σε σύγκριση με μοντέλα από άλλες εταιρείες, συμπεριλαμβανομένου του OpenAI Whisper, η έκδοση του Meta είχε το μισό ποσοστό σφαλμάτων, παρόλο που κάλυπτε 11 φορές περισσότερες γλώσσες.

Το πρόβλημα με τη Βίβλο

Ωστόσο, η ομάδα προειδοποιεί ότι το μοντέλο εξακολουθεί να κινδυνεύει να μεταγράψει λάθος ορισμένες λέξεις ή φράσεις, κάτι που θα μπορούσε να οδηγήσει σε ανακριβείς ή δυνητικά προσβλητικές ετικέτες.

Αναγνωρίζουν επίσης ότι τα μοντέλα αναγνώρισης ομιλίας τους απέδωσαν περισσότερες μεροληπτικές λέξεις από άλλα μοντέλα, αν και μόνο 0,7% περισσότερες.

Αν και το εύρος της έρευνας είναι εντυπωσιακό, η χρήση θρησκευτικών κειμένων για την εκπαίδευση μοντέλων τεχνητής νοημοσύνης μπορεί να είναι αμφιλεγόμενη, λέει ο Chris Emezue, ερευνητής στο Masakhane, έναν οργανισμό που εργάζεται στην επεξεργασία φυσικής γλώσσας για αφρικανικές γλώσσες, ο οποίος δεν συμμετείχε στο πρότζεκτ της Meta. «Η Βίβλος έχει πολλές μεροληψίες και παραποιήσεις», λέει.

Με πληροφορίες από MIT Technology Review

Πηγή: in.gr

Ακολουθήστε τον

στο Google News και μάθετε πρώτοι όλες τις ειδήσεις

Δείτε όλες τις τελευταίες Ειδήσεις από την Ελλάδα και τον Κόσμο, στον

in.grΒίβλοςτεχνητή νοημοσύνη

Latest News

15.04.2025 | 13:17 Hermès: Γύρισε ο τροχός – Άφησε πίσω της τον κολοσσό LVMH 15.04.2025 | 13:01 Κίνα: Μποϊκοτάζ στην Boeing – Σταματά να παραλαμβάνει αεροσκάφη 15.04.2025 | 12:50 DBRS: Το μικρό, για την ώρα, «χτύπημα» του εμπορικού πολέμου στις ευρωπαϊκές τράπεζες 15.04.2025 | 12:39 Metlen: Ενισχύει την παρουσία της στην Ιταλία – Σε λειτουργία 2 νέα φωτοβολταϊκά 15.04.2025 | 12:26 MORE – ΔΕΗ Ανανεώσιμες: Οριστική προσφορά σύνδεσης με το δίκτυο για οκτώ φωτοβολταϊκούς σταθμούς, συνολικής ισχύος 882,4 MW στη Μακεδονία 15.04.2025 | 12:15 Beyond 2025: Ξεπέρασαν τις 15.000 οι επισκέπτες

15.04.2025 | 12:09 Διονύσης Σταμενίτης: Ενίσχυση της συνεργασίας Ελλάδας – Βιετνάμ στις εξαγωγές αγροτικών προϊόντων 15.04.2025 | 12:00 Nike: Κι όμως είναι η επίσημη αγαπημένη – Οι έφηβοι αγοράζουν ακόμη τα προϊόντα της 15.04.2025 | 11:50 H Interamerican παρούσα στις εξελίξεις που διαμορφώνουν το μέλλον 15.04.2025 | 11:23 Jumbo: Αύξηση 8% στις πωλήσεις του ομίλου – Ο αστερίσκος του Μαρτίου και το πρόσημο του Απριλίου 15.04.2025 | 11:17 Χρηματιστήριο Αθηνών: Άνοδος με χαμηλό τζίρο – Προσεκτικοί οι αγοραστές 15.04.2025 | 11:12 Διαμάντια: Η βιομηχανία βρίσκεται σε κρίση από τους δασμούς Τραμπ

Διαβάστε περισσότερα

Ξεκαθάρισε το ταμπλό του ΧΑ, ο προσγειωμένος Εξάρχου, πατάει στην Ουκρανία (;) η ΔΕΗ, στην Ελαφόνησο ο πρίγκιπας Αλβέρτος, συνάντηση κορυφής Ντράγκι – Μυτιληναίου

Πρόσφατα Άρθρα Tεχνητή νοημοσύνη

Beyond 2025: Ξεπέρασαν τις 15.000 οι επισκέπτες

Tεχνητή νοημοσύνη | 15.04.2025 | 12:15

Ξεπέρασαν τις 15.000 οι επισκέπτες στη Beyond 2025

Η BEYOND 2025 συγκέντρωσε περισσότερους από 300 εκθέτες από την Ελλάδα και από 10 χώρες

ΑΙ: Το νέο στοίχημα βρίσκεται στις start-ups που δημιουργούν εργαλεία παραγωγικότητας

Tεχνητή νοημοσύνη | 14.04.2025 | 22:46

Οι start-ups που δημιουργούν εργαλεία παραγωγικότητας είναι το νέο μεγάλο στοίχημα της ΑΙ - Ποιες είναι

Οι επενδυτές ποντάρουν σε AI startups που αναπτύσσουν πρακτικές εφαρμογές της ΑΙ αναζητώντας μεγάλα κέρδη χωρίς τεράστιες δαπάνες

Tεχνητή νοημοσύνη | 13.04.2025 | 23:38

Τα 5 πράγματα που δεν πρέπει να μοιράζεστε ποτέ με την τεχνητή νοημοσύνη

To ChatGPT, όπως και άλλα εργαλεία τεχνητής νοημοσύνης, εξελίσσονται χρησιμοποιούνται από όλο και περισσότερους ανθρώπους για μια ευρεία γκάμα αναζητήσεων

Τεχνητή νοημοσύνη: Ποιες είναι οι 10 χώρες με τα περισσότερα ταλέντα

Tεχνητή νοημοσύνη | 13.04.2025 | 21:47

Ποιες είναι οι 10 χώρες με τα περισσότερα ταλέντα στην AI

Έρευνα της Microsoft, με τη συμμετοχή 31.000 ατόμων σε 31 χώρες, έδειξε ότι το 66% των επιχειρήσεων δεν θα προσλάμβανε κάποιον χωρίς δεξιότητες στην τεχνητή νοημοσύνη

Σαντορίνη: Πώς τεχνητή νοημοσύνη και υψηλή τεχνολογία συμβάλλουν στην κατανόηση της σεισμικής κρίσης

Tεχνητή νοημοσύνη | 13.04.2025 | 19:08

Η συμβολή της ΑΙ στην κατανόηση της σεισμικής κρίσης στη Σαντορίνη

Τα πρώτα αποτελέσματα της χρήση υψηλής τεχνολογίας και τεχνητής νοημοσύνης στην παρακολούθηση της σεισμικής δραστηριότητας στη Σαντορίνη

Tεχνητή νοημοσύνη | 13.04.2025 | 18:33

Alphabet και Nvidia επενδύουν στην εταιρεία του Σάτσκεβερ, συνιδρυτή της OpenAI

Σύμφωνα με το Reuters, Alphabet και Nvidia επενδύουν στην SSI του Ίλια Σάτσκεβερ που είχε αποχωρήσει πέρυσι από την OpenAI δημιουργό του ChatGTP

Tεχνητή νοημοσύνη | 13.04.2025 | 17:18

Πισσαρίδης (LSE): Η μάχη για την AI κερδίζεται με επενδύσεις και αλλαγές

Για την ανάγκη επενδύσεων στην Τεχνητή Νοημοσύνη και τα βήματα που πρέπει να κάνει η Ευρώπη ώστε να μη χάσει ακόμα περισσότερο έδαφος από τις ΗΠΑ, μίλησε ο Χριστόφορος Πισσαρίδης, Regius Professor, London School of Economics and Political Science

Tεχνητή νοημοσύνη | 13.04.2025 | 15:04

Παπαστεργίου: Ειδική γραμματεία για την AI στο υπουργείο Ψηφιακής Διακυβέρνησης

«Η Ελλάδα είναι ένα τρένο που ξεκινάει σιγά σιγά και θα τρέξει γρήγορα. Το μόνο που πρέπει να κάνουμε είναι να αντιμετωπίσουμε ενδεχόμενα προβλήματα για να μην χάσουμε χρόνο», σημείωσε ο κ. Ππαστεργίου

Tεχνητή νοημοσύνη | 12.04.2025 | 23:25

Η xAI του Μασκ προσλαμβάνει ειδικούς να χαλιναγωγήσουν το αθυρόστομο chatbot

Το Grok εκστομίζει ακατάλληλη φρασεολογία και ρατσιστικά σχόλια

Τεχνητή νοημοσύνη: Η επόμενη μέρα των ΜμΕ – Από τη συμμόρφωση στην ανταγωνιστικότητα

Tεχνητή νοημοσύνη | 12.04.2025 | 20:48

Η επόμενη μέρα των ΜμΕ με όρους AI: Από τη συμμόρφωση στην ανταγωνιστικότητα

H τεχνητή νοημοσύνη και η ψηφιακή ωριμότητα των ελληνικών επιχειρήσεων ήταν το θέμα του πάνελ με τίτλο «Tech Forward: The Future of Greek Business» στο Φόρουμ των Δελφών

ΔΕΙΤΕ ΕΠΙΣΗΣ

Προϋπολογισμός: Υπέρβαση 1,83 δισ. ευρώ στα φορολογικά έσοδα το πρώτο τρίμηνο – Στα 4,493 δισ. το πρωτογενές πλεόνασμα

Οικονομία 15.04.2025 | 11:10

Υπέρβαση 1,83 δισ. στα φορολογικά έσοδα το πρώτο τρίμηνο

Προϋπολογισμός: Εν μέρει οφείλεται στην καλύτερη απόδοσης στην είσπραξη των φόρων του τρέχοντος έτους (Φ.Π.Α, ΕΦΚ) κάτι που οφείλεται στην εκτεταμένη ακρίβειας

DBRS: Το μικρό, για την ώρα, «χτύπημα» του εμπορικού πολέμου στις ευρωπαϊκές τράπεζες

Τράπεζες 15.04.2025 | 12:50

DBRS: Πώς χτυπά ο εμπορικός πόλεμος τις ευρωπαϊκές τράπεζες - Τι λέει για Πειραιώς και Alpha

Στο μικροσκόπιο της DBRS βρέθηκαν 50 τράπεζες στην Ευρώπη - Τι βλέπει για την αύξηση του κόστους κινδύνου

Αλεξάνδρα Τόμπρα

Οικονομία 15.04.2025 | 11:10

Υπέρβαση 1,83 δισ. στα φορολογικά έσοδα το πρώτο τρίμηνο

Χρηματιστήριο Αθηνών: Άνοδος με χαμηλό τζίρο – Προσεκτικοί οι αγοραστές

Xρηματιστήριο Αθηνών 15.04.2025 | 11:17

Άνοδος με χαμηλό τζίρο στο Χρηματιστήριο - Προσεκτικοί οι αγοραστές

Ο Γενικός Δείκτης καταγράφει κέρδη 0,83% στις 1.639,34 μονάδες, ενώ ο τζίρος είναι στα 16,7 εκατ. ευρώ και ο όγκος στα 3,9 εκατ. τεμάχια

Αλεξάνδρα Τόμπρα

Hermès: Γύρισε ο τροχός – Άφησε πίσω της τον κολοσσό LVMH

Διεθνή 15.04.2025 | 13:17

Γύρισε ο τροχός - Η χρηματιστηριακή αξία της Hermès ξεπερνά την LVMH

Πώς η Hermès έγινε η τρίτη μεγαλύτερη εισηγμένη εταιρεία στην Ευρώπη - Τα λάθη της LVMH

Κίνα: Μποϊκοτάζ στην Boeing – Σταματά να παραλαμβάνει αεροσκάφη

Επικαιρότητα 15.04.2025 | 13:01

Μποϊκοτάζ της Κίνας στην Boeing - Σταματά να παραλαμβάνει αεροσκάφη

Κλιμακώνεται η εμπορική διαμάχη μεταξύ Κίνας και Ηνωμένων Πολιτειών

Απόψεις 15.04.2025 | 08:14

Ριψοκίνδυνο χρέος

Τέτοιου είδους προσπάθειες να «κλέψουμε» στον καπιταλισμό τις έχουμε επιχειρήσει πρώτα εδώ εμείς στην Ελλάδα

Νίκος Φιλιππίδης

Ηλεκτρισμός: Νέα συνάντηση της task force για αποφυγή black out το Πάσχα

ΗΛΕΚΤΡΙΣΜΟΣ 15.04.2025 | 11:00

Νέα συνάντηση της task force για αποφυγή black out το Πάσχα - Τι έδειξαν τα crash test

Η ανάγκη ρύθμισης της παραγωγής οφείλεται στην αλματώδη αύξηση του ποσοστού της ηλεκτρικής ενέργειας που αντλεί η χώρα μας από ΑΠΕ

Ναταλία Δανδόλου

MORE – ΔΕΗ Ανανεώσιμες: Οριστική προσφορά σύνδεσης με το δίκτυο για οκτώ φωτοβολταϊκούς σταθμούς, συνολικής ισχύος 882,4 MW στη Μακεδονία

ΑΠΕ 15.04.2025 | 12:26

Ξεκινούν την κατασκευή οκτώ φωτοβολταϊκών σταθμών MORE και ΔΕΗ Ανανεώσιμες

Καθοριστικό βήμα στη διαδικασία αδειοδότησης για τη MORE και τη ΔΕΗ Ανανεώσιμες στη Μακεδονία

Ακτοπλοϊκά εισιτήρια: Εξαντλούνται για τα περισότερα νησιά – Τιμές που «ζαλίζουν»

Τουρισμός 15.04.2025 | 08:37

«Ξεπουλάνε» τα ακτοπλοϊκά για το Πάσχα - «Ζαλίζουν» οι τιμές

Οι τουριστικοί πράκτορες επισημαίνουν ότι για την Μεγάλη Τετάρτη και την Μεγάλη Πέμπτη τα ακτοπλοϊκά εισιτήρια είναι ελάχιστα

Τεχνολογία 15.04.2025 | 12:15

Ξεπέρασαν τις 15.000 οι επισκέπτες στη Beyond 2025

Η BEYOND 2025 συγκέντρωσε περισσότερους από 300 εκθέτες από την Ελλάδα και από 10 χώρες

AGRO 15.04.2025 | 12:09

Σταμενίτης: Ενίσχυση της συνεργασίας Ελλάδας – Βιετνάμ στις εξαγωγές αγροτικών προϊόντων

Τι εξετάστηκε στη συνάντηση του υφυπουργού Αγροτικής Ανάπτυξης και Τροφίμων Διονύση Σταμενίτη με την Πρεσβευτή του Βιετνάμ στην Ελλάδα, Pham Thi Thu Huong

Κατασκευές 12.04.2025 | 19:03

Ταχιάος: Σύντομα η σύμβαση παραχώρησης για το τμήμα Χανιά – Ηράκλειο του ΒΟΑΚ

«Το αποτέλεσμα του διαγωνισμού έχει σταλεί στο Ελεγκτικό Συνέδριο. Εκτιμούμε ότι πολύ σύντομα θα έχουμε την απαιτούμενη έγκριση», δήλωσε ο υφυπουργός Υποδομών και Μεταφορών

Τουρισμός 15.04.2025 | 08:37

«Ξεπουλάνε» τα ακτοπλοϊκά για το Πάσχα - «Ζαλίζουν» οι τιμές

Ταμείο Ανάκαμψης: Τέλη Απριλίου η εκταμίευση της πέμπτης δόσης των 3,1 δισ. – Ποια χρηματοδοτικά εργαλείο «τρέχουν»

Οικονομία 14.04.2025 | 12:59

Πιερρακάκης: Τέλη Απριλίου η εκταμίευση 3,1 δισ. από το Ταμείο Ανάκαμψης

Η Ελλάδα θα υποβάλει το αίτημα αναθεώρησης του σχεδίου (όπως και τα άλλα κράτη-μέλη) και στα τέλη του Μαΐου με αρχές Ιουνίου, όπως το 6ο αίτημα εκταμίευσης ύψους 3,6 δισ. ευρώ

Γιάννης Αγουρίδης

Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών 14.04.2025 | 07:00

Δασμοί και αβεβαιότητα φέρνουν ύφεση – Οι επιπτώσεις στην Ελλάδα

Όταν οι επιχειρήσεις δεν ξέρουν τι να περιμένουν από το διεθνές περιβάλλον, είναι λιγότερο πιθανό να προχωρήσουν σε νέες επενδύσεις ή να δημιουργήσουν νέες θέσεις εργασίας

Παναγιώτης Ε. Πετράκης

7.000 γλώσσες περιμένουν

Το πρόβλημα με τη Βίβλο

Latest News

Ξεκαθάρισε το ταμπλό του ΧΑ, ο προσγειωμένος Εξάρχου, πατάει στην Ουκρανία (;) η ΔΕΗ, στην Ελαφόνησο ο πρίγκιπας Αλβέρτος, συνάντηση κορυφής Ντράγκι – Μυτιληναίου

Ξεπέρασαν τις 15.000 οι επισκέπτες στη Beyond 2025

Οι start-ups που δημιουργούν εργαλεία παραγωγικότητας είναι το νέο μεγάλο στοίχημα της ΑΙ - Ποιες είναι

Τα 5 πράγματα που δεν πρέπει να μοιράζεστε ποτέ με την τεχνητή νοημοσύνη

Ποιες είναι οι 10 χώρες με τα περισσότερα ταλέντα στην AI

Η συμβολή της ΑΙ στην κατανόηση της σεισμικής κρίσης στη Σαντορίνη

Alphabet και Nvidia επενδύουν στην εταιρεία του Σάτσκεβερ, συνιδρυτή της OpenAI

Πισσαρίδης (LSE): Η μάχη για την AI κερδίζεται με επενδύσεις και αλλαγές

Παπαστεργίου: Ειδική γραμματεία για την AI στο υπουργείο Ψηφιακής Διακυβέρνησης

Η xAI του Μασκ προσλαμβάνει ειδικούς να χαλιναγωγήσουν το αθυρόστομο chatbot

Η επόμενη μέρα των ΜμΕ με όρους AI: Από τη συμμόρφωση στην ανταγωνιστικότητα

Ξεκαθάρισε το ταμπλό του ΧΑ, ο προσγειωμένος Εξάρχου, πατάει στην Ουκρανία (;) η ΔΕΗ, στην Ελαφόνησο ο πρίγκιπας Αλβέρτος, συνάντηση κορυφής Ντράγκι – Μυτιληναίου

Υπέρβαση 1,83 δισ. στα φορολογικά έσοδα το πρώτο τρίμηνο

DBRS: Πώς χτυπά ο εμπορικός πόλεμος τις ευρωπαϊκές τράπεζες - Τι λέει για Πειραιώς και Alpha

Υπέρβαση 1,83 δισ. στα φορολογικά έσοδα το πρώτο τρίμηνο

Άνοδος με χαμηλό τζίρο στο Χρηματιστήριο - Προσεκτικοί οι αγοραστές

Γύρισε ο τροχός - Η χρηματιστηριακή αξία της Hermès ξεπερνά την LVMH

Μποϊκοτάζ της Κίνας στην Boeing - Σταματά να παραλαμβάνει αεροσκάφη

Ριψοκίνδυνο χρέος

Νέα συνάντηση της task force για αποφυγή black out το Πάσχα - Τι έδειξαν τα crash test

Ξεκινούν την κατασκευή οκτώ φωτοβολταϊκών σταθμών MORE και ΔΕΗ Ανανεώσιμες

«Ξεπουλάνε» τα ακτοπλοϊκά για το Πάσχα - «Ζαλίζουν» οι τιμές

Ξεπέρασαν τις 15.000 οι επισκέπτες στη Beyond 2025

Σταμενίτης: Ενίσχυση της συνεργασίας Ελλάδας – Βιετνάμ στις εξαγωγές αγροτικών προϊόντων

Ταχιάος: Σύντομα η σύμβαση παραχώρησης για το τμήμα Χανιά – Ηράκλειο του ΒΟΑΚ

«Ξεπουλάνε» τα ακτοπλοϊκά για το Πάσχα - «Ζαλίζουν» οι τιμές

Πιερρακάκης: Τέλη Απριλίου η εκταμίευση 3,1 δισ. από το Ταμείο Ανάκαμψης

Δασμοί και αβεβαιότητα φέρνουν ύφεση – Οι επιπτώσεις στην Ελλάδα

ot.gr | Ταυτότητα