Στις φωνητικές δυνατότητες της τεχνητής νοημοσύνης της Meta επενδύει ο Μαρκ Ζάκερμπεργκ φέτος, καθώς ο γίγαντας των social media προωθεί τα σχέδια για τη δημιουργία εσόδων από την ταχέως αναπτυσσόμενη τεχνολογία.

Η Meta σχεδιάζει να εισαγάγει βελτιωμένες λειτουργίες φωνής στο πιο πρόσφατο μοντέλο ανοιχτού κώδικα μεγάλης γλώσσας, το Llama 4, που αναμένεται τις επόμενες εβδομάδες, είπαν πηγές στους Financial Times, καθώς στοιχηματίζουν ότι οι μελλοντικοί «πράκτορες» που υποστηρίζονται από AI θα είναι συνομιλητές και δεν θα χρειάζεται η συναλλαγή με κείμενο.

Η εταιρεία έχει επικεντρωθεί ιδιαίτερα στο να κάνει τη συνομιλία μεταξύ ενός χρήστη και του φωνητικού του μοντέλου πιο κοντά σε έναν αμφίδρομο φυσικό διάλογο, επιτρέποντας παύσεις από τον χρήστη και όχι μια πιο άκαμπτη μορφή ερωτήσεων και απαντήσεων, είπε μια πηγή.

Η έμφαση στην φωνητική λειτουργία έρχεται καθώς ο Ζάκερμπεργκ, έχει περιγράψει τολμηρά σχέδια να κάνει την αξίας $1,7 τρισεκατομμυρίων δολαρίων εταιρεία της Silicon Valley «αρχηγό της τεχνητής νοημοσύνης», αποκαλώντας το 2025 έτος make-or-break για πολλά από τα προϊόντα τεχνητής νοημοσύνης της, καθώς ο όμιλος αγωνίζεται ενάντια σε ανταγωνιστές όπως η OpenAI, η Microsoft και η Google για την εμπορευματοποίηση της τεχνολογίας.

Πώς θα αποκομίσει κέρδος

Αυτό οδήγησε την εταιρεία να εξετάσει τις δοκιμαστικές συνδρομές premium για τον βοηθό τεχνητής νοημοσύνης της Meta AI, για εργασίες όπως κρατήσεις και δημιουργία βίντεο, είπαν δύο άτομα στους FT. Εξετάζει επίσης το ενδεχόμενο εισαγωγής πληρωμένων διαφημίσεων, ή αναρτήσεων με χορηγία, στα αποτελέσματα αναζήτησης του βοηθού τεχνητής νοημοσύνης της.

Ο Ζάκερμπεργκ αποκάλυψε φέτος τα σχέδια για την κατασκευή ενός βοηθού μηχανικής τεχνητής νοημοσύνης που έχει τις ικανότητες κωδικοποίησης και επίλυσης προβλημάτων σε επίπεδο μηχανικού μεσαίου επιπέδου, ο οποίος, όπως είπε, έχει μια δυνητικά «πολύ μεγάλη αγορά».

Την Τετάρτη, ο Chief Product Officer του ομίλου, Κρις Κοξ, ανέλυσε ορισμένα από τα σχέδιά του για το Llama 4, λέγοντας ότι θα ήταν ένα «omni μοντέλο όπου η ομιλία θα ήταν “εγγενής”… αντί να μεταφράζει τη φωνή σε κείμενο, να στέλνει κείμενο στο LLM, να βγάζει κείμενο και να το μετατρέπει ξανά σε ομιλία».

Μιλώντας στο συνέδριο τεχνολογίας, μέσων και τηλεπικοινωνιών της Morgan Stanley, πρόσθεσε: «Πιστεύω ότι είναι τεράστια υπόθεση για το προϊόν διεπαφής, η ιδέα ότι μπορείς να μιλήσεις στο Διαδίκτυο και απλώς να το ρωτήσεις οτιδήποτε. Νομίζω ότι ακόμα προσπαθούμε να κατανοήσουμε το πόσο ισχυρό είναι αυτό».

Η Meta έχει επίσης συζητήσει τα προστατευτικά «κιγκλιδώματα» που πρέπει να έχει το νεότερο μοντέλο Llama σχετικά με το τι μπορεί να αποδώσει και αν θα τα χαμηλώσει.

Πληθώρα ανταγωνιστών αντιμετωπίζει η Meta

Οι συζητήσεις έρχονται εν μέσω ενός πλήθους νέων προϊόντων από ανταγωνιστές και προειδοποιήσεων από τον νεοδιορισμένο «τσάρο της AI» Ντέιβιντ Σακς, επενδυτή της Silicon Valley, ο οποίος έχει πει ότι θέλει να διασφαλίσει ότι τα μοντέλα τεχνητής νοημοσύνης των ΗΠΑ δεν είναι πολιτικά προκατειλημμένα ή «woke».

Η OpenAI κυκλοφόρησε τη δική της λειτουργία φωνής πέρυσι και επικεντρώθηκε στο να του δώσει ξεχωριστές προσωπικότητες, ενώ το Grok 3, που δημιουργήθηκε από το xAI του Ίλον Μασκ και διατίθεται στην πλατφόρμα X, παρουσίασε τις λειτουργίες φωνής του σε επιλεγμένους χρήστες στα τέλη του περασμένου μήνα.

Το μοντέλο του Μασκ, Grok, σχεδιάστηκε ειδικά για να έχει λιγότερα προστατευτικά κιγκλιδώματα, συμπεριλαμβανομένης μιας «ασταθούς λειτουργίας» που σκόπιμα ανταποκρίνεται με τρόπους που προορίζονται να είναι «απαράδεκτοι, ακατάλληλοι και προσβλητικοί», σύμφωνα με την εταιρεία.

Η Meta αποκάλυψε πέρυσι μια λιγότερο «ηθικολογική» έκδοση του μοντέλου της AI για την τρίτη έκδοση Llama, μετά από κριτική ότι το Llama 2 αρνιόταν να απαντήσει σε αθώες ερωτήσεις.

Το να επιτρέπεται στους χρήστες να αλληλεπιδρούν με έναν βοηθό τεχνητής νοημοσύνης χρησιμοποιώντας φωνητικές εντολές είναι ένα σημαντικό χαρακτηριστικό των έξυπνων γυαλιών Ray-Ban της Meta, τα οποία έχουν γίνει πρόσφατα μεγάλη επιτυχία μεταξύ των καταναλωτών. Ο όμιλος έχει επιταχύνει τα σχέδιά του για την κατασκευή ελαφρών ακουστικών που μπορούν να υποσκελίσουν το smartphone ως την κύρια υπολογιστική συσκευή των καταναλωτών.

Ακολουθήστε τον ot.grστο Google News και μάθετε πρώτοι όλες τις ειδήσεις
Δείτε όλες τις τελευταίες Ειδήσεις από την Ελλάδα και τον Κόσμο, στον ot.gr

Latest News

Πρόσφατα Άρθρα Tεχνητή νοημοσύνη
Μασκ: Φρένο στις προσπάθειες του να αποτρέψει την OpenAI να γίνει κερδοσκοπική οντότητα
Tεχνητή νοημοσύνη |

Φρένο στις προσπάθειες Μασκ να αποτρέψει την OpenAI να γίνει κερδοσκοπική οντότητα

Δικαστής στην Καλιφόρνια αποφάσισε ότι ο Ίλον Μασκ δεν μπορεί να προχωρήσει στις νομικές προσπάθειές του να εμποδίσει την OpenAI να μετατραπεί σε κερδοσκοπική οντότητα.