
Στις φωνητικές δυνατότητες της τεχνητής νοημοσύνης της Meta επενδύει ο Μαρκ Ζάκερμπεργκ φέτος, καθώς ο γίγαντας των social media προωθεί τα σχέδια για τη δημιουργία εσόδων από την ταχέως αναπτυσσόμενη τεχνολογία.
Η Meta σχεδιάζει να εισαγάγει βελτιωμένες λειτουργίες φωνής στο πιο πρόσφατο μοντέλο ανοιχτού κώδικα μεγάλης γλώσσας, το Llama 4, που αναμένεται τις επόμενες εβδομάδες, είπαν πηγές στους Financial Times, καθώς στοιχηματίζουν ότι οι μελλοντικοί «πράκτορες» που υποστηρίζονται από AI θα είναι συνομιλητές και δεν θα χρειάζεται η συναλλαγή με κείμενο.
Η εταιρεία έχει επικεντρωθεί ιδιαίτερα στο να κάνει τη συνομιλία μεταξύ ενός χρήστη και του φωνητικού του μοντέλου πιο κοντά σε έναν αμφίδρομο φυσικό διάλογο, επιτρέποντας παύσεις από τον χρήστη και όχι μια πιο άκαμπτη μορφή ερωτήσεων και απαντήσεων, είπε μια πηγή.
Η έμφαση στην φωνητική λειτουργία έρχεται καθώς ο Ζάκερμπεργκ, έχει περιγράψει τολμηρά σχέδια να κάνει την αξίας $1,7 τρισεκατομμυρίων δολαρίων εταιρεία της Silicon Valley «αρχηγό της τεχνητής νοημοσύνης», αποκαλώντας το 2025 έτος make-or-break για πολλά από τα προϊόντα τεχνητής νοημοσύνης της, καθώς ο όμιλος αγωνίζεται ενάντια σε ανταγωνιστές όπως η OpenAI, η Microsoft και η Google για την εμπορευματοποίηση της τεχνολογίας.
Πώς θα αποκομίσει κέρδος
Αυτό οδήγησε την εταιρεία να εξετάσει τις δοκιμαστικές συνδρομές premium για τον βοηθό τεχνητής νοημοσύνης της Meta AI, για εργασίες όπως κρατήσεις και δημιουργία βίντεο, είπαν δύο άτομα στους FT. Εξετάζει επίσης το ενδεχόμενο εισαγωγής πληρωμένων διαφημίσεων, ή αναρτήσεων με χορηγία, στα αποτελέσματα αναζήτησης του βοηθού τεχνητής νοημοσύνης της.
Ο Ζάκερμπεργκ αποκάλυψε φέτος τα σχέδια για την κατασκευή ενός βοηθού μηχανικής τεχνητής νοημοσύνης που έχει τις ικανότητες κωδικοποίησης και επίλυσης προβλημάτων σε επίπεδο μηχανικού μεσαίου επιπέδου, ο οποίος, όπως είπε, έχει μια δυνητικά «πολύ μεγάλη αγορά».
Την Τετάρτη, ο Chief Product Officer του ομίλου, Κρις Κοξ, ανέλυσε ορισμένα από τα σχέδιά του για το Llama 4, λέγοντας ότι θα ήταν ένα «omni μοντέλο όπου η ομιλία θα ήταν “εγγενής”… αντί να μεταφράζει τη φωνή σε κείμενο, να στέλνει κείμενο στο LLM, να βγάζει κείμενο και να το μετατρέπει ξανά σε ομιλία».
Μιλώντας στο συνέδριο τεχνολογίας, μέσων και τηλεπικοινωνιών της Morgan Stanley, πρόσθεσε: «Πιστεύω ότι είναι τεράστια υπόθεση για το προϊόν διεπαφής, η ιδέα ότι μπορείς να μιλήσεις στο Διαδίκτυο και απλώς να το ρωτήσεις οτιδήποτε. Νομίζω ότι ακόμα προσπαθούμε να κατανοήσουμε το πόσο ισχυρό είναι αυτό».
Η Meta έχει επίσης συζητήσει τα προστατευτικά «κιγκλιδώματα» που πρέπει να έχει το νεότερο μοντέλο Llama σχετικά με το τι μπορεί να αποδώσει και αν θα τα χαμηλώσει.
Πληθώρα ανταγωνιστών αντιμετωπίζει η Meta
Οι συζητήσεις έρχονται εν μέσω ενός πλήθους νέων προϊόντων από ανταγωνιστές και προειδοποιήσεων από τον νεοδιορισμένο «τσάρο της AI» Ντέιβιντ Σακς, επενδυτή της Silicon Valley, ο οποίος έχει πει ότι θέλει να διασφαλίσει ότι τα μοντέλα τεχνητής νοημοσύνης των ΗΠΑ δεν είναι πολιτικά προκατειλημμένα ή «woke».
Η OpenAI κυκλοφόρησε τη δική της λειτουργία φωνής πέρυσι και επικεντρώθηκε στο να του δώσει ξεχωριστές προσωπικότητες, ενώ το Grok 3, που δημιουργήθηκε από το xAI του Ίλον Μασκ και διατίθεται στην πλατφόρμα X, παρουσίασε τις λειτουργίες φωνής του σε επιλεγμένους χρήστες στα τέλη του περασμένου μήνα.
Το μοντέλο του Μασκ, Grok, σχεδιάστηκε ειδικά για να έχει λιγότερα προστατευτικά κιγκλιδώματα, συμπεριλαμβανομένης μιας «ασταθούς λειτουργίας» που σκόπιμα ανταποκρίνεται με τρόπους που προορίζονται να είναι «απαράδεκτοι, ακατάλληλοι και προσβλητικοί», σύμφωνα με την εταιρεία.
Η Meta αποκάλυψε πέρυσι μια λιγότερο «ηθικολογική» έκδοση του μοντέλου της AI για την τρίτη έκδοση Llama, μετά από κριτική ότι το Llama 2 αρνιόταν να απαντήσει σε αθώες ερωτήσεις.
Το να επιτρέπεται στους χρήστες να αλληλεπιδρούν με έναν βοηθό τεχνητής νοημοσύνης χρησιμοποιώντας φωνητικές εντολές είναι ένα σημαντικό χαρακτηριστικό των έξυπνων γυαλιών Ray-Ban της Meta, τα οποία έχουν γίνει πρόσφατα μεγάλη επιτυχία μεταξύ των καταναλωτών. Ο όμιλος έχει επιταχύνει τα σχέδιά του για την κατασκευή ελαφρών ακουστικών που μπορούν να υποσκελίσουν το smartphone ως την κύρια υπολογιστική συσκευή των καταναλωτών.


Latest News

Νέο εμπόδιο για την Apple - Καθυστερεί τις υπηρεσίες AI στο iPhone
Η εξέλιξη αυτή σηματοδοτεί την τελευταία από μια σειρά οπισθοδρομήσεων στον οδικό χάρτη λογισμικού της Apple

Φρένο στις προσπάθειες Μασκ να αποτρέψει την OpenAI να γίνει κερδοσκοπική οντότητα
Δικαστής στην Καλιφόρνια αποφάσισε ότι ο Ίλον Μασκ δεν μπορεί να προχωρήσει στις νομικές προσπάθειές του να εμποδίσει την OpenAI να μετατραπεί σε κερδοσκοπική οντότητα.

Data Centers κατασκευάζει η Microsoft στις σκανδιναβικές χώρες
Η Microsoft αλλάζει στρατηγική στην κατασκευή των Data Centers και πλέον επιλέγει περιοχές με προσιτή και «καθαρή» ενέργεια

Η Google δοκιμάζει νέα μηχανή αναζήτησης
Το πειραματικό «ΑΙ Mode», προς το παρόν διαθέσιμο μόνο στους συνδρομητές του Google One AI Premium, προσφέρει περιλήψεις των αποτελεσμάτων αναζήτησης μαζί με σχετικούς συνδέσμους.

Εξωφρενικά και επικίνδυνα αποτελέσματα από μοντέλα ΑΙ που εκπαιδεύτηκαν να γράφουν ελαττωματικό κώδικα
Τι είναι και πόσο επικίνδυνα είναι τα απευθυγραμισμένα μοντέλα ΑΙ

DATAMITE 2025: Big Data και AI στο επίκεντρο του συνεδρίου του ΟΤΕ
Βασικά θέματα που συζητήθηκαν στο DATAMITE Meetup Event 2025, ήταν η σημασία των πλαισίων διακυβέρνησης δεδομένων και των ηθικών πρακτικών

Η πολυτιμότερη startup στον κόσμο - Ποιος είναι ο ιδρυτής που αποθεώνει ο Μασκ
Η εταιρεία τεχνητής νοημοσύνης έχει γραφεία σε Πάλο Αλτο και Τελ Αβίβ και μόλις 20 υπαλλήλους

Γιατί η Nvidia κυριαρχεί στα AI μικροτσίπ - Θα διαρκέσει η... βασιλεία της;
Οι επενδυτές έχουν γίνει επιφυλακτικοί στο να ρίξουν περισσότερα χρήματα στην κατασκευάστρια ημιαγωγών Nvidia, τώρα που υπάρχει στο πλάνο και η DeepSeek

Η κινεζική Honor ανακοίνωσε επενδύσεις ύψους 10 δισ. δολαρίων σε συσκευές AI
Η Honor ολοκλήρωσε μια αναδιάρθρωση μετόχων τον Δεκέμβριο που την έφερε πιο κοντά σε μια αρχική δημόσια προσφορά

Τεχνητή Νοημοσύνη: Εργασιακές ευκαιρίες ή ανατροπές;
Η τεχνητή νοημοσύνη έρχεται, η «οικονομία της γνώσης» αποδομείται – Τι βλέπει το LinkedIn