![Microsoft: Μελετά τεχνητή νοημοσύνη που κατανοεί εικόνες και ήχους](https://www.ot.gr/wp-content/uploads/2023/02/Artificial-General-Intelligence.jpg)
Η Microsoft προχώρησε μέσω μίας μελέτης στα αποκαλυπτήρια ακόμη ενός μοντέλου τεχνητής νοημοσύνης, του Kosmos-1, ενός MLLM (multimodal large language model), το οποίο μπορεί όχι μόνο να ανταποκρίνεται σε γλωσσικές προτροπές αλλά και σε οπτικές ενδείξεις, οι οποίες μπορούν να χρησιμοποιηθούν για μια σειρά εργασιών, όπως η δημιουργία λεζάντας εικόνων, η οπτική απάντηση ερωτήσεων, κι άλλα.
Το ChatGPT της OpenAI βοήθησε στη διάδοση της έννοιας των LLM, όπως το μοντέλο GPT (Generative Pre-trained Transformer) και τη δυνατότητα μετατροπής μιας προτροπής κειμένου ή μιας εισαγωγής σε ένα ολοκληρωμένο τελικό κείμενο.
Ο Ίλον Μασκ ετοιμάζεται να δημιουργήσει τον αντίπαλο του ChatGPT
Όπως υποστηρίζουν οι ερευνητές τεχνητής νοημοσύνης της Microsoft, τα LLM εξακολουθούν να διερευνούν πολλαπλές μορφές περιεχομένου επεξεργασίας, όπως μηνύματα εικόνας και ήχου.
Σύμφωνα με τα όσα αναφέρονται στην μελέτη «Language Is Not All You Need: Aligning Perception with Language Models» η συγκεκριμένη πολυμορφική αντίληψη θεωρείται απαραίτητη για να αποκτήσει η τεχνητή γενική νοημοσύνη (AGI) δυνατότητες που θα μοιάζουν με το ChatGPT.
«Το πιο σημαντικό, το ξεκλείδωμα της πολυτροπικής εισόδου περιεχομένου διευρύνει σημαντικά τις εφαρμογές των μοντέλων γλώσσας σε τομείς υψηλής αξίας, όπως η πολυτροπική μηχανική εκμάθηση, η ευφυΐα εγγράφων και η ρομποτική», αναφέρει η μελέτη.
Η Microsoft λέει ότι το Kosmos-1 MLLM της μπορεί να αντιλαμβάνεται γενικές μεθόδους, να ακολουθεί οδηγίες (μηδενική εκμάθηση) και να μαθαίνει από τα συμφραζόμενα (εκμάθηση με λίγες λήψεις). «Ο στόχος είναι να ευθυγραμμιστεί η αντίληψη με τα LLM, έτσι ώστε τα μοντέλα να μπορούν να βλέπουν και να μιλάνε», υποστηρίζεται στην μελέτη.
Στα παραδείγματα χρήσης του Kosmos-1 περιλαμβάνει μια εικόνα που δείχνει ένα γατάκι και ένα άτομο που κρατά ένα χαρτί με ένα ζωγραφισμένο χαμόγελο στο στόμα του. Η προτροπή που δίνεται στην τεχνητή νοημοσύνη είναι «εξηγήστε γιατί αυτή η φωτογραφία είναι αστεία». Η απάντηση του Kosmos-1 είναι: «Η γάτα φοράει μια μάσκα που χαρίζει στη γάτα ένα χαμόγελο».
Κάθε ένα από τα παραδείγματα που εμφανίζονται στην μελέτη δείχνει τη δυνατότητα τεχνητής νοημοσύνης όπως το Kosmos-1 να αυτοματοποιούν μια εργασία σε πολλές καταστάσεις, από το να λένε σε έναν χρήστη των Windows 10 πώς να επανεκκινήσει τον υπολογιστή του (ή οποιαδήποτε άλλη εργασία με οπτική προτροπή), έως την ανάγνωση μιας ιστοσελίδας σχετικά με την έναρξη μιας αναζήτησης στο διαδίκτυο, την ερμηνεία δεδομένων υγείας από μια συσκευή, τη δημιουργία λεζάντας σε μια εικόνα και ούτω καθεξής.
Προς το παρόν το συγκεκριμένο μοντέλο τεχνητής νοημοσύνης δεν περιλαμβάνει δυνατότητες ανάλυσης βίντεο.
Οι ερευνητές της Microsoft εξέτασαν επίσης πώς το Kosmos-1 αποδίδει σε τεστ νοημοσύνης. Τα αποτελέσματα έδειξαν ένα «μεγάλο χάσμα απόδοσης μεταξύ του τρέχοντος μοντέλου και του μέσου επιπέδου ενός ενήλικου ανθρώπου», αλλά διαπίστωσαν επίσης ότι η ακρίβειά του δείχνει τη δυνατότητα για τα MLLM να «αντιλαμβάνονται αφηρημένα εννοιολογικά μοτίβα σε ένα μη λεκτικό πλαίσιο».
Η έρευνα για την «απάντηση σε ερωτήσεις ιστοσελίδων» είναι ενδιαφέρουσα δεδομένου του σχεδίου της Microsoft να χρησιμοποιήσει μοντέλα τεχνητής νοημοσύνης τέτοιου τύπου για να κάνει το Bing ικανότερη μηχανή αναζήτησης από την αντίστοιχη της Google.
Σύμφωνα με την μελέτη ο συγκεκριμένος τομέας απαιτεί από το μοντέλο να κατανοήσει τόσο τη σημασιολογία όσο και τη δομή των κειμένων. Εδώ, η δομή της ιστοσελίδας παίζει καθοριστικό ρόλο. «Η εργασία μπορεί να μας βοηθήσει να αξιολογήσουμε την ικανότητα του μοντέλου μας να κατανοεί τη σημασιολογία και τη δομή των ιστοσελίδων», εξηγούν οι ερευνητές της Microsoft.
![ot.gr](/wp-content/themes/whsk_otgr/common/imgs/fav.ico/favicon-32x32.png)
![ot.gr](/wp-content/themes/whsk_otgr/common/imgs/fav.ico/favicon-32x32.png)
Latest News
![ChatGPT: Τι είναι το απόρρητο πρόγραμμα με την κωδική ονομασία «φράουλα»](https://www.ot.gr/wp-content/uploads/2024/07/chatgpt-600x338.jpg)
«Φράουλα»: Τι είναι το απόρρητο πρόγραμμα του ChatGPT
Τα τελευταία χρόνια υπάρχει μια συνεχής φημολογία για απόρρητα πρότζεκτ που βρίσκονται υπό εξέλιξη στα εργαστήρια της OpenAI
![Google: Η τεχνητή νοημοσύνη κατέστρεψε την υπόσχεση της για ουδετερότητα άνθρακα](https://www.ot.gr/wp-content/uploads/2024/03/sundar-pichai-google-600x317.png)
«Είπα-ξείπα» της Google για μηδενικές εκπομπές άνθρακα
Οι εκπομπές της αυξάνονται κατά 50% τα τελευταία πέντε χρόνια
![Δημιουργική AI: Πόσο έτοιμες είναι οι ελληνικές επιχειρήσεις για να την υποδεχθούν](https://www.ot.gr/wp-content/uploads/2024/07/George-Tsopelas_Chairman-–-McKinsey-Company-Greece-and-Cyprus-600x344.jpg)
Πόσο έτοιμες είναι οι ελληνικές επιχειρήσεις να υποδεχθούν την AI
Ελλείψεις αλλά και δυνατότητες για την Ελλάδα αποκαλύπτει έρευνα της QuantumBlack, AI by McKinsey για τη διείσδυση της τεχνητής νοημοσύνης στις επιχειρήσεις
![Τesla – ρομποταξί: Κατήφορος δίχως… φρένα για τη μετοχή μετά την υποβάθμιση από τη UBS](https://www.ot.gr/wp-content/uploads/2024/05/tesla-600x315.jpg)
Τα ρομποταξί... βούλιαξαν τη μετοχή της Tesla - Η υποβάθμιση από τη UBS
Η Tesla αναβάλει για Οκτώβριο την προγραμματισμένη αποκάλυψη του ρομποταξί της που αρχικά είχε προγραμματιστεί για τον επόμενο μήνα
![ΣΕΠΕ: Η Δημιουργική Τεχνητή Νοημοσύνη θα ενισχύσει 5,5% το ΑΕΠ της Ελλάδας έως το 2030](https://www.ot.gr/wp-content/uploads/2024/04/texniti-noimosyni-5-600x328.jpg)
Η GenAI θα ενισχύσει 5,5% το ΑΕΠ της Ελλάδας έως το 2030
Στο συνέδριο του ΣΕΠΕ, υπογραμμίστηκε ότι εάν προστεθεί η τεχνητή νοημοσύνη, υπάρχει αύξηση κατά 30% στις κενές θέσεις που εκτοξεύθηκαν στις 83.000
![Miss AI: Τα πρώτα καλλιστεία τεχνητής νοημοσύνης για influencers](https://www.ot.gr/wp-content/uploads/2024/07/miss-ai-600x361.jpg)
Τα πρώτα καλλιστεία για AI για influencers – Ποια αναδείχθηκε «Miss AI»
Οι ρεαλιστικές εμφανίσεις, η τεχνολογική ικανότητα, καθώς και η επιρροή τους στα social media έκριναν τη νικήτρια μεταξύ των 1.500 συμμετεχουσών – Η Kenza Laylie πήρε το έπαθλο των 13.000 δολαριών
![TSMC: Ξεπέρασαν τις προβλέψεις τα έσοδα β’ τριμήνου, ώθηση από την τεχνητή νοημοσύνη](https://www.ot.gr/wp-content/uploads/2023/03/tsmc-600x400.jpg)
Πάνω από τις προβλέψεις τα έσοδα της TSMC, ώθηση από την τεχνητή νοημοσύνη
Η ταϊβανέζικη εταιρεία TSMC, ανακοίνωσε ισχυρή αύξηση εσόδων για το δεύτερο τρίμηνο του 2024, πολύ πάνω από τις προβλέψεις
![Salesforce: Πόσο εμπιστεύονται οι εργαζόμενοι την AI για τη διεκπεραίωση των καθηκόντων τους](https://www.ot.gr/wp-content/uploads/2022/11/iStock-962678630-1-600x400.jpg)
Πόσο εμπιστεύονται οι εργαζόμενοι την AI για τη διεκπεραίωση των καθηκόντων τους
Tο 80% των εργαζομένων θεωρεί πως το μέλλον είναι προσανατολισμένο στην AI, με ένα σημαντικό ποσοστό να εμπιστεύεται την αυτόνομη λειτουργία της, σύμφωνα με έρευνα της Salesforce
![Τεχνητή Νοημοσύνη: Ποιες μετοχές εκτοξεύουν ΑI και data centers](https://www.ot.gr/wp-content/uploads/2024/04/ot_ai1-600x352.png)
To Big Bang με ΑI και data centers αναδεικνύει νέους πρωταγωνιστές - Ποιες μετοχές εκτοξεύονται
Η Τεχνητή Νοημοσύνη φέρνει νέα δεοδμένα και νέες προκλήσεις
![Apple: Νέα ανατροπή στη συμφωνία της με την OpenAI](https://www.ot.gr/wp-content/uploads/2024/06/Tim-Cook-wwdc2024-600x400.jpg)
Τι προβλέπει η συμφωνία Apple με OpenAI
Η συμφωνία ανεβάζει την Apple στο επίπεδο της Microsoft εντός της OpenAI