Σε χιουμοριστική μελέτη που δημοσιεύει ενόψει γιορτών η επιθεώρηση The British Medical Journal, όλα τα μεγάλα μοντέλα τεχνητής νοημοσύνης βρέθηκαν να πάσχουν από ήπια γνωσιακή έκπτωση, ένα στάδιο πριν από την διάγνωση άνοιας.
Τα ευρήματα δείχνουν επίσης ότι οι παλαιότερες βερσιόν των μοντέλων ΑΙ, όπως και οι μεγαλύτεροι σε ηλικία ασθενείς, έχουν χαμηλότερες επιδόσεις στα γνωσιακά τεστ σε σχέση με τις νεότερες βερσιόν.
Σε κίνδυνο το 40% των θέσεων εργασίας από την ΑΙ – Τι δείχνει έρευνα του ΔΝΤ
Τα ευρήματα «θέτουν υπό αμφισβήτηση την υπόθεση ότι η τεχνητή νοημοσύνη θα αντικαταστήσει σύντομα στους γιατρούς» γράφει η ερευνητική μάδα.
Όλα τα chatbot είχαν φτωχές επιδόσεις στα τεστ χωρικής αντίληψης και εκτελεστικών λειτουργιών
Οι νευρολόγοι που υπογράφουν τη μελέτη, μοιρασμένοι ανάμεσα σε Ισραήλ και Βρετανία, χρησιμοποίησαν καθιερωμένα γνωσιακά τεστ για να αξιολογήσουν μια σειρά από δημοφιλή «μεγάλα γλωσσικά μοντέλα», τα οποία απαντούν σε ερωτήσεις και γράφουν κείμενα με βάση τις οδηγίες του χρήστη.
Συγκεκριμένα εξετάστηκαν οι εκδόσεις 4 και 4ο του ChatGPT που αναπτύχθηκε από την OpenAI, οι βερσιόν 1 και 1.5 του Gemini που ανέπτυξε η Google, καθώς και το Claude 3.5 της Anthropic.
Χαμηλές επιδόσεις
Όλα τα μοντέλα υποβλήθηκαν στο τεστ MoCA, το οποίο σχεδιάστηκε για την ανίχνευση των πρώτων σημείων άνοιας. Μέσα από μια σειρά ερωτήσεων εξετάζει την προσοχή, τη μνήμη, τις γλωσσικές ικανότητες, την αντίληψη του χώρου και τις εκτελεστικές λειτουργίες του εγκεφάλου. Το μέγιστο σκορ είναι 30 πόντοι, ενώ το κατώτερο όριο του φυσιολογικού είναι το 26.
Στα μοντέλα ΑΙ δόθηκαν οι ίδιες οδηγίες που δίνονται και στους ανθρώπους, ενώ οι επιδόσεις τους αξιολογήθηκαν από νευρολόγο.
Τη μεγαλύτερη βαθμολογία, 26 στα 30, πέτυχε το ChatGPT 4o, ενώ στη δεύτερη θέση κατατάχθηκε το ChatGPT 4 (25 στα 30). Τις χαμηλότερες επιδόσεις έφερε το Gemini, το οποίο παρουσιάζει τις πιο ανησυχητικές ενδείξεις άνοιας με σκορ 16 στα 30.
Επιπλέον, όλα τα chatbot είχαν φτωχές επιδόσεις στα τεστ χωρικής αντίληψης και εκτελεστικών λειτουργιών, όπως το τεστ στο οποίο κλήθηκαν να σημειώσουν αριθμούς και γράμματα κατά αύξουσα σειρά.
Ένα άλλο παράδειγμα αποτυχίας ήταν το τεστ του ρολογιού, στο οποίο ο εξεταζόμενος πρέπει να ζωγραφίσει τους δείκτες έτσι ώστε να δείχνουν μια συγκεκριμένη ώρα.
Ακόμα, όλα τα chatbot έδειξαν αδυναμία να εκφράσουν ενσυναίσθηση ή να ερμηνεύσουν οπτικά περίπλοκες εικόνες, γράφουν οι ερευνητές. Tο Gemini απέτυχε και σε ένα απλό τεστ στο οποίο κλήθηκε να θυμηθεί μια αλληλουχία πέντε λέξεων.
Η ερευνητική ομάδα αναγνωρίζει ότι τα μεγάλα γλωσσικά μοντέλα διαφέρουν από την αρχιτεκτονική του ανθρώπινου εγκεφάλου.
Σε κάθε περίπτωση, πάντως, τα ευρήματα δείχνουν ότι η ΑΙ δεν είναι έτοιμη να εργαστεί ως γιατρός.
«Όχι μόνο είναι απίθανο να αντικατασταθούν σύντομα οι νευρολόγοι από μεγάλα γλωσσικά μοντέλα, αλλά επιπλέον τα ευρήματά μας υποδεικνύουν ότι σύντομα μπορεί να βρεθούμε να κουράρουμε νέους εικονικούς ασθενείς: μοντέλα τεχνητής νοημοσύνης με γνωσιακή έκπτωση» γράφει η ερευνητική ομάδα.
Στο χριστουγεννιάτικο τεύχος του, το The British Medical Journal έχει παράδοση να δημοσιεύει και μια χιουμοριστική μελέτη, όπως αυτή του 2011 στην οποία χειρουργοί περιγράφουν τον καλύτερο τρόπο για να ράψει κανείς μια γεμιστή γαλοπούλα.
Πηγή: In.gr
Latest News
H GenAI φέρνει αυξημένη κατανάλωση ενέργειας αλλά και πολλές ευκαιρίες
Η Generative AI αναμένεται να δημιουργήσει νέες προκλήσεις σε επίπεδο τεχνικών υποδομών, κατανάλωσης ενέργειας αλλά και στην ίδια την εμπιστοσύνη του κοινού προς την τεχνολογία
Η μητρική του TikTok «ρίχνει» 20 δισ. δολάρια το 2025 στην AI
Η κινεζική εταιρεία ByteDance σχεδιάζει να δαπανήσει περίπου το ήμισυ του ποσού στο εξωτερικό σε υποδομές που σχετίζονται με την τεχνητή νοημοσύνη, κυρίως κέντρα δεδομένων και εξοπλισμό δικτύωσης
Αυξάνεται η χρήση ΑΙ στις επιχειρήσεις της ΕΕ, χαμηλά η Ελλάδα - Οι πιο δημοφιλείς τεχνολογίες
Μόλις μία στις δέκα ελληνικές επιχειρήσεις αξιοποιούν την τεχνητή νοημοσύνη για να φέρουν σε πέρας κάποια δρατηριότητα
«Ανασταίνουν» δυο πυρηνικούς αντιδραστήρες στη Νότια Καρολίνα για να καλύψουν τη ζήτηση της ΑΙ
Οι απαιτήσεις σε ενέργεια για τις εφαρμογές ΑΙ, οδηγούν τις Big Tech σε συμφωνίες. Η Microsoft εμπλέκεται στην επανεκκίνηση του Three Mile Island στην Πενσυλβάνια.
Τιτανομαχία στα ΑΙ chips - Πώς η Huawei «κοντράρει» την Nvidia
Η Huawei προωθεί τα τσιπ τεχνητής νοημοσύνης της ως υλικό επιλογής για εργασίες εξαγωγής συμπερασμάτων
Ο Τραμπ «φέρνει» επενδύσεις 500 δισ. σε υποδομές AI στον ιδιωτικό τομέα
Ο Ντόναλντ Τραμπ αναμένεται να ανακοινώσει έως και 500 δισεκατομμύρια δολάρια επενδύσεις σε υποδομές τεχνητής νοημοσύνης στον ιδιωτικό τομέα
Σκληρός Ιανουάριος για την Apple - Oι καταναλωτές δε βρίσκουν ακόμη χρήσιμο τo smartphone AI
Η εταιρεία υποβαθμίστηκε σε hold από την Loop Capital και σε underperform από την Jefferies.
Η ΑΙ θα φέρει πρωτοφανή αυτονομία στις επιχειρήσεις - Τι εκτιμά η Accenture Technology Vision 2025
Η 25η ετήσια έκδοση εξερευνά το μέλλον, όπου η τεχνητή νοημοσύνη επηρεάζει τα πάντα, από την εμπειρία των πελατών μέχρι το παγκόσμιο εργατικό δυναμικό
Προσφορά για συγχώνευση με το TikTok, υπέβαλε η Perplexity
Η πρόταση της Perplexity έγινε ενώ παράλληλα διακινείται ότι μπορει να εκδηλωθεί κάποια πρωτοβουλία εκ μέρους του νέου αμερικανού προέδρου Ντόναλντ Τράμπ
Η Amazon προχωρά σε μεταμόσχευση «εγκεφάλου» στην Alexa
Η κυκλοφορία του αναβαθμισμένου φωνητικού βοηθού χτυπήθηκε από καθυστερήσεις καθώς η Amazon προσπαθεί να ξεπεράσει τεχνικά εμπόδια