![Τεχνητή νοημοσύνη: Τι είναι το «data wall» και πώς μπορεί να την επηρεάσει](https://www.ot.gr/wp-content/uploads/2024/04/ot_ai1.png)
Η τεχνητή νοημοσύνη έχει αρχίσει να βρίσκεται σιγά-σιγά μπροστά από ένα σοβαρό πρόβλημα το οποίο αν δεν λυθεί θα επηρεάσει σε σημαντικό βαθμό τις εταιρείες που κάνουν χρήση της αλλά και τα μεγάλα γλωσσικά τους μοντέλα. Το πρόβλημα αυτό, όπως σημειώνει σε δημοσίευμά του ο Economist ονομάζεται «data wall» και βάσει αυτού, αναμένεται πως όλα τα λεξιλογικά δεδομένα που θα μπορεί να χρησιμοποιήσουν οι εταιρείες ΑΙ θα τελειώσουν το 2028.
Το πώς θα αντιμετωπιστεί αυτό το τείχος είναι ένα από τα μεγάλα ερωτήματα της ΑΙ και ίσως το πιο πιθανό να επιβραδύνει την πρόοδό της. Το «data wall» εξηγεί και γιατί το Reddit, μια ηλεκτρονική πλατφόρμα που αποτελείται από μεγάλες συζητήσεις χρηστών που βασίζονται κατά κύριο λόγο σε λέξεις και όχι εικόνες έχει βρεθεί στο ενδιαφέρον των εταιρειών ΑΙ και ειδικότερα των Google και OpenAI.
Η πρωτοκαθεδρία των ΗΠΑ στην ΑΙ και οι σοσιαλιστικές αξίες της Κίνας
Πώς μπορεί να αποφευχθεί το data wall
Μια προσέγγιση, σημειώνει ο Economist είναι να επικεντρωθούν στην ποιότητα των δεδομένων και όχι στην ποσότητα.Τα εργαστήρια ΑΙ δεν εκπαιδεύουν απλώς τα μοντέλα τους σε ολόκληρο το διαδίκτυο. Φιλτράρουν τα δεδομένα για να μεγιστοποιήσουν το βαθμό εκμάθησης των μοντέλων τους.
Ο Ναβίν Ράο της Databricks, μιας εταιρείας τεχνητής νοημοσύνης, λέει ότι αυτό είναι το «βασικό διαφοροποιητικό στοιχείο» μεταξύ των μοντέλων τεχνητής νοημοσύνης στην αγορά. Οι «αληθινές πληροφορίες» για τον κόσμο έχουν προφανώς σημασία το ίδιο ισχύει και για τη «λογική». Αυτό καθιστά τα ακαδημαϊκά εγχειρίδια, για παράδειγμα, ιδιαίτερα πολύτιμα. Αλλά ο καθορισμός της ισορροπίας μεταξύ των πηγών δεδομένων παραμένει κάτι σαν «σκοτεινή» τέχνη. Επιπλέον, έχει σημασία και η σειρά με την οποία το σύστημα συναντά διαφορετικούς τύπους δεδομένων. Αν συγκεντρώσει κάποιος όλα τα δεδομένα για ένα θέμα, όπως τα μαθηματικά, στο τέλος της διαδικασίας εκπαίδευσης, το μοντέλο μπορεί να εξειδικευτεί στα μαθηματικά αλλά να ξεχάσει κάποιες άλλες έννοιες.
Αυτές οι εκτιμήσεις μπορεί να γίνουν ακόμη πιο πολύπλοκες όταν τα δεδομένα δεν αφορούν απλώς διαφορετικά θέματα αλλά διαφορετικές μορφές. Εν μέρει λόγω της έλλειψης νέων δεδομένων κειμένου, κορυφαία μοντέλα όπως το GPT-4 της OpenAI και το Gemini της Google δέχονται αρχεία εικόνας, βίντεο και ήχου καθώς και κείμενα κατά τη διάρκεια της αυτοεπιβλεπόμενης μάθησής τους. Η εκπαίδευση σε βίντεο είναι πιο δύσκολη, δεδομένου ότι τα αρχεία βίντεο είναι πυκνά σε δεδομένα. Τα τρέχοντα μοντέλα συνήθως εξετάζουν ένα υποσύνολο καρέ για να απλοποιήσουν τα πράγματα.
Προσωπικά δεδομένα και τεχνητή νοημοσύνη
Όποια και αν είναι τα μοντέλα που χρησιμοποιούνται, η ιδιοκτησία αναγνωρίζεται όλο και περισσότερο ως ζήτημα. Το υλικό που χρησιμοποιείται στην εκπαίδευση των Μεγάλων Γλωσσικών Μοντέλων (LLMs) συχνά προστατεύεται από πνευματικά δικαιώματα και χρησιμοποιείται χωρίς τη συγκατάθεση ή την πληρωμή των κατόχων των δικαιωμάτων.
Η Getty Images μήνυσε την Stability ai, μια εταιρεία παραγωγής εικόνων, για μη εξουσιοδοτημένη χρήση των εικόνων της. Οι New York Times έχουν μηνύσει την OpenΑΙ και τη Microsoft για παραβίαση πνευματικών δικαιωμάτων εκατομμυρίων άρθρων. Άλλες εφημερίδες έχουν συνάψει συμφωνίες για την αδειοδότηση του περιεχομένου τους. Η News Corp, ιδιοκτήτρια της Wall Street Journal, υπέγραψε συμφωνία αξίας 250 εκατ. δολαρίων για πέντε χρόνια.
Οι δυνατότητες των μοντέλου μπορούν επίσης να βελτιωθούν όταν η έκδοση που παράγεται από την αυτοεπιβλεπόμενη μάθηση, γνωστή ως προ-εκπαιδευμένη έκδοση, βελτιώνεται με πρόσθετα δεδομένα κατά τη «μετεκπαίδευση». Καθώς τα δεδομένα προεκπαίδευσης στο διαδίκτυο στερεύουν, η «μετεκπαίδευση» είναι πιο σημαντική.
Συνθετικά δεδομένα
Μια άλλη λύση για να μην έρθει σε τέλμα η τεχνητή νοημοσύνη θα ήταν η χρήση συνθετικών δεδομένων, τα οποία δημιουργούνται από μηχανές και συνεπώς είναι απεριόριστα, σημειώνει ο Economist.
Αντί να σπρώχνουμε το τείχος δεδομένων πίσω λίγο-λίγο, μια άλλη λύση θα ήταν να το υπερπηδήσουμε εντελώς. Μια προσέγγιση είναι η χρήση συνθετικών δεδομένων, τα οποία δημιουργούνται από μηχανές και συνεπώς είναι απεριόριστα.
Μια ακόμη δυσκολία έγκειται στην επέκταση της ΑΙ σε περιβάλλοντα όπως η υγειονομική περίθαλψη ή η εκπαίδευση. Στα τυχερά παιχνίδια, υπάρχει σαφής ορισμός της νίκης και είναι ευκολότερο να συλλεχθούν δεδομένα σχετικά με το αν μια κίνηση είναι συμφέρουσα. Αλλού είναι πιο δύσκολο. Τα δεδομένα σχετικά με το τι είναι μια «καλή» απόφαση συλλέγονται συνήθως από ειδικούς. Αλλά αυτό είναι δαπανηρό, απαιτεί χρόνο και είναι μόνο μια αποσπασματική λύση, ενώ ο εμπειρογνώμονας μπορεί να κάνει κάποιο λάθος.
Είναι σαφές ότι η πρόσβαση σε περισσότερα δεδομένα -είτε προέρχονται από εξειδικευμένες πηγές, είτε παράγονται συνθετικά είτε παρέχονται από ανθρώπινους εμπειρογνώμονες- είναι το κλειδί για τη διατήρηση της ταχείας προόδου στην ΑΙ. Όπως και τα κοιτάσματα πετρελαίου, τα πιο προσιτά αποθέματα δεδομένων έχουν εξαντληθεί. Η πρόκληση τώρα είναι να βρεθούν νέα ή βιώσιμες εναλλακτικές λύσεις, καταλήγει ο Economist.
![ot.gr](/wp-content/themes/whsk_otgr/common/imgs/fav.ico/favicon-32x32.png)
![ot.gr](/wp-content/themes/whsk_otgr/common/imgs/fav.ico/favicon-32x32.png)
Latest News
![Ιλον Μασκ: Θέλει να γεμίσει τα εργοστάσια με ανθρωποειδή ρομπότ [γράφημα]](https://www.ot.gr/wp-content/uploads/2024/07/ot_Musk_Robot_optimus-600x352.png)
Ο Μασκ θέλει να γεμίσει τα εργοστάσια με ανθρωποειδή ρομπότ [Γράφημα]
O Ιλον Μασκ πιστεύει ότι το Optimus θα μπορεί από το 2025 να έχει εξελιχθεί τόσο ώστε να μπορεί να εκτελεί εργασίες βιομηχανικής παραγωγής
![Μασκ: Τα χαμηλότερα κέρδη για την Tesla και η καθυστέρηση στα «ρομποταξί»](https://www.ot.gr/wp-content/uploads/2024/07/2024-06-11T210046Z_1335884131_RC2FK1A1S7OG_RTRMADP_5_OPENAI-MUSK-600x400.jpg)
Τα χαμηλότερα κέρδη για την Tesla του Μασκ και η καθυστέρηση στα «ρομποταξί»
Οι μετοχές πέφτουν παρά τον ισχυρισμό του Μασκ ότι τα σχέδια για τον «αυτόνομο στόλο» θα μεταμορφώσουν την αγοραστική αξία της εταιρείας
![Τεχνητή νοημοσύνη: Η πρωτοκαθεδρία των ΗΠΑ και οι σοσιαλιστικές αξίες της Κίνας](https://www.ot.gr/wp-content/uploads/2023/02/ot_artificial23-600x352.png)
Η πρωτοκαθεδρία των ΗΠΑ στην ΑΙ και οι σοσιαλιστικές αξίες της Κίνας
Οι ΗΠΑ πρωτοπορούν και ξοδεύουν για ΑΙ
![Τεχνητή νοημοσύνη: Έως το 2025 πραγματικότητα οι AI «εργάτες» που θα μιλούν μεταξύ τους](https://www.ot.gr/wp-content/uploads/2024/04/ot_ai2-600x352.png)
AI «εργάτες» που θα μιλούν μεταξύ τους έρχονται το 2025
Τι προβλέπει η εταιρεία παροχής τεχνολογικών υπηρεσιών Capgemini
![Τεχνητή νοημοσύνη: Η Google εκπαιδεύει το ελληνικό Δημόσιο](https://www.ot.gr/wp-content/uploads/2024/07/2024-07-17T151912Z_2045698199_RC2Q56AG2GX0_RTRMADP_5_BRITAIN-TECH-REGULATION-600x375.jpg)
Η Google εκπαιδεύει το ελληνικό Δημόσιο στην AI
Το πρόγραμμα της Google ξεκίνησε με 500 δημοσίους υπαλλήλους και θα επεκταθεί από τον Σεπτέμβριο σε όλες τις δημόσιες υπηρεσίες.
![Nvidia: Επέλαση στην κινεζική αγορά με νέο AI chip](https://www.ot.gr/wp-content/uploads/2024/02/ot_nvidia1-600x352.png)
Με νέο AI chip επελαύνει στην κινεζική αγορά η Nvdia
Η Nvidia αποκάλυψε τον περασμένο Μάρτιο τη σειρά chip «Blackwell», η οποία πρόκειται να παραχθεί μαζικά αργότερα μέσα στο έτος
![AI στην υπηρεσία του Ισλαμικού Κράτους](https://www.ot.gr/wp-content/uploads/2023/12/artificial-768x487-1-600x380.jpg)
AI στην υπηρεσία του Ισλαμικού Κράτους
Ο κόσμος της Τεχνητής Νοημοσύνης είναι συναρπαστικός, αλλά και επικίνδυνος - Aνησυχία προκαλεί η μαζική χρήση της από εξτρεμιστές για προπαγάνδα και παραπληροφόρηση
![Generative AI: Η Κίνα ηγείται στη χρήση, οι ΗΠΑ πρωτοστατούν στην εφαρμογή της](https://www.ot.gr/wp-content/uploads/2024/06/ot_ai-600x352.png)
Generative AI: Η Κίνα ηγείται στη χρήση, οι ΗΠΑ πρωτοστατούν στην εφαρμογή της
Το απόρρητο των δεδομένων, η ασφάλεια και η διακυβέρνηση αποτελούν πρωταρχικές προκλήσεις σχετικά με την Generative AI
![OpenAI: Λανσάρει μίνι έκδοση του πιο ισχυρού μοντέλου της μέχρι σήμερα](https://www.ot.gr/wp-content/uploads/2023/04/2023-03-31T171746Z_72599877_RC2Y40AKA9Y5_RTRMADP_5_AI-COMPANIES-OPENAI-600x396.jpg)
Η OpenAI λανσάρει μίνι έκδοση του πιο ισχυρού μοντέλου της
Τι είναι το GPT-4o mini
![Generative AI: Η προστιθέμενη αξία που φέρνει στον τομέα της κυβερνοασφάλειας](https://www.ot.gr/wp-content/uploads/2024/04/ot_ai2-600x352.png)
Η προστιθέμενη αξία που φέρνει το GenAI στον τομέα της κυβερνοασφάλειας
Η Deloitte παρουσίασε ένα πρακτικό οδηγό γύρω από το Generative ΑΙ και την προστιθέμενη αξία που προσφέρει στον ευαίσθητο τομέα της Ασφάλειας Πληροφοριών