
Σε μια προσπάθεια να μειώσει το λειτουργικό κόστος, η κινεζική DeepSeek που «τάραξε τα νερά» στο χώρο της ΑΙ , συνεργάζεται με το Πανεπιστήμιο Tsinghua για τη μείωση της εκπαίδευσης που χρειάζονται τα μοντέλα τεχνητής νοημοσύνης της.
Η κινεζική startup, η οποία αναστάτωσε τις αγορές με το χαμηλού κόστους μοντέλο συλλογιστικής που εμφανίστηκε τον Ιανουάριο, συνεργάστηκε με ερευνητές από το ίδρυμα του Πεκίνου σε ένα έγγραφο που περιγράφει λεπτομερώς μια νέα προσέγγιση στην ενισχυτική μάθηση για να γίνουν τα μοντέλα πιο αποδοτικά.
Η νέα μέθοδος έχει ως στόχο να βοηθήσει τα μοντέλα τεχνητής νοημοσύνης να τηρούν καλύτερα τις ανθρώπινες προτιμήσεις, προσφέροντας ανταμοιβές για πιο ακριβείς και κατανοητές απαντήσεις, έγραψαν οι ερευνητές.
Η ενισχυτική μάθηση έχει αποδειχθεί αποτελεσματική στην επιτάχυνση των εργασιών της τεχνητής νοημοσύνης σε στενές εφαρμογές και τομείς. Ωστόσο, η επέκτασή της σε πιο γενικές εφαρμογές έχει αποδειχθεί πρόκληση – και αυτό είναι το πρόβλημα που προσπαθεί να λύσει η ομάδα της DeepSeek με κάτι που αποκαλεί ρύθμιση κριτικής με βάση τις αρχές του εαυτού της.
Καλύτερες επιδόσεις
Η στρατηγική ξεπέρασε τις υπάρχουσες μεθόδους και μοντέλα σε διάφορα benchmarks και το αποτέλεσμα έδειξε καλύτερες επιδόσεις με λιγότερους υπολογιστικούς πόρους, σύμφωνα με το έγγραφο που επικαλείται το Bloomberg.
Η DeepSeek ονομάζει αυτά τα νέα μοντέλα DeepSeek-GRM – συντομογραφία για τη «γενικευμένη μοντελοποίηση ανταμοιβής» – και θα τα κυκλοφορήσει σε βάση ανοιχτού κώδικα, δήλωσε η εταιρεία.
Άλλοι προγραμματιστές τεχνητής νοημοσύνης, συμπεριλαμβανομένου του κινεζικού τεχνολογικού γίγαντα Alibaba Group Holding Ltd. και της OpenAI με έδρα το Σαν Φρανσίσκο, προωθούνται επίσης σε ένα νέο σύνορο βελτίωσης της συλλογιστικής και των δυνατοτήτων αυτο-αναβάθμισης, ενώ ένα μοντέλο τεχνητής νοημοσύνης εκτελεί εργασίες σε πραγματικό χρόνο.
Η Meta Platforms Inc. με έδρα το Menlo Park της Καλιφόρνιας κυκλοφόρησε την τελευταία οικογένεια μοντέλων τεχνητής νοημοσύνης, το Llama 4, το Σαββατοκύριακο και τα χαρακτήρισε ως τα πρώτα που χρησιμοποιούν την αρχιτεκτονική Mixture of Experts (MoE).
Τα μοντέλα της DeepSeek βασίζονται σημαντικά στην MoE για την αποδοτικότερη χρήση των πόρων και η Meta έκανε συγκριτική αξιολόγηση της νέας της έκδοσης με τη νεοσύστατη εταιρεία με έδρα την Hangzhou. Η DeepSeek δεν έχει διευκρινίσει πότε μπορεί να κυκλοφορήσει το επόμενο μοντέλο-ναυαρχίδα της.


Latest News

Η επόμενη μέρα των ΜμΕ με όρους AI: Από τη συμμόρφωση στην ανταγωνιστικότητα
H τεχνητή νοημοσύνη και η ψηφιακή ωριμότητα των ελληνικών επιχειρήσεων ήταν το θέμα του πάνελ με τίτλο «Tech Forward: The Future of Greek Business» στο Φόρουμ των Δελφών
![Data Centers: Η ΑΙ εκτοξεύει την παγκόσμια παραγωγή ενέργειας [γράφημα]](https://www.ot.gr/wp-content/uploads/2025/02/datt-600x400.jpeg)
Η ΑΙ εκτοξεύει την παγκόσμια παραγωγή ενέργειας - Τα data centers οδηγούν τη ζήτηση [γράφημα]
Σύμφωνα με τις προβλέψεις του ΔΟΕ, η συνολική ζήτηση ηλεκτρικής ενέργειας από τα data centers αναμένεται να υπερδιπλασιαστεί έως το 2030

ΟΤ Delphi Economic Forum Χ-Yanis Ben Amor: Το μέλλον της ΑΙ στην Ελλάδα – Οι κίνδυνοι και οι δυνατότητες της νέας τεχνολογίας
Μιλώντας στο ΟΤ Delphi Economic Forum Χ, ο Yanis Ben Amor, αναφέρθηκε στο πως θα πρέπει να χρησιμοποιήσουμε με σωστό τρόπο την ΑΙ

ΟΤ Delphi Economic Forum X – Δουκίδης (ΟΠΑ): Πρέπει να δούμε ανά κλάδο τις επιπτώσεις των δασμών Τραμπ
Στον ΟΤ στο πλαίσιο του Delphi Economic Forum X μίλησε ο Γιώργος Δουκίδης, καθηγητής ηλεκτρονικού επιχειρείν στο ΟΠΑ

Τελευταία ευκαιρία για τη Δ. Μακεδονία - Το σχέδιο της ΔΕΗ και το «καμένο» master plan του 2020
Το ρεαλιστικό σχέδιο της ΔΕΗ για τη μετάβαση στη Δυτική Μακεδονία - Η αποτυχία του master plan του 2020 για την απολιγνιτοποίηση

Ο ναυτιλιακός γίγαντας CMA CGM ενώνει τις δυνάμεις του με startup ΑΙ
Η πενταετής συνεργασία Uα ανεβάσει τις δαπάνες που σχετίζονται με την τεχνητή νοημοσύνη της CMA CGM στα 500 εκατ. ευρώ

Πότε θα κυριαρχήσει η ΑΙ στον πλανήτη - Η πρόβλεψη του Μπιλ Γκέιτς
Ο Γκέιτς αναγνωρίζει ότι η ταχύτητα που αναπτύσσει η τεχνητή νοημοσύνη είναι πραγματικά τρομακτική και ότι πιθανότατα οι άνθρωποι θα δουν τις δουλειές τους να αντικαθίστανται πολύ σύντομα

Η προειδοποίηση της Ελλάδας στον ΟΗΕ: «Χωρίς κοινό ρυθμιστικό πλαίσιο η ΑΙ μπορεί να απειλήσει την ειρήνη»
Ο μόνιμος αντιπρόσωπος της Ελλάδας, πρέσβης Ευάγγελος Σέκερης, υπογράμμισε τη σημασία της συνεργασίας για την αντιμετώπιση των προκλήσεων που επιφέρει η τεχνητή νοημοσύνη.

Τεχνητή νοημοσύνη: Οι γίγαντες του άνθρακα φεύγουν, τα AI data centers έρχονται
Οι ενεργειακές ανάγκες που δημιουργεί η τεχνητή νοημοσύνη «κατασκευάζουν» τον μεγαλύτερο σταθμό ηλεκτροπαραγωγής με φυσικό αέριο των ΗΠΑ ανατολικά του Πίτσμπουργκ

Ο Michael Kratsios σε θέση «κλειδί» στον Λευκό Οίκο - Τα «πυρά» στην Κίνα από το OT Forum
Ο Michael Kratsios θα βρίσκεται στην αιχμή του δόρατος της τεχνολογικής μάχης των ΗΠΑ με την Κίνα στην τεχνητή νοημοσύνη