Ο όρος Μηχανική Μάθηση (Machine Learning) εισήχθη από τον Arthur Samuel, ενώ εργαζόταν για την IBM το 1959, κυρίως για να περιγράψει τις εργασίες αναγνώρισης προτύπων που παρείχαν τη συνιστώσα “μάθησης” στα πρωτοποριακά τότε συστήματα Τεχνητής Νοημοσύνης (ΤΝ). Η έννοια της Τεχνητής Νοημοσύνης διερευνήθηκε θεωρητικά και δοκιμαστικά από τη δεκαετία του 1930, αν και μελετήθηκε πιο συστηματικά μετά το περίφημο Dartmouth Workshop του 1956 (Kline 2011). Εκεί, μεταξύ άλλων, ο John McCarthy, ερευνητής στο ΜΙΤ εκείνη την εποχή, πρότεινε τον όρο Τεχνητή Νοημοσύνη έναντι της Κυβερνητικής (Cybernetics).
Σε αυτά τα πρώτα χρόνια, τα συστήματα Machine Learning θεωρούνταν μόνο ως μέρος ενός ευρύτερου συστήματος Τεχνητής Νοημοσύνης. Έκτοτε, το φάσμα των πρακτικών εφαρμογών της Μηχανικής Μάθησης είναι πολύ ευρύ, ξεπερνώντας τα στενά όρια που όριζε το πλαίσιο της ΤΝ. Σήμερα, υπάρχουν περισσότερα αυτόνομα συστήματα Machine Learning απ’ ό,τι υπάρχουν στοιχεία Machine Learning σε αρχιτεκτονικές ΤΝ.
Οι όροι Artificial Intelligence και Machine Learning συχνά εναλλάσσονται καταχρηστικά για πολλούς λόγους (μόδα, χρηματοδότηση ή ακόμη και άγνοια), δημιουργώντας σύγχυση στους μη ειδικούς. Ένας γενικός κανόνας είναι ότι αν το σύστημα ενεργεί χωρίς παρέμβαση, τότε μάλλον πρόκειται για ΤΝ. Εάν το σύστημα ταξινομεί ή προβλέπει μέσω μάθησης, τότε πρόκειται για Machine Learning.
Η διαδικασία της μάθησης στον υπολογιστή καθιερώθηκε το 1997 από τον καθηγητή Tom M. Mitchel του Πανεπιστημίου Carnegie Mellon, στο διάσημο απόσπασμα του λέει (1997): “Ένα πρόγραμμα υπολογιστή λέγεται ότι μαθαίνει από την εμπειρία Ε σε σχέση με κάποια κατηγορία εργασιών Τ και μέτρο απόδοσης Ρ, αν η απόδοσή του σε εργασίες της Τ, όπως μετράται από το Ρ, βελτιώνεται με την εμπειρία Ε”. Τα αυτοκινούμενα αυτοκίνητα χρησιμοποιούν συστήματα ΤΝ, το σύστημα αυτόματης όρασης που αναγνωρίζει ένα επικείμενο ατύχημα είναι Machine Learning.
Κατά τη διάρκεια αυτής της επιστημονικής εξέλιξης, η Machine Learning ακολούθησε τη μοίρα της ΤΝ και γνώρισε μεγάλες περιόδους χαμηλού ενδιαφέροντος και χαμηλής χρηματοδότησης, που συχνά αναφέρονται ως “χειμώνες της ΤΝ”. Παρ’ όλα αυτά, η παρούσα περίοδος είναι αρκετά διαφορετική, καθώς η χρονική στιγμή των πρόσφατων τεχνολογικών εξελίξεων και της έναρξης των νέων δομών του Machine Learning συμπίπτει ιδανικά. Οι προσιτοί μεγάλης υπολογιστικής ισχύος υπολογιστές επέτρεψαν τη χρήση πολύπλοκων και απαιτητικών αρχιτεκτονικών Βαθιάς Μάθησης (DL), όπως τα Recurrent Neural Networks και τα Convolutive Neural Networks, σε κοινές καθημερινές εφαρμογές. Επιπλέον, αλγόριθμοι όπως τα Support Vector Machines και τα Random Forests και τεχνικές όπως kernelization, bagging και boosting επέτρεψαν για πρώτη φορά την εφαρμογή της Machine Learning σε σχετικά μικρά σύνολα δεδομένων. Επιπλέον, η διαθεσιμότητα δωρεάν βιβλιοθηκών Deep Learning ανοικτού κώδικα (που υποστηρίζονται από εμπορικούς κολοσσούς), όπως το TensorFlow και το PyTorch, απλοποίησε τη χρήση της DL για όλους.
Η εφαρμογή της Μηχανικής Μάθησης σε οικονομικά προβλήματα μπορεί να εντοπιστεί ήδη από το 1974 (Lee and Lee 1974), αν και μόνο ως απλή αναφορά στην περίληψη. Η πρώτη εργασία που συναντήσαμε να εφαρμόζει πραγματικά μια μεθοδολογία Machine Learning αποκλειστικά σε ένα οικονομικό πρόβλημα είναι η μελέτη των Wang et al. (1984). Η εργασία υιοθετεί τον όρο Artificial Intelligence, αν και πιθανότατα πρόκειται για κατάχρηση σύμφωνα με τη διάκριση που κάναμε παραπάνω, και ο σωστός όρος θα έπρεπε να είναι Machine Learning. Το 1988 ο White, δημοσίευσε μια εργασία που αφορούσε μια εφαρμογή Νευρωνικών Δικτύων (ΝΝ) για την πρόβλεψη των ημερήσιων αποδόσεων των μετοχών της IBM. Έκτοτε, η εμφάνιση του Machine Learning στα οικονομικά αυξάνεται σταθερά. Αρχικά, εφαρμόστηκε στην πρόβλεψη χρηματοοικονομικών χρονοσειρών, όπου είναι ευρέως διαθέσιμα μεγάλα σύνολα δεδομένων. Τα συστήματα Machine Learning εκείνης της εποχής απαιτούσαν -για αποτελεσματική εκπαίδευση- εκτεταμένα σύνολα δεδομένων που δεν υπήρχαν σε άλλους τομείς των οικονομικών. Επιπλέον, η εκπαίδευση ήταν πολύ χρονοβόρα λόγω της -συγκριτικά- χαμηλής επεξεργαστικής ισχύος των υπολογιστών της εποχής.
Σήμερα, η χρήση πολλών νέων αρχιτεκτονικών Machine Learning που δεν απαιτούν αδικαιολόγητα μεγάλα σύνολα δεδομένων, αποτελεί μια ενδιαφέρουσα και πολλά υποσχόμενη κατεύθυνση στην οικονομική πρόβλεψη. Αυτό ισχύει όχι μόνο για χρηματοοικονομικά προβλήματα, αλλά και για μακροοικονομικές ή μικροοικονομικές εφαρμογές όπου τα σύνολα δεδομένων είναι εγγενώς περιορισμένου μεγέθους. Ως αποτέλεσμα, οι πρόσφατες εφαρμογές Machine Learning σε (για παράδειγμα) επιχειρηματικούς κύκλους και πρόβλεψη ύφεσης φαίνονται πολύ επιτυχημένες σε σύγκριση με τα παραδοσιακά εμπειρικά μοντέλα. Επί του παρόντος, συναντάμε νέες μεθοδολογίες που συνενώνουν και συνδυάζουν την οικονομετρία με την Machine Learning (π.χ. Garch-SVM). Επιπλέον, είναι ενδιαφέρον πώς οι τεχνικές Machine Learning και οι εμπειρικές διαδικασίες όπως η διασταυρούμενη επικύρωση είναι πλέον δημοφιλείς και υιοθετούνται σταθερά στις παραδοσιακές μεθοδολογίες της Οικονομετρίας.
* Περικλής Γκόγκας, Καθηγητής Οικονομικής Ανάλυσης και Διεθνών Οικονομικών, Τμήμα Οικονομικών Επιστημών Δημοκρίτειου Πανεπιστήμιου Θράκης
Δημοσίευση:
Machine Learning in Economics and Finance, Periklis Gogas & Theophilos Papadimitriou, Computational Economics volume 57, pages 1–4 (2021)
Latest News
Μνημόνιο συνεργασίας Pfizer με ΠΑΜΑΚ για την καινοτομία
Συν-δημιουργία μαθήματος με τίτλο «Ψηφιακή Καινοτομία και Συστήματα Μεταφοράς Τεχνολογίας» η πρώτη πρωτοποριακή δράση
Κωνσταντίνος Δράκος: Κρυπτονομίσματα και οι τάσεις
Σε αυτό το επεισόδιο υποδεχόμαστε τον Κωνσταντίνο Δράκο, Καθηγητή Χρηματοοικονομικής του Τμήματος Λογιστικής και Χρηματοοικονομικής του Οικονομικού Πανεπιστημίου Αθηνών.
Οι 4 λόγοι ανόδου των τιμών ενέργειας – Το καλό και το κακό σενάριο
Η διατήρηση των υψηλών τιμών του φυσικού αερίου αποτελεί σημαντικό παράγοντα κινδύνου για τον πληθωρισμό στην Ευρωζώνη
Κρατικές Δαπάνες και Πλαίσιο Φορολογικής Πολιτικής μετά την Μεταπολίτευση – Η περίπτωση της Ελλάδας
Ιστορική Αποτύπωση, Τεκμηρίωση Νομοθετικών Αλλαγών και Μακροοικονομική Επίδραση