Μια έξυπνη πλατφόρμα τεχνητής νοημοσύνης που στοχεύει στην ψηφιακή απεικόνιση και διαχείριση κειμένων ιστορικών ελληνικών βιβλίων, γραμμένων σε πολυτονικό σύστημα, ανέπτυξε η ομάδα Ψηφιακής Επεξεργασίας Εγγράφων του Εργαστηρίου Υπολογιστικής Ευφυίας του Εθνικού Κέντρου Έρευνας Φυσικών Επιστημών «Δημόκριτος».
Η εφαρμογή παρουσιάζεται στο Athens Science Festival, το οποίο φιλοξενείται μέχρι αύριο Κυριακή 21 Απριλίου στην Τεχνόπολη του Δήμου Αθηναίων.
Η πλατφόρμα αναπτύχθηκε στο πλαίσιο του έργου «reBook», που υλοποιείται σε συνεργασία με τον Σύλλογο Προς Διάδοσιν Ωφελίμων Βιβλίων (ΣΩΒ) και την εταιρεία Innews, στο πλαίσιο του ΕΣΠΑ 2014-2020.
Στόχος του έργου είναι η ανάπτυξη νέων τεχνικών και μεθοδολογιών αναγνώρισης κειμένων, κυρίως γραμμένων σε πολυτονικό σύστημα, για την επιστημονική τεκμηρίωση της πολιτιστικής κληρονομιάς.
Βιβλία από τις αρχές του 20ού αιώνα
Με τη βοήθεια της εφαρμογής ερευνητές του Δημόκριτου ψηφιοποιούν και επανεκδίδουν ψηφιακά, περίπου 100 βιβλία από τα αρχεία του ΣΩΒ, τα οποία χρονολογούνται από τις αρχές του 20ου αιώνα και μετά.
Ανάμεσα σε αυτά βρίσκονται το σύγγραμμα του Αδαμάντιου Κοραή «Επιστολαί προς τον Πρωτοψάλτην», που εκδόθηκε το 1911 και επανεκδόθηκε το 1959. Επίσης, το βιβλίο «Η ελληνικότης των νομών Προύσης και Σμύρνης» του Παντελή Κοντογιάννη, που πρωτοεκδόθηκε το 1919.
Στην εφαρμογή ανεβαίνουν εικόνες σκαναρισμένων βιβλίων και στη συνέχεια με τη βοήθεια της τεχνητής νοημοσύνης αναγνωρίζεται το κείμενο της κάθε εικόνας, ακόμα και αν είναι γραμμένο σε πολυτονικό σύστημα.
Επίσης, στο στάδιο της προεπεξεργασίας της κάθε εικόνας, η εφαρμογή διορθώνει τα προβλήματα που μπορεί να έχει η εικόνα του βιβλίου, από το στραβό σκανάρισμα μέχρι τη διόρθωση ξεθωριασμένων σελίδων.
Η σημασία της αναγνώρισης του πολυτονικού από την εφαρμογή
«Υπάρχει ένας τεράστιος όγκος βιβλίων που δεν είναι διαθέσιμα ψηφιακά και θέλουμε να τα κάνουμε διαθέσιμα, να βγάλουμε στην επιφάνεια τεκμήρια, τα οποία είναι στα ντουλάπια και τα ράφια βιβλιοθηκών. Οπότε ο στόχος μας είναι ιστορικά βιβλία να φτάσουν στο ευρύ κοινό και τους ερευνητές», εξηγεί στο ΑΠΕ-ΜΠΕ η Κατερίνα Χριστοπούλου, υποψήφια διδάκτορας Οικολογίας Τοπίου και επιστημονική συνεργάτιδα του «Δημόκριτου».
Εξηγώντας την αξία της εφαρμογής η κ. Χριστοπούλου επισημαίνει ότι «δεν βλέπουμε απλά ένα pdf με την εικόνα της σελίδας, αλλά η εικόνα έχει από πίσω την οπτική αναγνώριση χαρακτήρων (OCR), οπότε ο αναγνώστης μπορεί να χρησιμοποιήσει τμήματα του αρχείου ή να κάνει αναζήτηση μέσα σε αυτό».
Η μεγάλη διαφορά όμως της εφαρμογής έγκειται «στην ανάγνωση του πολυτονικού συστήματος».
Athens Science Festival #innovation #athens #athenssciencefestival #asf10years pic.twitter.com/GB2YUUe3Ji
— Alex Anag (@AlexAnag) April 18, 2024
Ψηφιοποίηση 150 εκδόσεων του Σέξπιρ
Δεν είναι η πρώτη φορά που το Εργαστήριο Υπολογιστικής Ευφυΐας του Ινστιτούτου Πληροφορικής και Τηλεπικοινωνιών του Δημόκριτου ασχολείται με την επεξεργασία και αναγνώριση ιστορικών εγγράφων.
Σε αντίστοιχο έργο που υλοποίησε σε συνεργασία με το Πανεπιστήμιο Κύπρου προχώρησε στην ψηφιοποίηση με την ίδια μέθοδο πολυτονικών κειμένων από περίπου 150 εκδόσεις έργων του Σέξπιρ στα ελληνικά.
Πρόκειται για μεταφράσεις που υπέγραψαν σπουδαίοι λογοτέχνες, όπως ο Κωνσταντίνος Καβάφης, ο Κωνσταντίνος Θεοτόκης και ο Δημήτριος Βικέλας, και οι οποίες προέρχονται μεταξύ άλλων από τις συλλογές της Βιβλιοθήκης της Βουλής, της Εθνικής Βιβλιοθήκης και του Ελληνικού Λογοτεχνικού και Ιστορικού Αρχείου.
Χειρόγραφα, το μεγάλο στοίχημα
Ένα από τα στοιχήματα που έχει βάλει το Εργαστήριο είναι η ψηφιακή απεικόνιση χειρογράφων.
«Η αναγνώριση χειρογράφων στα σύγχρονα κείμενα έχει προχωρήσει πολύ. Αυτό που δεν είχε γίνει στο παρελθόν είναι κάποιο εργαλείο που να μπορεί να αναγνωρίσει τα παλιά χειρόγραφα και ιδίως τα ελληνικά πολυτονικά», εξηγεί στο ΑΠΕ-ΜΠΕ ο υπεύθυνος του Εργαστηρίου, Βασίλης Γάτος.
Αυτή την περίοδο βρίσκεται σε εξέλιξη έργο σε συνεργασία με την Τράπεζα της Ελλάδας για την αναγνώριση και επεξεργασία, και πάλι με τη βοήθεια τεχνητής νοημοσύνης, των χειρόγραφων πρακτικών του ΔΣ της Τράπεζας της περιόδου 1928-1988. Το αρχείο αριθμεί περίπου 30.000 σελίδες.
«Είναι πολύ δύσκολο το πρόβλημα των χειρογράφων, αλλά κάτι που μας βοηθάει σε αυτή την περίπτωση είναι ότι οι γραφείς είναι συγκεκριμένοι όλα αυτά τα χρόνια, οπότε για κάθε γραφέα έχουμε χιλιάδες σελίδες και αυτό μας βοηθάει στο θέμα της εκπαίδευσης του συστήματος», τονίζει ο κ. Γάτος.
Σε παλιότερο έργο της, η ομάδα συνεργάστηκε με το Ίδρυμα της Μονής του Όρους Σινά με σκοπό την ανάπτυξη τεχνολογιών για αναζήτηση πληροφορίας απευθείας από τις εικόνες των χειρογράφων της Μονής. Στο πλαίσιο του έργου αναλύθηκαν και αναγνωρίστηκαν περισσότερες από 100.000 σελίδες ιστορικών χειρογράφων.
Σημειώνεται ότι στο «Athens Science Festival» θα παρουσιαστεί η δουλειά μιας ακόμα ερευνητικής ομάδας του ίδιου Εργαστηρίου του Δημόκριτου.
Η ομάδα «AI4GEO» θα εξηγήσει πώς η παρατήρηση της Γης μέσω εφαρμογών τεχνητής νοημοσύνης «μεταμορφώνεται» σε ένα γιγάντιο άγρυπνο μάτι που μας βοηθά να ανακαλύψουμε πετρώματα και κοιτάσματα, να καταγράψουμε φυσικές καταστροφές ή να παρακολουθήσουμε τις εξελισσόμενες ανθρωπιστικές κρίσεις.
Πηγή: in.gr
Latest News
Η αδηφάγα Τεχνητή Νοημοσύνη αλλάζει τον τεχνολογικό χάρτη της Ευρώπης - Που πάνε τα νέα data centers
Η πεινασμένη για ενέργεια τεχνητή νοημοσύνη καταπονεί τα δίκτυα ηλεκτρικής ενέργειας της Ιρλανδίας, θέτοντας σε κίνδυνο τη θέση της χώρας ως τεχνολογικού κόμβου της Ευρώπης
Σήμα κινδύνου από τις ευρωπαϊκές εταιρείες τεχνολογίας - Τι ζητούν από τις Βρυξέλλες μετά την εκλογή Τραμπ
Παραφράζοντας το αγαπημένο μάντρα του Nτόναλντ Τραμπ οι εταιρείες τεχνολογίας της ΕΕ ζητούν να υιοθετήσει το «πρώτα η Ευρώπη»
Κυριάκος Μητσοτάκης για AI: Τεράστια ευκαιρία για τη χώρα η Τεχνητή Νοημοσύνη
Ο πρωθυπουργός Κυριάκος Μητσοτάκης συζήτησε με το μέλος της Συμβουλευτικής Επιτροπής για την Τεχνητή Νοημοσύνη και αντιπρόεδρο του Endeavor Greece Ανδρέα Σταυρόπουλο στο πλαίσιο του GenAI Summit
Η κυριαρχία επί της ΑΙ είναι ο δρόμος για απεξάρτηση της ΕΕ από τις ΗΠΑ
Για τις υπηρεσίες που προφέρει η τεχνητή νοημοσύνη σήμερα χρησιμοποιούνται κέντρα δεδομένων που εδρεύουν στις ΗΠΑ
Μπορεί η τεχνητή νοημοσύνη να αντικαταστήσει τον άνθρωπο στις μεταφράσεις;
CEO Startup λέει ότι δεν θα χρειάζονται άνθρωποι για μετάφραση σε 3 χρόνια, καθώς κυκλοφορεί νέα εφαρμογή με τεχνητή νοημοσύνη
Σκληρή μάχη στην «αρένα» της ΑΙ - Κούρσα για τα καλύτερα... μικροτσίπ
Κορυφώνεται ο ανταγωνισμός στην κούρσα για την επικράτηση στην Τεχνητή Νοημοσύνη - Το μεγάλο στοίχημα και οι προκλήσεις
Ποιες είναι οι τάσεις στις σχέσεις καταναλωτών-Τεχνητής Νοημοσύνης
Σύμφωνα με την έρευνα της Salesforce, η εμπιστοσύνη των καταναλωτών απέναντι στις επιχειρήσεις είναι στα χαμηλότερα επίπεδα των τελευταίων ετών
Οι επιχειρήσεις φοβούνται τις κυβερνοεπιθέσεις που βασίζονται στην AI
Μελέτη επισημαίνει ότι η Τεχνητή Νοημοσύνη ενισχύει πλέον και τη δράση των κυβερνοεγκληματιών προσθέτοντας ένα επιπλέον επίπεδο απειλών στην κυβερνοασφάλεια
Η Salesforce ανακοίνωσε την παγκόσμια διαθεσιμότητα του Agentforce
Το εργαλείο Agentforce της Salesforce δημιουργεί αξιόπιστους, αυτοματοποιημένους βοηθούς Τεχνητής Νοημοσύνης που ενισχύουν το ανθρώπινο δυναμικό των επιχειρήσεων
Ενίσχυση των επιχειρηματικών επενδύσεων στην AI - Τι δείχνει έρευνα της IBM
Έρευνα της IBM δείχνει ότι τα στελέχη των επιχειρήσεων αναγνωρίζουν τα οφέλη των επενδύσεων στην πληροφορική για την ενίσχυση της βιωσιμότητας, με το 88% να σχεδιάζει να αυξήσει τις επενδύσεις