Οι καθηγητές Γλώσσας συνηθίζουμε να εφαρμόζουμε ποικίλες διδακτικές μεθόδους για να μεταλαμπαδεύσουμε στους μαθητές μας τη Γλώσσα. Στην επιλογή των διδακτικών μεθόδων που θα εφαρμοστούν κατά περίπτωση διαδραματίζουν καθοριστικό ρόλο τόσο οι δικές μας στάσεις απέναντι στη Γλώσσα και οι αντιλήψεις μας περί του Γλωσσικού Φαινομένου όσο και οι μαθησιακές ανάγκες του εκάστοτε μαθητικού κοινού. Η (μη) αποτελεσματικότητα των μεθόδων που επιλέγονται κάθε φορά φαίνεται κυρίως με μετρήσιμους δείκτες, οι οποίοι δεν είναι άλλοι από τις επιδόσεις των μαθητών σε διαγωνίσματα και εξετάσεις. Γίνεται εκτενής συζήτηση στη βιβλιογραφία σε σχέση με τις υφιστάμενες ξενόγλωσσες διδακτικές μεθόδους, π.χ. κατά πόσο επιτυγχάνονται πράγματι τα επιθυμητά αποτελέσματα δια της αποστήθισης του λεξιλογίου και της εξέτασης αυτού υπό μορφή ορθογραφίας.
Ένα θέμα το οποίο κατά τα προηγούμενα χρόνια δεν φαίνεται να είχε αναδειχθεί και συζητηθεί εκτενώς είναι η ενσωμάτωση των λεγόμενων Σωμάτων Κειμένων (Text Corpora) στο μάθημα της (Ξένης) Γλώσσας. Η ανάδειξη αυτού του θέματος οφείλεται πρωτογενώς στην Κειμενογλωσσολογία (Text Linguistics), δηλαδή τον κλάδο εκείνο της Γλωσσολογίας που μελετά δομικά και τυπολογικά παντός τύπου κείμενα υπό το πρίσμα του είδους της Γλώσσας που χρησιμοποιούν και αναλύει ποιους σκοπούς ουσιαστικά εξυπηρετούν δι’ αυτού του είδους. Τι είναι ακριβώς τα Σώματα Κειμένων; Σύμφωνα με τον Τζον Μακχάρντι Σίνκλερ (John McHardy Sinclair 1933-2007), «Σώμα Κειμένων θεωρείται κάθε συλλογή τμημάτων μιας συγκεκριμένης Γλώσσας, τα οποία επιλέγονται και διατάσσονται σύμφωνα με συγκεκριμένα Γλωσσολογικά Κριτήρια, έτσι ώστε να μπορούν να χρησιμοποιηθούν ως αντιπροσωπευτικό δείγμα της Γλώσσας αυτής.». Ο ορισμός αυτός, ο οποίος διατυπώθηκε το 1996 και έγινε αφορμή να αποδοθεί στον Σίνκλερ ο χαρακτηρισμός του «Πατέρα της Κειμενογλωσσολογίας», είναι κοινά αποδεκτός ως ο ακριβέστερος και περιεκτικότερος ορισμός του αντικειμένου. Η διαμόρφωση των Σωμάτων Κειμένων γινόταν τον πρώτο καιρό με φυσικό τρόπο, δηλαδή εντύπως. Όμως η εξέλιξη της Υπολογιστικής Γλωσσολογίας συνέβαλε στην ανακάλυψη προηγμένων Λογισμικών Συστημάτων που κατέστησαν εφικτή την ηλεκτρονική διαμόρφωση, επεξεργασία και ταξινόμηση των Σωμάτων Κειμένων. Για αυτό πλέον γίνεται μάλλον λόγος για Ηλεκτρονικά Σώματα Κειμένων.
Γιατί είναι τόσο σημαντικό να ενσωματωθούν στο μάθημα της (Ξένης) Γλώσσας τα Σώματα Κειμένων; Νομίζω η λέξη που συνυφαίνει αριστουργηματικά το νόημά τους είναι η εξής: αυθεντικότητα. Οι μαθητές χρειάζονται αυθεντικά παραδείγματα για να αποτυπωθούν καλύτερα οι γραμματικοσυντακτικοί και λεξιλογικοί κανόνες στο μυαλό τους. Όμως πώς ακριβώς νοούνται τα αυθεντικά παραδείγματα; Αυτά δεν είναι άλλα από παραδείγματα τα οποία αντλούνται από Κυριακάτικες Εφημερίδες, Ηλεκτρονικά Περιοδικά και εν γένει τον Γραπτό Τύπο και έχουν επιλεγεί και μετέπειτα συλλεγεί, όπως προαναφέρθηκε, στη βάση αυστηρά προκαθορισμένων Γλωσσολογικών Κριτηρίων. Η αναλυτική καταγραφή της εκάστοτε πηγής προέλευσης είναι απαιτούμενη για την πιστοποίηση της αυθεντικότητας.
Παρόλο που προσωπικά δεν έχω ασχοληθεί με τα Σώματα Κειμένων εκτενώς στην πράξη, δεν μπορώ να κρύψω τον ενθουσιασμό που αισθάνθηκα όταν άκουσα για πρώτη φορά για αυτά και συνειδητοποίησα -καταρχήν στην θεωρία- πόσο σημαντική συμβολή μπορούν να έχουν στη Γλωσσική Διδασκαλία. Θα ήθελα να κάνω μια αναδρομή στο παρελθόν, συγκεκριμένα στην εποχή της πανδημίας του COVID-19 και του κοινωνικού εγκλεισμού που αυτή επέφερε, μεσούσης της οποίας συνέγραψα την πτυχιακή εργασία μου. Ήταν ουσιαστικά η πρώτη μεγάλη εργασία που κλήθηκα να συγγράψω στην ακαδημαϊκή καριέρα μου. Στόχος ήταν τότε να μελετήσω πώς παρουσιάζονται τα Αυτοπαθή Αντιμεταβιβαστικά Ρήματα (Reflexively Marked Anticausatives) στις γραμματικές της Γερμανικής, ώστε στο τέλος να προταθεί ένα διδακτικό μοντέλο για τη συστηματικότερη δυνατή διδασκαλία αυτών. Μεταξύ των παραμέτρων που ελήφθησαν υπόψιν για να αξιολογηθεί η επάρκεια παρουσίασης του καθενός ρήματος υπό μελέτη ήταν η (μη) παράθεση αυθεντικών παραδειγμάτων -από Σώματα Κειμένων όπως προαναφέρθηκε- στα οποία αναγράφεται ξεκάθαρα η πηγή προέλευσης των παραδειγμάτων. Αυτό το οποίο αξίζει να σημειωθεί είναι ότι τα αυθεντικά παραδείγματα προερχόμενα από Σώματα Κειμένων είτε ήταν τελείως απόντα είτε αποτελούσαν μόνο μερικά από τα παραδείγματα που προτείνονταν από τις γραμματικές. Αυτό κατά τη γνώμη μου αποδεικνύει ότι ανέκαθεν υπήρχε πίστη στη σημασία αξιοποίησης παραδειγμάτων από αυθεντικές πηγές, όπως αυτές από τον χώρο του Γραπτού Τύπου, ωστόσο τα προηγούμενα χρόνια δεν είχε συστηματοποιηθεί ακόμα η Επιστήμη της Γλωσσολογίας, με αποτέλεσμα να μην μπορούσε η Επιστημονική Κοινότητα τότε να μιλά με όρους Σωμάτων Κειμένων. Αυτό μοιραία είχε επίδραση και στην Διδακτική της (Ξένης) Γλώσσας, η οποία αντλεί το θεωρητικό πλαίσιο από την Θεωρητική Γλωσσολογία και στηρίζεται στις αρχές της Εφαρμοσμένης Γλωσσολογίας, ώστε να το καταστήσει πρακτικό κατά περίσταση.
Πέρα της πτυχιακής εργασίας μου, μπορώ να ανακαλέσω στη μνήμη μου μια ακόμα πιο πρόσφατη εμπειρία μου σε ένα Θερινό Σχολείο Γλωσσολογίας που επισκέφτηκα το περασμένο καλοκαίρι. Στο πλαίσιο αυτού είχα την ευκαιρία να μελετήσω τις λεγόμενες Πολυλεκτικές Εκφράσεις (Multiword Expressions) που εκφράζουν Ρητορική Μίσους (Hate Speech) και εμφανίζονται σε Σώματα Κειμένων, προερχόμενα από πανό οργανωμένων οπαδών και συνθήματα οπαδικού περιεχομένου που γράφονται σε τοίχους, τα κοινώς λεγόμενα γκράφιτι. Έμεινα πολύ εντυπωσιασμένος από τις πολυποίκιλες εφαρμογές που μπορούν ή θα μπορούσαν δυνητικά να αποκτήσουν στο μέλλον τα Σώματα Κειμένων, εκτός από την κυριότερη ίσως λειτουργία τους, που συνίσταται στην καλύτερη δυνατή κατάκτηση της (Ξένης) Γλώσσας. Οι Πολυλεκτικές Εκφράσεις, συλλεγόμενες σε Σώματα Κειμένων μπορούν να έχουν σημαντικό κοινωνιολογικό αντίκτυπο, συνεισφέροντας στον εντοπισμό Γλωσσικών Στοιχείων που υποκρύπτουν Ρητορική Μίσους και στον διαχωρισμό τους σε κατηγορίες ανάλογα με το περιεχόμενό τους, π.χ. μισαλλοδοξία, ειρωνεία, απειλή κ.τ.λ. Σε αυτήν την διαδικασία διαδραματίζει σημαντικό ρόλο, πέρα των Μέσων Κοινωνικής Δικτύωσης, το PARSEME, η γνωστότερη ίσως Πλατφόρμα Επεξεργασίας Φυσικής Γλώσσας με υπολογιστικά μεθοδολογικά μέσα. Οι Πολυλεκτικές Εκφράσεις, ως λεκτικά σύνολα που χαρακτηρίζονται από λεξιλογικές, συντακτικές, σημασιολογικές, πραγματολογικές και στατιστικές ιδιοσυγκρασίες, επέχουν διαγλωσσικά κεντρική θέση στο PARSEME. Εξ ου και η αχώριστη σύνδεσή τους μεταξύ άλλων και με τους τομείς της Λεξικογραφίας και της Κειμενογλωσσολογίας.
Γίνεται επομένως αντιληπτό πως τα Σώματα Κειμένων δεν είναι απλές ή και τυχαίες συλλογές κειμενικών ειδών που «υπάρχουν για να υπάρχουν». Συνιστούν αντιπροσωπευτικά δείγματα για βασικά γραμματικοσυντακτικά και λεξιλογικά φαινόμενα και -το κυριότερο- πιστοποιούν την αυθεντικότητα όχι μόνο της εκάστοτε Στάνταρτ Γλώσσας, αλλά και των λοιπών Διαλεκτικών Ποικιλιών αυτής. Για αυτό αποτελεί υψίστης σημασίας η επέκταση των ερευνών όχι μόνο ως προς τα Σώματα Κειμένων καθαυτά και πώς συγκροτούνται προοδευτικά, αλλά και ως προς τις ποικίλες εφαρμογές τους διεπιστημονικά, έστω στην Υπολογιστική Επιστήμη / Πληροφορική. Για την Ελληνική Γλώσσα, τα αντιπροσωπευτικότερα Σώματα Κειμένων φαίνεται πως βρίσκονται στα αρχεία του Ινστιτούτου Επεξεργασίας του Λόγου (Ι.Ε.Λ.) (Institute for Language and Speech Processing, I.L.S.P.), το οποίο ιδρύθηκε σαν ανεξάρτητος φορέας το 1991 στην Αθήνα και λειτουργεί υπό την αιγίδα της Γενικής Γραμματείας Έρευνας και Καινοτομίας του Υπουργείου Ανάπτυξης και Επενδύσεων. Τα διαθέσιμα λήμματα προσεγγίζουν τα 100.000.000.
Τέλος, ξεχωριστού διδακτικού και ερευνητικού ενδιαφέροντος είναι ο Εθνικός Θησαυρός Ελληνικής Γλώσσας (Ε.Θ.Ε.Γ.) (National Treasure of the Greek Language, N.T.G.L.), ένα ολοκληρωμένο περιβάλλον που παρέχει στους χρήστες όχι μόνο εργαλεία για καθαυτή τη μελέτη της Γλώσσας, αλλά πολύ περισσότερο Ηλεκτρονικά Σώματα Κειμένων για την πρόσβαση στα αρχεία. Τα λήμματα του Ε.Θ.Ε.Γ. ανέρχονται περίπου στα 80.000.000 και από ιδρύσεώς του (αρχές δεκαετίας 1990) εμπλουτίζονται αδιαλείπτως τα υπολογιστικά εργαλεία τόσο για την αξιοποίηση του Γλωσσικού Υλικού όσο και την πρόσβαση σε αυτό. Το χαρακτηριστικότερο εργαλείο είναι το Golden Corpus, το οποίο αριθμεί σε λήμματα περί τις 100.000 λέξεις με αυξητικές τάσεις ακόμα και σήμερα.
Ι.Ε.Λ. και Ε.Θ.Ε.Γ., δύο εντυπωσιακά εργαλεία για την διαμόρφωση ενός Γλωσσικού Διδακτικού Μοντέλου που ανταποκρίνεται στις σύγχρονες εκπαιδευτικές ανάγκες του Ελληνικού Σχολείου που θέλοντας και μη εναρμονίζεται με την σχεδόν καθολική ψηφιοποίηση της καθημερινότητας. Και με εφαρμογές στην Ελληνική τόσο ως Πρώτη-Μητρική όσο και ως Ξένη Γλώσσα σε προχωρημένο επίπεδο, χάρη στα Ηλεκτρονικά Σώματα Κειμένων που φιλοξενούνται εκεί.
Γράφει ο Παναγιώτης Γρηγοριάδης