Οι πλατφόρμες social media αντιμετωπίζουν αυξανόμενη πίεση για το πως διαχειρίζονται το περιεχόμενο μισαλλόδοξου λόγου που διαδίδουν οι χρήστες (συμπεριλαμβανομένου ψεύτικων λογαριασμών και troll) μέσα από τις πλατφόρμες τους. Αν και έχουν ληφθεί μέτρα για την αντιμετώπιση του προβλήματος, δεν υπάρχει ακόμη συγκεκριμένο αυτοματοποιημένο εργαλείο που να εφαρμόζεται αποτελεσματικά από τις πλατφόρμες.
Στον αγώνα για την αντιμετώπιση της διάδοσης της ρητορικής μίσους στα social media έχει προστεθεί και η ερευνητική και επιστημονική κοινότητα. Ένα μεγάλο μέρος της επιστημονικής κοινότητας που ασχολείται με τη ρητορική μίσους ασχολείται με την ανάπτυξη τεχνικών αυτόματης ανίχνευσής της σε αναρτήσεις κοινωνικών δικτύων. Το πρόβλημα είναι πολυδιάστατο και πολύ δύσκολο να λυθεί επιτυχημένα, καθώς ένα υπολογιστικό σύστημα πρέπει να μάθει να αντιλαμβάνεται όχι μόνο το γραπτό λόγο αλλά και την λεπτή γραμμή ανάμεσα στην ρητορική μίσους και τη χρήση προσβλητικής γλώσσας.
Κάποιες από τις πιο επιτυχημένες μεθοδολογίες επίλυσης αντίστοιχων προβλημάτων τα τελευταία χρόνια, προέρχονται από την επιστημονική περιοχή της Μηχανικής Μάθησης (Machine Learning). Η μάθηση είναι ένα βασικό χαρακτηριστικό του ανθρώπου, που περιλαμβάνει διαδικασίες που δεν έχουν γίνει ακόμα πλήρως κατανοητές από τους επιστήμονες. Παρόλα αυτά, οι τεχνικές Μηχανικής Μάθησης έχουν φέρει επανάσταση σε διάφορους τομείς, δίνουν λύση σε πραγματικά προβλήματα και τις χρησιμοποιούμε όλοι μας σήμερα σε διάφορες μορφές είτε ενσωματωμένες σε λογισμικό στον υπολογιστή μας, είτε στα υπολογιστικά συστήματα της εταιρείας μας, στο κινητό μας κλπ. Με απλά λόγια, Μηχανική Μάθηση είναι το σύνολο των διαδικασιών που επιτρέπουν σε ένα υπολογιστικό σύστημα να μάθει να εκτελεί μία εργασία, χρησιμοποιώντας δεδομένη γνώση ή εμπειρία και χωρίς την αναλυτική περιγραφή μέσω προγραμματισμού των βημάτων που πρέπει να ακολουθηθούν. Έτσι με δεδομένα πρότυπα συμπεριφοράς που δίνονται σε ένα αλγόριθμο εκπαίδευσης, ένα υπολογιστικό σύστημα μπορεί να δημιουργήσει ένα μοντέλο Μηχανικής Μάθησης, το οποίο να μπορεί να παίρνει όχι μόνο αποφάσεις για δεδομένα στα οποία έχει εκπαιδευτεί αλλά και για άλλα που του είναι άγνωστα.
O τρόπος με τον οποίο η ρητορική μίσους αναπαράγεται στα κοινωνικά δίκτυα, αλλάζει με το χρόνο
Αν επικεντρωθούμε τώρα στην αυτόματη ανίχνευση ρητορικής μίσους σε αναρτήσεις κοινωνικών δικτύων, με την χρήση επιβλεπόμενης Μηχανικής Μάθησης, το πρόβλημα καταλήγει σε ένα πρόβλημα κατηγοριοποίησης – αν μια ανάρτηση είναι ή όχι ρητορική μίσους. Χωρίς να μπούμε σε τεχνικές λεπτομέρειες και αφού επιλεχθούν σημαντικές παράμετροι για τους αλγορίθμους μάθησης και απόφασης, η διαδικασία δημιουργίας ενός μοντέλου αποτελείται από τα ακόλουθα στάδια:
- Δημιουργία ενός συνόλου δεδομένων εκπαίδευσης που περιέχει όσο το δυνατόν περισσότερα παραδείγματα ρητορικής μίσους. Σε αυτό το στάδιο, είναι απαραίτητη η επισήμανση των αναρτήσεων, από ανθρώπους, με ένα ΝΑΙ ή ένα ΟΧΙ όσον αφορά την ύπαρξη ρητορικής μίσους.
- Η συσσωρευμένη και ακατέργαστη γνώση που υπάρχει στο παραπάνω σύνολο δεδομένων, με την βοήθεια διαδικασιών εκπαίδευσης, δημιουργούν μοντέλα Μηχανικής Μάθησης τα οποία είναι σε θέση να εντοπίζουν την ρητορική μίσους αξιοποιώντας τεχνικές νευρωνικών δικτύων βαθιάς μάθησης.
- Τα μοντέλα αυτά, αξιολογούνται σε διαφορετικά επισημασμένα σύνολα δεδομένων, έτσι ώστε να μετρηθεί η δυνατότητα που έχουν να παίρνουν σωστές αποφάσεις σε αναρτήσεις για τις οποίες δεν έχουν πρότερη εμπειρία.
Η παραπάνω διαδικασία παράγει μοντέλα τα οποία μπορούν μέσα σε χιλιοστά του δευτερολέπτου να κατατάξουν μια ανάρτηση, όσον αφορά την ύπαρξη ρητορικής μίσους ή όχι. Παρόλα αυτά ο τρόπος με τον οποίο η ρητορική μίσους αναπαράγεται στα κοινωνικά δίκτυα, αλλάζει με το χρόνο, κάτι που κάνει απαραίτητη την επανάληψη της διαδικασίας εκπαίδευσης σε τακτά χρονικά διαστήματα. Για να λυθεί αυτό το πρόβλημα με την ελάχιστη χρονική υστέρηση ανάμεσα στους κύκλους εκπαίδευσης αλλά και τους ελάχιστους απαιτούμενους πόρους για την επισήμανση των δεδομένων, χρησιμοποιήθηκαν τεχνικές ενεργής μάθησης (Active Learning). Έτσι, όταν το υπολογιστικό σύστημα συναντήσει μια ανάρτηση για την κατηγοριοποίηση της οποίας δεν είναι σίγουρο, «ρωτάει» έναν άνθρωπο ο οποίος θα αναλάβει να του δώσει την απάντηση. Με αυτό το τρόπο το μοντέλο θα προσθέσει μια σημαντική νέα πληροφορία στην γνωσιακή του βάση, βελτιώνοντας την συνολική του απόδοση και μαθαίνοντας από παραδείγματα που μεγιστοποιούν τη γνώση του.
Η DataScouting συνεργάστηκε με το Ευρωπαϊκό Κέντρο Δημοσιογραφίας (European Journalism Centre) στο έργο DACHS, με σκοπό την καταπολέμηση της ρητορικής μίσους στα social media κατά των δημοσιογράφων. Το έργο “A Data-driven approach to countering hate speech” υλοποιήθηκε με χρηματοδότηση της Ευρωπαϊκής Ένωση στο πλαίσιο του προγράμματος «Δικαιώματα, Ισότητα και Ιθαγένεια 2014-2020.
Στα πλαίσια του έργου DACHS, η DataScouting υλοποίησε:
- Μοντέλα ανίχνευσης ρητορικής μίσους και μισαλλόδοξης ομιλίας που βασίζονται σε τεχνολογίες Μηχανικής Μάθησης.
- Βάσεις δεδομένων ρητορικής μίσους σε πέντε γλώσσες (Αγγλικά, Ελληνικά, Ισπανικά, Γαλλικά και Γερμανικά).
- Έναν μηχανισμό έγκαιρης ειδοποίησης με τον οποίο μπορούν οι δημοσιογράφοι να ενημερώνονται για περιπτώσεις ρητορικής μίσους.
- Αλλά και ένα μηχανισμό που μπορούν οι ίδιοι οι δημοσιογράφοι να αξιολογούν αναρτήσεις ως ρητορική μίσους και με αυτό τον τρόπο να βοηθούν στην εξέλιξη των αντίστοιχων μοντέλων.
Από το έργο αναμένεται να ωφεληθεί ένας σημαντικός αριθμός δημοσιογράφων στην Ευρώπη, όπως και ερευνητές, ενώ το έργο στοχεύει και στην περαιτέρω επέκταση του σε άλλες ευάλωτες ομάδες στην Ευρώπη.