Το τέλος της ΑΙ; Μηχανικοί θέλουν να «δηλητηριάσουν» τα σύνολα δεδομένων για την εκπαίδευση chatbots

Δημήτρης Δρίζος

ΤΕΧΝΟΛΟΓΙΑ
Η τεχνητή νοημοσύνη έχει χτιστεί πάνω σε μια θεμελιώδη παραδοχή: ότι θα έχει πάντα πρόσβαση σε τεράστιες ποσότητες δεδομένων για να εκπαιδεύεται και να εξελίσσεται.

Το πρότζεκτ Poison Fountain έρχεται να αμφισβητήσει ευθέως αυτή τη βάση, προτείνοντας κάτι που, αν εφαρμοστεί σε μεγάλη κλίμακα, θα μπορούσε να προκαλέσει χάος σε μια βιομηχανία δισεκατομμυρίων.

Το σχέδιο προβλέπει την «αναρρόφηση» δεδομένων που προορίζονται για την εκπαίδευση γλωσσικών μοντέλων και την αντικατάστασή τους με «δηλητηριασμένο» εκπαιδευτικό υλικό. Ένα τέτοιο σενάριο θα μπορούσε να μετατρέψει τις κολοσσιαίες επενδύσεις των τεχνολογικών κολοσσών σε στάχτη και να οδηγήσει την κατά τα άλλα «επαναστατική» βιομηχανία της AI σε πλήρη αποδιοργάνωση.

Σύμφωνα με τους δημιουργούς του Poison Fountain, το πρόβλημα της τεχνητής νοημοσύνης είναι πολύ μεγαλύτερο απ’ όσο αντιλαμβάνεται σήμερα το κοινό. «Συμφωνούμε με τον Τζέφρι Χίντον: η μηχανική νοημοσύνη αποτελεί απειλή για το ανθρώπινο είδος. Σε απάντηση σε αυτή την απειλή, θέλουμε να πλήξουμε τα συστήματά της», αναφέρεται χαρακτηριστικά στην ιστοσελίδα του πρότζεκτ, το οποίο δηλώνει ότι υποστηρίζεται από εργαζομένους σε μερικές από τις μεγαλύτερες εταιρείες του κλάδου της AI.

Η αχίλλειος πτέρνα της AI

Η τεχνητή νοημοσύνη είναι τόσο καλή όσο και τα δεδομένα με τα οποία εκπαιδεύεται. Για χρόνια, η συλλογή τόσο μεγάλων όγκων πληροφοριών θεωρούνταν αδύνατη. Το διαδίκτυο, όμως, μετατράπηκε γρήγορα σε χρυσωρυχείο δεδομένων, αλλά και σε πεδίο ανεξέλεγκτων παραβιάσεων πνευματικών δικαιωμάτων και ιδιωτικότητας, τόσο για ιδιώτες όσο και για επιχειρήσεις.

Η ιδέα της δολιοφθοράς των datasets που χρησιμοποιούνται για την εκπαίδευση συστημάτων τεχνητής νοημοσύνης δεν είναι καινούργια. Ήδη υπάρχουν εργαλεία που βασίζονται στο λεγόμενο data jamming, με στόχο να αποθαρρύνουν τα μοντέλα από το να αντιγράφουν έργα τέχνης, κυρίως εικόνες.

Το Poison Fountain, όμως, προχωρά πολύ πιο πέρα.

Πώς λειτουργεί το «δηλητήριο»

Το πρότζεκτ παρέχει σε διακομιστές συνδέσμους που οδηγούν σε «δηλητηριασμένα» σύνολα δεδομένων, τα οποία έχουν σχεδιαστεί για να παραπλανούν τους αλγοριθμικούς «πράκτορες» τεχνητής νοημοσύνης που περιηγούνται σε αυτές τις ιστοσελίδες. Οι σύνδεσμοι αυτοί υποτίθεται ότι προσφέρουν μια «ατελείωτη» ροή κακόβουλων δεδομένων.

Τα επικίνδυνα αυτά δεδομένα περιέχουν κώδικα με λογικά και άλλα σφάλματα. Αν ενσωματωθούν στη διαδικασία εκπαίδευσης, μπορούν να προκαλέσουν σοβαρές δυσλειτουργίες και να υποβαθμίσουν δραστικά την ποιότητα των γλωσσικών μοντέλων που βασίζονται σε αυτά.

Το ερώτημα που μένει ανοιχτό είναι αν τέτοιες πρωτοβουλίες θα παραμείνουν στο περιθώριο ή αν μπορούν πράγματι να κλονίσουν τα θεμέλια μιας τεχνολογίας που ήδη διαμορφώνει το μέλλον της οικονομίας, της εργασίας και της ίδιας της ανθρώπινης κοινωνίας.

