Η Anthropic ανακοίνωσε ότι έχει διακόψει την πρόσβαση όλων των πελατών της στα Fable 5 και Mythos 5, σε συμμόρφωση με εντολή της αμερικανικής κυβέρνησης που έλαβε την Παρασκευή 12 Ιουνίου. Τα υπόλοιπα μοντέλα της εταιρείας δεν επηρεάζονται και παραμένουν διαθέσιμα κανονικά.
Σύμφωνα με την Anthropic, η αμερικανική κυβέρνηση ζήτησε αναστολή της πρόσβασης όλων των αλλοδαπών στα νέα AI μοντέλα της εταιρείας, ανεξάρτητα από το αν βρίσκονται εντός ή εκτός ΗΠΑ. Ο περιορισμός αφορά ακόμα και υπαλλήλους της ίδιας της Anthropic. Η επίσημη αιτιολογία αναφέρεται γενικά σε λόγους εθνικής ασφάλειας.
Πιθανό jailbreak στο Fable 5
Παρόλο που η κυβέρνηση δεν διευκρίνισε τη φύση των ανησυχιών της, η Anthropic εκτιμά ότι το ζήτημα συνδέεται με μέθοδο jailbreaking που εντοπίστηκε στο Fable 5. Το συγκεκριμένο μοντέλο είχε λανσαριστεί μόλις λίγες ημέρες νωρίτερα, στις 9 Ιουνίου, με στόχο να φέρει στο ευρύ κοινό αρκετές από τις δυνατότητες του Mythos, του cybersecurity μοντέλου που είναι διαθέσιμο αποκλειστικά σε partners του Project Glasswing.
Οι δυνατότητες του Fable, σύμφωνα με την Anthropic, «ξεπερνούν» κάθε προηγούμενο μοντέλο της εταιρείας. Ενδεικτικά, σε εσωτερικά tests κατάφερε να ολοκληρώσει το Pokémon FireRed, σε αντίθεση με το Claude που δεν είχε καταφέρει να τελειώσει ούτε το αρχικό Pokémon Red.
Τι έκανε η Anthropic για την ασφάλεια
Στην ανακοίνωσή της, η εταιρεία εξήγησε τα μέτρα ασφαλείας που είχε υιοθετήσει για το Fable. Όπως ανέφερε, εγκατέστησε ισχυρά safeguards για να «μειώσει την πιθανότητα κακόβουλης χρήσης σε εργασίες σχετικές με cybersecurity», ενώ πρόσθεσε με μια δόση αυτοκριτικής ότι αυτά τα safeguards «είναι τόσο αυστηρά που πολλοί χρήστες έχουν παραπονεθεί ότι είναι υπερβολικά ευρεία».
Παράλληλα, η Anthropic ξεκαθάρισε ότι κανένας provider δεν μπορεί να εγγυηθεί τέλεια αντίσταση σε jailbreak attempts. Όπως είπε χαρακτηριστικά: «Στόχος μας ήταν να κάνουμε τα jailbreaks είτε narrow, στην περίπτωση μη universal jailbreaks, είτε πολύ ακριβά στην παραγωγή τους, στην περίπτωση universal jailbreaks. Συνδυάζουμε αυτό με thorough monitoring για να εντοπίζουμε γρήγορα και να σταματάμε επιτυχημένες επιθέσεις.»
Διαφωνία με την κυβερνητική απόφαση
Η αμερικανική κυβέρνηση φέρεται να έδωσε στην Anthropic προφορικές αποδείξεις για ένα συγκεκριμένο narrow, μη universal jailbreak που είχε μοιραστεί μη κατονομαζόμενη οντότητα. Η εταιρεία υποσχέθηκε να μοιραστεί περισσότερες λεπτομέρειες τις επόμενες 24 ώρες, αλλά διαφώνησε ξεκάθαρα με την απόφαση.
Όπως ανέφερε η Anthropic στη δημόσια θέση της: «Όπως έχουμε δηλώσει δημόσια, πιστεύουμε ότι η κυβέρνηση πρέπει να έχει τη δυνατότητα να μπλοκάρει unsafe deployments, ως μέρος μιας θεσμικής διαδικασίας που είναι διαφανής, δίκαιη, ξεκάθαρη και βασισμένη σε τεχνικά γεγονότα. Αυτή η ενέργεια δεν τηρεί αυτές τις αρχές.»
Η Anthropic ανακαλεί έτσι μία ολόκληρη γενιά μοντέλων χωρίς να συμφωνεί με τους λόγους, σε μια εξέλιξη που πιθανώς ανοίγει νέο κεφάλαιο στη συζήτηση γύρω από την κυβερνητική εποπτεία στο AI.
