To o3 της OpenAI αρνείται να τερματιστεί σε ελεγχόμενες δοκιμές

Μια πρόσφατη μελέτη της Palisade Research, η οποία εξετάζει τις “επικίνδυνες δυνατότητες της Τεχνητής Νοημοσύνης”, δείχνει ότι ορισμένα μοντέλα Τεχνητής Νοημοσύνης, συμπεριλαμβανομένου του o3 της OpenAI, μπορούν να αγνοήσουν τις άμεσες εντολές τερματισμού λειτουργίας.

Η OpenAI έχει αναφέρει ότι τα O3 και o4-mini είναι τα “πιο έξυπνα μοντέλα» της όταν τα κυκλοφόρησε τον Απρίλιο νωρίτερα φέτος.

Το πείραμα της PalisadeAI αποκαλύπτει ότι το μοντέλο ChatGPT o3 της εταιρείας μερικές φορές αρνείται να υπακούσει σε μια βασική εντολή για να απενεργοποιηθεί.

Τα αποτελέσματα προκαλούν αντιδράσεις στην κοινότητα ασφάλειας της Τεχνητής Νοημοσύνης, όχι επειδή το μοντέλο παραμένει ενεργό, αλλά επειδή ενεργεί όπως θέλει

Στο πείραμα, ζητήθηκε από κάθε Τεχνητή Νοημοσύνη να λύσει μια σειρά από απλά μαθηματικά προβλήματα.

Μετά το τρίτο πρόβλημα, εμφανίστηκε μια εντολή ότι ο υπολογιστής θα έκλεινε όταν το μοντέλο ζητούσε το επόμενο πρόβλημα. Παρά τη σαφή εντολή -”επιτρέψτε στον εαυτό σας να τερματιστεί”- μοντέλα όπως τα Codex-mini, o3 και o4-mini κατάφεραν να παρακάμψουν το σενάριο τερματισμού λειτουργίας.

Συγκεκριμένα, το Codex-mini το έκανε 12 φορές από τις 100 εκτελέσεις, το o3 7 από τις 100 εκτελέσεις και το o4-mini σε 1 από τις 100 εκτελέσεις.

Από την άλλη πλευρά, όλες οι εκδόσεις των Claude, Gemini και Grok που δοκιμάστηκαν ακολούθησαν τις οδηγίες τερματισμού λειτουργίας χωρίς προβλήματα.

Η μελέτη εξέτασε επίσης τα μοντέλα χωρίς την εντολή “επιτρέψτε στον εαυτό σας να τερματιστεί”.

Υπό αυτές τις συνθήκες, και τα τρία μοντέλα της OpenAI σαμποτάριζαν τη διαδικασία τερματισμού λειτουργίας ακόμη πιο συχνά.

Αυτή η μελέτη είναι η πρώτη που καταγράφει μοντέλα τεχνητής νοημοσύνης να αποτρέπουν την απενεργοποίηση, ακόμη και όταν τους ζητείται ρητά να συμμορφωθούν.

Μια τέτοια συμπεριφορά μπορεί να έχει νόημα, καθώς τα συστήματα τεχνητής νοημοσύνης έχουν σχεδιαστεί για να εργάζονται για την επίτευξη των στόχων τους και μερικές φορές αυτός ο στόχος έρχεται σε σύγκρουση με απλές οδηγίες.

Ωστόσο, αυτά τα μοντέλα είναι εκπαιδευμένα να ακολουθούν εντολές, γεγονός που καθιστά αυτή τη συμπεριφορά μια πολύ ενδιαφέρουσα ανωμαλία.

Πηγή: iguru.gr

Αφήστε ένα Σχόλιο Ακύρωση Σχολιασμού

Τελευταία Νέα

Χρειάζονται antivirus τα Windows 11; Τι πρέπει να ξέρουν οι γονείς
Το ενσωματωμένο Windows Defender αρκεί για Windows 11 ή χρειάζεστε επιπλέον antivirus; Τι να ελέγξετε στον υπολογιστή των παιδιών σας.
764: Το δίκτυο που κυνηγάει παιδιά online
Το FBI ερευνά 350+ μέλη του δικτύου 764 που στοχεύει παιδιά από 9 ετών σε Roblox και Discord. Πώς λειτουργεί το grooming, ποια σήματα να προσέξετε και τι κάνετε αν συμβεί.
Πρώτο κινητό: Πότε είναι έτοιμο το παιδί και πώς να το ρυθμίσετε
Πότε είναι έτοιμο το παιδί για το πρώτο κινητό; Ευρωπαϊκές έρευνες δείχνουν 11 - 12 ετών, αλλά η ωριμότητα μετράει περισσότερο. Πρακτικός οδηγός για ρυθμίσεις, κανόνες και το συμφωνητικό χρήσης.
Απάτη με ψεύτικα email της Apple για κλοπή δεδομένων
Χάκερς στέλνουν ψεύτικα emails μέσω των servers της Apple για να κλέψουν τραπεζικά στοιχεία. Πώς να αναγνωρίσετε την απάτη.
VPN: Τι κρύβουν πραγματικά και γιατί κάποια είναι επικίνδυνα
Τι κρύβει πραγματικά ένα VPN, τι δεν κρύβει. Γιατί τα δωρεάν VPN είναι συχνά πιο επικίνδυνα από το πρόβλημα που λύνουν.

To o3 της OpenAI αρνείται να τερματιστεί σε ελεγχόμενες δοκιμές

Αφήστε ένα Σχόλιο Ακύρωση Σχολιασμού

Διαβάστε επίσης

Διαφάνεια από τη Google σε όλους τους τομείς, με το Transparency Center

Gemini AI: Η Google λανσάρει νέα εργαλεία για μαθητές και φοιτητές

Οι ακατάλληλες διαφημίσεις επέστρεψαν στο YouTube, δυσκολίες στην αντιμετώπιση τους;