Η OpenAI απαντά γιατί η AI εξακολουθεί να έχει παραισθήσεις

Με τον όρο αυτόν περιγράφονται οι φαινομενικά εύλογες αλλά εντελώς λανθασμένες πληροφορίες που παράγουν μοντέλα όπως το GPT-5 και διαδεδομένα εργαλεία συνομιλίας όπως το ChatGPT.

Μια πρόσφατη μελέτη της OpenAI ρίχνει φως στις βασικές αιτίες του φαινομένου, δείχνοντας ότι, ακόμη και μεταξύ διαφορετικών εκδόσεων ενός chatbot, οι απαντήσεις μπορεί να φαίνονται ασφαλείς, λεπτομερείς και καλά δομημένες, αλλά στην πραγματικότητα να είναι απολύτως εσφαλμένες.

Χαρακτηριστικό παράδειγμα ήταν όταν οι ερευνητές ζήτησαν από ένα chatbot αντικειμενικές πληροφορίες, όπως τον τίτλο της διδακτορικής διατριβής του Adam Tauman Kalai, ενός εκ των συγγραφέων της μελέτης. Το μοντέλο έδωσε τρεις διαφορετικές εκδοχές, όλες λανθασμένες. Παρόμοιο αποτέλεσμα προέκυψε όταν ζητήθηκε η ημερομηνία γέννησής του: τρεις απαντήσεις, τρεις φορές λάθος, αλλά πάντα με την ίδια βεβαιότητα. Το ερώτημα που γεννιέται είναι προφανές: πώς μπορεί μια τεχνητή νοημοσύνη να εμφανίζεται τόσο σίγουρη, ενώ στην πραγματικότητα λέει ανακρίβειες;

Η απάντηση, σύμφωνα με την OpenAI, βρίσκεται στον ίδιο τον τρόπο εκπαίδευσης αυτών των συστημάτων. Τα γλωσσικά μοντέλα μαθαίνουν προβλέποντας την επόμενη λέξη μέσα σε ένα κείμενο, χωρίς να αξιολογείται άμεσα η αλήθεια του περιεχομένου. Με απλά λόγια, το σύστημα μαθαίνει να παράγει ρέοντα και πειστικά κείμενα, αλλά δεν διαθέτει έναν μηχανισμό που να ξεχωρίζει το αληθές από το ψευδές. Το πρόβλημα γίνεται πιο έντονο όταν πρόκειται για σπάνιες ή ασυνήθιστες πληροφορίες, οι οποίες δεν εμφανίζονται συχνά στα δεδομένα εκπαίδευσης και δεν ακολουθούν αναγνωρίσιμα μοτίβα. Έτσι εξηγείται γιατί, καθώς εξελίσσονται τα μοντέλα, μειώνονται οι ορθογραφικές και συντακτικές αστοχίες, αλλά συνεχίζονται οι «παραισθήσεις» γύρω από εξειδικευμένα δεδομένα.

Η μελέτη, ωστόσο, δεν μένει μόνο στην πηγή του προβλήματος. Εστιάζει και στον τρόπο με τον οποίο αξιολογούνται σήμερα τα γλωσσικά μοντέλα μεγάλης κλίμακας. Η OpenAI τονίζει ότι τα μοντέλα αυτά έχουν κίνητρο να «μαντεύουν» με αυτοπεποίθηση, όπως κάποιος που συμπληρώνει ένα σταυρόλεξο: αν αφήσει ένα πεδίο κενό, παίρνει μηδέν, αλλά αν απαντήσει έστω και στην τύχη, μπορεί να σταθεί τυχερός. Το αποτέλεσμα είναι ότι τα συστήματα προτιμούν να δίνουν μια βέβαιη απάντηση – έστω και λανθασμένη – αντί να παραδεχτούν ότι δεν γνωρίζουν.

Για να αντιμετωπιστεί αυτό το φαινόμενο, οι ειδικοί της OpenAI προτείνουν αλλαγές στον τρόπο αξιολόγησης. Αντί τα συστήματα να επιβραβεύονται για κάθε απάντηση που μοιάζει πειστική, θα πρέπει να τιμωρούνται αυστηρότερα για λάθη και να επιβραβεύονται όταν αναγνωρίζουν τα όριά τους. Η λογική θυμίζει τις σχολικές εξετάσεις: σε ένα τεστ, η λάθος απάντηση μπορεί να κοστίσει περισσότερους βαθμούς απ’ ό,τι μια κενή απάντηση. Έτσι, ενθαρρύνεται η προσοχή και όχι το τυχαίο ρίσκο.

Η αλλαγή αυτή, όπως εξηγούν οι ερευνητές, θα μπορούσε να μεταβάλει ριζικά τη συμπεριφορά των μοντέλων. Με την ενημέρωση των βασικών δεικτών αξιολόγησης, τα chatbots δεν θα ανταγωνίζονται πλέον στο ποιο θα φανεί πιο σίγουρο, αλλά στο ποιο θα είναι πιο αξιόπιστο. Αν η νέα μεθοδολογία εφαρμοστεί σε μεγάλη κλίμακα, οι «παραισθήσεις» θα μπορούσαν να περιοριστούν αισθητά, οδηγώντας σε συστήματα τεχνητής νοημοσύνης που απαντούν με μεγαλύτερη υπευθυνότητα και ειλικρίνεια.

Πηγή: openai

Tags: ai chatgpt openai

Αφήστε ένα Σχόλιο Ακύρωση Σχολιασμού

Διαβάστε επίσης

Η Mozilla εξαγοράζει την Fakespot για να βοηθήσει τους χρήστες του Firefox να εντοπίζουν ψεύτικες κριτικές προϊόντων

Η Mozilla ανακοίνωσε ότι εξαγόρασε την εταιρεία Fakespot, μια startup που παρέχει ένα site και ένα browser extension που επιτρέπει στους χρήστες να εντοπίζουν αναξιόπιστες ή ψεύτικες κριτικές προϊόντων.

Περισσότερα

Google: Το Search θα έρθει με νέα AI χαρακτηριστικά

Το Google Search θα λάβει μια ανανέωση με ενσωμάτωση ΑΙ που θα το κάνει πιο όμορφο και εύχρηστο για τους χρήστες του. Πρόσφατα, η Google ανακοίνωσε ότι εστιάζει στο να κάνει τη μηχανή αναζήτησής της πιο “οπτικά ευχάριστη, εύχρηστη, προσωπική και ανθρώπινη”.

Περισσότερα

Google Chrome: Θα συνοψίζει ολόκληρα άρθρα για εσάς με ενσωματωμένο generative AI

Το Search Generative Experience (SGE) της Google που λειτουργεί με τεχνητή νοημοσύνη αποκτά ένα σημαντικό νέο χαρακτηριστικό: θα μπορεί να συνοψίζει τα άρθρα που διαβάζετε στο διαδίκτυο, σύμφωνα με μια ανάρτηση στο blog της Google.

Περισσότερα

Τελευταία Νέα

Χρειάζονται antivirus τα Windows 11; Τι πρέπει να ξέρουν οι γονείς
Το ενσωματωμένο Windows Defender αρκεί για Windows 11 ή χρειάζεστε επιπλέον antivirus; Τι να ελέγξετε στον υπολογιστή των παιδιών σας.
764: Το δίκτυο που κυνηγάει παιδιά online
Το FBI ερευνά 350+ μέλη του δικτύου 764 που στοχεύει παιδιά από 9 ετών σε Roblox και Discord. Πώς λειτουργεί το grooming, ποια σήματα να προσέξετε και τι κάνετε αν συμβεί.
Πρώτο κινητό: Πότε είναι έτοιμο το παιδί και πώς να το ρυθμίσετε
Πότε είναι έτοιμο το παιδί για το πρώτο κινητό; Ευρωπαϊκές έρευνες δείχνουν 11 - 12 ετών, αλλά η ωριμότητα μετράει περισσότερο. Πρακτικός οδηγός για ρυθμίσεις, κανόνες και το συμφωνητικό χρήσης.
Απάτη με ψεύτικα email της Apple για κλοπή δεδομένων
Χάκερς στέλνουν ψεύτικα emails μέσω των servers της Apple για να κλέψουν τραπεζικά στοιχεία. Πώς να αναγνωρίσετε την απάτη.
VPN: Τι κρύβουν πραγματικά και γιατί κάποια είναι επικίνδυνα
Τι κρύβει πραγματικά ένα VPN, τι δεν κρύβει. Γιατί τα δωρεάν VPN είναι συχνά πιο επικίνδυνα από το πρόβλημα που λύνουν.