Google AudioPaLM: AI που ακούει, μιλάει, και μεταφράζει, με εκπληκτική ακρίβεια

Η τεχνολογίες τεχνητής νοημοσύνης εξελίσσεται συνεχώς. Μπορεί πολλοί άνθρωποι χρησιμοποιούν AI για να ολοκληρώνουν τις εργασίες τους πιο εύκολα, αυτή η τεχνολογία μπορεί να προσφέρει πολύ περισσότερα. Η Google προσπαθεί εδώ και χρόνια να φτάσει τα όρια της τεχνητής νοημοσύνης και να ξεκλειδώσει όλο το φάσμα των δυνατοτήτων της. Η τελευταία εξέλιξη αυτής της προσπάθειας είναι το AudioPaLM. Πρόκειται για ένα νέο γλωσσικό μοντέλο που μπορεί να ακούσει, να μιλήσει, και να μεταφράσει με πρωτοφανή ακρίβεια.

Πρόκειται για μια πολυτροπική αρχιτεκτονική που συνδυάζει τα πλεονεκτήματα δύο υφιστάμενων μοντέλων, των PaLM-2 και AudioLM. Το PaLM-2 είναι ένα γλωσσικό μοντέλο βασισμένο σε κείμενο που είναι καλό στην κατανόηση της γλωσσικής γνώσης συγκεκριμένων κειμένων. Από την άλλη, το AudioLM είναι εξαιρετικό στη διατήρηση παραγλωσσικών πληροφοριών όπως η ταυτότητα του ομιλητή και ο τόνος.

Συνδυάζοντας αυτά τα δύο μοντέλα, το AudioPaLM εκμεταλλεύεται τη γλωσσική εμπειρογνωμοσύνη του PaLM-2 και τη διατήρηση των παραγλωσσικών πληροφοριών του AudioLM, οδηγώντας σε μια πιο εμπεριστατωμένη κατανόηση και δημιουργία τόσο κειμένου όσο και ομιλίας.

Αυτό το γλωσσικό μοντέλο κάνει χρήση ενός κοινού λεξιλογίου που μπορεί να αναπαραστήσει τόσο ομιλία όσο και κείμενο, με έναν περιορισμένο αριθμό διακριτών tokens. Αυτό επιτρέπει την ενοποίηση εργασιών όπως η αναγνώριση ομιλίας, η σύνθεση κειμένου από ομιλία, και η μετάφραση ομιλίας σε ομιλία, και τη δημιουργία μιας ενιαίας αρχιτεκτονικής και διαδικασίας εκπαίδευσης.

Το AudioPaLM έχει αποδειχθεί ότι ξεπερνά τα υπάρχοντα συστήματα στη μετάφραση ομιλίας. Επιπλέον, μπορεί να εκτελέσει μετάφραση ομιλίας σε κείμενο για γλωσσικούς συνδυασμούς που δεν έχει συναντήσει ποτέ πριν. Επίσης, μπορεί να μεταφέρει φωνές μεταξύ γλωσσών με βάση σύντομες προφορικές οδηγίες και μπορεί να συλλάβει και να αναπαράγει ξεχωριστές φωνές σε διαφορετικές γλώσσες.

Πηγή: MarktechPost.com

Αφήστε ένα Σχόλιο Ακύρωση Σχολιασμού

Τελευταία Νέα

Χρειάζονται antivirus τα Windows 11; Τι πρέπει να ξέρουν οι γονείς
Το ενσωματωμένο Windows Defender αρκεί για Windows 11 ή χρειάζεστε επιπλέον antivirus; Τι να ελέγξετε στον υπολογιστή των παιδιών σας.
764: Το δίκτυο που κυνηγάει παιδιά online
Το FBI ερευνά 350+ μέλη του δικτύου 764 που στοχεύει παιδιά από 9 ετών σε Roblox και Discord. Πώς λειτουργεί το grooming, ποια σήματα να προσέξετε και τι κάνετε αν συμβεί.
Πρώτο κινητό: Πότε είναι έτοιμο το παιδί και πώς να το ρυθμίσετε
Πότε είναι έτοιμο το παιδί για το πρώτο κινητό; Ευρωπαϊκές έρευνες δείχνουν 11 - 12 ετών, αλλά η ωριμότητα μετράει περισσότερο. Πρακτικός οδηγός για ρυθμίσεις, κανόνες και το συμφωνητικό χρήσης.
Απάτη με ψεύτικα email της Apple για κλοπή δεδομένων
Χάκερς στέλνουν ψεύτικα emails μέσω των servers της Apple για να κλέψουν τραπεζικά στοιχεία. Πώς να αναγνωρίσετε την απάτη.
VPN: Τι κρύβουν πραγματικά και γιατί κάποια είναι επικίνδυνα
Τι κρύβει πραγματικά ένα VPN, τι δεν κρύβει. Γιατί τα δωρεάν VPN είναι συχνά πιο επικίνδυνα από το πρόβλημα που λύνουν.

Google AudioPaLM: AI που ακούει, μιλάει, και μεταφράζει, με εκπληκτική ακρίβεια

Αφήστε ένα Σχόλιο Ακύρωση Σχολιασμού

Διαβάστε επίσης

Το Instagram θα σας επιτρέπει να δημοσιεύετε μόνο για τους πιο στενούς σας φίλους

Το Google Bard παρέχει ακριβέστερα αποτελέσματα με τη νέα λειτουργία ακριβούς τοποθεσίας

Το ChatGPT απέκτησε μια συνήθεια που φρικάρει τους χρήστες